이야기를 시작 하며
나는 원래 대한민국 대기업에서 이야기하는 공무(工務: Maintenance) 부서에 20년 이상 종사한 사람이다. 직접적으로 정비 업무를 하지 않았만, 간접적으로 공무기획, 운영를 매우 오랬동안 하였다. 과거 5년 전만 해도, 특히 중공업 분야에서는 신뢰성 공학에 대한 인식이 없었다. 주로 현장 위주의 TBM(Total Productive Maintenace) 전원 참여 생산보전으로 진행 되어 있고 현재 진행 형이다.
특히나, 비정형적인 공정을 가지고 있는 조선산업의 경우는 특히 더욱 그러했다. 그리고 나는 입사 후 필드에서 직접적으로 관리하는 필드 관리자가 아니였기 때문에, 특히나 더욱 모르고 있었다.
하지만, 3년 전 부터, 나는 공무기획/운영 관리자에서 벗어나서 필드관리자로 업무를 바꾸었다. 그 이후 실무를 보기 시작 하였고, 조선 공정에서도 적게 나마, 라인 공정이 있다는 것을 알았다. 라인 공정이라고 하지만, 라인에 내려오는 블럭(Block)은 비정형 블럭 이였다. 그 만큼 분석에 있어서 쉽지 않을 뿐 아니라, 다양한 케이스를 적용하여 만한다.
아래의 서적과 사내 강의 내용을 주로 인용하여 기록 하겠다.
- 기계계열 신뢰성 공학 기초 [GS 인터비전]
- R for Data Science , [Hadley Wickham]
- 쉽게 배우는 R 텍스트 마이닝 [이지 퍼블리싱]
- Applied Predictive Modeling [에이콘]
- 실무 위주의 R [위키독스]
- 사내 강의 내용
- 프로젝트 하면서 주로 다룬 경험 적내용
최근에 있어서 회사에 큰 변화가 있었다. 사내에서는 미래 인재 양성 프로젝트가 시작 되었다. 나도 그 프로젝트에 참여 되었고, 교육기관(카이스트)로 부터 교육도 받았다. 하지만, 교육기관으로 부터 받은 교육은 주로 딥러닝 계열의 파이썬 이다.
물론 그때, 머신러닝, 딥러닝을 전체 아우르는 교육을 약 6개월에 걸쳐서 배웠다. 물론 그때 배운 이미지 프로세싱을 통해 사내에서 큰 혁신을 이룬 것도 있다. 하지만, 여기에는 그런 내용을 기록 하지는 않는다.
아래의 블로그를 통해서 기록한다.
내용에 대한 구성
1. 용어정리
- 신뢰성 공학과 관련된 용여정리
- 통계와 확률 변수에 대한 용정리
2. 통계 패키지 R 설치
- Windows R 설치
- Ubuntu 환경에서의 R 설치
3. 통계 지식
-통계와 확률 및 확률 분포
- 표분 분포와 관련된 주요 확률 분포와 추정과 검정
- 회귀 분석
- 분산 분석
- 극치 분포 (지수 분포, 와이블 분포)
4. 데이터 Manipulation
- dplyr
- stringr
- ggplot2
실무에서 가장 많이 쓰였던 사례를 중심으로 하겠다. 그리고, 모든 사항에 대한 이론과 설명을 넣었고, 그것에 대한 응용문제를 넣어서 다른 사람들이 잘 알 수 있게 정리 하겠다.