반응형

  산업에서는 데이터 과학자가 하는 일이 어떤 모습일까?  그것은 직위 수준에 달려 있기도 하고 인터넷/온라인 산업인지에 달려 있기도 하다. 

 

데이터 과학자의 역할이 IT산업에 국한될 필요는 없다 하지만 그곳에서  그 용어가 유래하였기 때문에 거기에서 그 용어가 어떤 의미인지 이야기해보자. 

 

최고위직의 데이터과학자는 회사의 데이터 전략을 세워야 한다.  거기에는 다음과 같은 다양한 역할이 포함된다.  데이터를 수집하고 기록하기 위한 공학과 인프라부터 프라이버시 문제 까지 어떤 데이터가 사용자 대면이고, 의사결정을 위한 데이터 어떻게 사용될 것인지,  그것이 어떻게 제품에 반영될 것인지에 이르는 모든 사항을 기획해야 한다.  그는 공학자, 과학자, 분석가로 구성된 팀을 관리해야 하고, 최고경영자 (CEO), 최고기술책임자(CTO), 제품 책임자 등 기업 내 다양한 리더들과 커뮤니케이션해야 한다.  또한 혁신적 솔루션의 특허를 신청하고, 연구 목표를 결정해야 한다. 

 

좀 더 일반적으로,  데이터 과학자는 데이터에서 의미를 뽑아내고 해석하는 방법을 아는 사람이다.  그러기 위해서는 인본주의적이어야 하고, 통계학과 기계학습의 도구와 방법 모두 알아야 한다그는 데이터를 수집하고 정제하고 변환하는 과정에 많은 시간을 보낸다.  데이터는 항상 깔끔하지 않기 때문다. 이 과정은 집념, 통계학, 소프트웨어공학 스킬을 요구한다.  이 스킬들은 또한 데이터에 내재된 편의(bias)를 이해하고 코드에서 생성된 결과를 디버깅하는데 필수적이다. 

 

일단 데이터를 다 매만지고 나면, 핵심 작업은 시각화와 데이터 감각을 포함한 탐색적 데이터 분석이다.  데이터과학자는 패턴을 발견하고, 모형을 만들며, 알고리즘을 고안한다.  이것은 제품 개선을 위한 프로토타입(prototype)으로 활용되며,  제품 용례, 제품의 전반적인 건강성을 이해하는데 도움을 준다.  또한 그는 실험을 설계하고 데이터 주도 의사 결정을 하는 데 있어 중요한 역할을 수행한다.  그는 명료한 해석과 시각화를 통해서 팀원, 공학자, 또는 리더와 커뮤니케이션해야 한다.  그렇게 함으로써 데이터 자체에 관여하지 않는 동료들도 데이터에 담긴 뜻을 이해할 수 있을 것이다. 

 

   위의 내용은 상당히 현실적이다.  컬럼비아 대학교 교제인데,   내용이 상당히 현실 적이다.  마치 현업에서 업무를 한 사람과 같이 이야기 하고 있다.   우리나라에서는 프라이버시 문제는  노조 인권과 관련이 있고,  산업에서도 인문학이 중요하다는 이야기 하였다.   그리고  데이터가 수집하고 정제하는 과정에 시간이 많이 걸린다는 것 또한 굉장히 현실 적이다.     탐색적 분석은 다른 사람들과 공유하는데, 중요한 가치를 제공하고,  의사 결정하는데 도움을 준다. 

 

#출처 : Doing Data Science 한빛미디어

 

반응형

+ Recent posts