반응형

  책을 구입해서 받으면,  나는 항상 맨 처음부터 내용을  살짝 읽어 본다.   이해 못해도 읽어 보는 이유는 통계와 관련된 서적들은 각 장마다 어려운 부분이 있고,  쉬운 부분이 있기 때문이다.   즉  난이도 조정이 잘 안되기 때문이다. 

 

실전 시계열 분석

  이 서적은 소개 하면,  YES24에서 R을 치면 2위에 랭크되어 있다.  

실전 시계열 분석 yes24 순위

사람들이  시계열 분석에 관심이 많다는 것이다.    나의 블로그 

rdmkyg.blogspot.com

 

오늘도 데이터

오늘도 데이터는 매일 데이터를 분석 하는 방법을 R과 Python을 이용하여 공유하며, 분석 요청시 무료로 한다.

rdmkyg.blogspot.com

에서도 시계열 분석 다루는 내용을  가장 많이 조회 한다.    물론 기초 적인 부분도 많지만,  기초적인 부분은 이미 만들어진 블로그에서 선점을 하고 있기 때문에,   기초적인 부분의  조회수를 늘리기 위한 시간은 앞으로 많이 걸릴 듯하다. 

 

  시계열 같은 경우는 시간과 관계없이 다른 사람이 구글이 했을때, 상대적으로 많이 들어온다.   결국 R에서는 시계열 분석이 매우 유용하다는 것을 알 수가 있다. 

 

    위 서적의 난이도를 살펴보면 아래와 같다.   

첫번째,   기초적인 내용을 다루지 않는다.   즉 사전 지식이 많이 필요하다는 것이다.  

       필수 배경지식 :  R과 파이썬에 어느정도 익숙해야 함

두번째,   R에서 data.table 같은 패키지에 익숙해야 함 (data.table은 고성능 프레임)

세번째 , 통계학과 머신러닝과 관련해서는 다음 내용에 익숙해야함

  • 통계학 입문 :  분산, 상관관계, 확률분포
  • 머신러닝 : 군집화, 의사결정 트리
  • 신경만 : 신경망이 무엇이고 어떻게 학습하는가?

 

결코 쉬운 책이 아니다.  하지만,  시장에서는 많이 팔린다.   주 수요층이 대학원생 ,  졸업을 앞든 학부생이 대부분인 듯 하다.   결국,  졸업 논문이다.  졸업 레포트 작성하는데,  시계열 분석하는 데  많은 고생을 한다. 

 

 

 아래의 책의 난이도는 각 장 별로 다르므로,  우선 쉬운 부분 부터 먼저 하고 어려운것은 나중에 공부 하는 것 좋거나,

차라리 하지 않다가 어느정도 실력이 올라오면, 다시 보는 것이 좋을 수 있다. 

 

이건은 처음 부터 끝까지 개인 적인 의견이다.  

 

CAHPTER 1 시계열 개요와 역사   -->  이건 서술형으로 시계열 역사와 기원에 대해 다른다.   쉬운것  

 

CHAPTER 2 시계열 데이터의 발견 및 다루기   중급

 데이터 전처리는 쉬운 분야가 아니다.   데이터 전처리는 모델을 잘 알고 있을대,  할수 있는 분야이다.  이 부분은 집중적으로 공부 하면,  금방 지치게 된다.   즉,  뒤에서 다루는 모델에 대한 내용을 잘 알고 있을때,  집중적으로 들어가야 한다. 

 

CHAPTER 3 시계열의 탐색적 자료 분석 중급

   EDA 문제 인데, 이것 또한 모델을 잘 알고 있을때, 보는 것이다.  즉 이것도 집중적으로 공부하게 되면,  이것 또한 지치게 된다.   

 

CHAPTER 4 시계열 데이터의 시뮬레이션   상 

 실제로 데이터 시뮬레이션 해본 적이 없으면,  이 부분은 Skip 하는 것이 좋다.    진입 장벽이 매우 높다.   물론 이것을 할 줄 알면 뒷 부분은 쉽게 접근 할 수 있다. 

 

CHAPTER 5 시간데이터 저장 

   이것은 난이도에 대해서 이야기 하기 어렵다.   하지만 시스템 개발 구성 환경을 구현 할때,  좋다.  필요하면 보는 것이고 필요하지 않으면 보지 않아도 된다. 

 

CHAPTER 6 시계열 통계 모델  -->  여기부터 본론에 들어간다 시계열을 쉽게 설명 하려고  많은 노력을 하였다. 

 

CHAPTER 7 시계열의 상태 공간 모델  -->  노이스 필터링 좋다.   하지만,  하드웨어의 특성을 잘 알아야 한다.

 

CHAPTER 8 시계열 특징의 생성 및 선택 

 

CHAPTER 9 시계열을 위한 머신러닝  -->  머신러닝 기초를 알고 있어야 한다. 

 

CHAPTER 10  시계열을 위한 딥러닝 -->  딥러닝 기초지식이 있어야 한다. 

 

CHAPTER 11 오차 측정  -->  원래 모델에 대한 평가는 매우 어려운 문제이다.  

 

CHAPTER 12  시계열 모델의 학습과 배포에 대한 성능 고려 사항

 

CHAPTER 13 헬스케이 애플리 케이션 ->  CHAPTER 6을 이해 잘 하였으면 접근 하기 쉽다.  

 

CHAPTER 14 금융 어플리케이션  -->  CHAPTER 10 시계열을 위한 딥러닝 이해 잘 하였으면 접근 하기 쉽다. 

 

CHAPTER 15 정부를 위한 시계열 -->  데이터 모델 평가 수준이다. 상

 

CHAPTER 16 시계열 패키지 

 

CHAPTER 17 시계열 예측의 미래 전망

 

 

  난이도를 측정 하기 어려운 서적이다.  변역서 인 만큼  우리나라 정서와 조금 다르다.    여기에서 난이드 표시를 하지 않은 것은  내 판단으로써는 실무에서는 많이 사용하지 않는 것으로 판단 된 것이다.

 

 

   나름 정리도 잘 되있고,  체계적이라는 느낌이 든다.    시계열 분석을  향후  설비에 Sensor를 부착하여,  고장 예측을 하는 하려고 한다.    

 

   블로그에서는  쉬운 것 부터 하나씩 정리 하려고 한다.    

 

  주의 사항이 있다.   위의 서적을 참고 하여,  투자의 참고용으로 사용하면 안된다.    특히 주식은 사회 정치적인 문제가 뒤 섞여 있어,   이런 사항에 대한 변수가 적용되지 않은 시계열 모델은 부적합 하다. 

반응형

+ Recent posts