정규 분포로 잘못 간파한 예에는 다음과 같은 것도 있다. 벨기에의 통계학자인 랑베프 케틀레(Lambert Quetelet, 1796~1874)는 프랑스군의 징병 검사 때 측정된 젊은 이들의 키에 대해 흥미로운 점이 있을을 알아 차렸다.
일부 젊은이의 거짓말이 기록에 남았다.
키의 분포를 보면 거의 정규 분포를 따르고 있어, 평균 전후의 키인 사람이 많고 극단적으로 키가 큰 사람과 반대로 키가 작은 사람은 적었다.
다만 157cm 전후 부분만은 정규 분포에서 벗어나 있었다. 157cm보다 약간 큰 사람이 적고 반대로 157cm보다 약간 작은 사람의 수가 극단적으로 많았던 것이다.
그 이유를 케틀레는 다음과 같이 추측했다. 당시 프랑스군은 키 157cm 이상인 젊은이를 징병했다. 그래서 157cm 보다 약간 큰 젊은이들 가운데 징병에서 빠지려는 사람들이 키를 작게 속인 것이다. 그 결과 정규 분포가 무너져 157cm를 웃도는 사람은 실제보다 적고, 157cm 이하인 사람은 실제보다 많이 기록된 것이다.
인간을 원자로 보는 '사회 물리학'
케틀레는 왜 이런 일에 관심을 가졌을까? 사실 케틀레는 인간 집단의 활동을 기록한 데이터를 분석함으로써 '사회의 법칙'을 이끌어 내기 위해 여러가지 데이터를 조사했다. 예컨데 물리학은 무수한 원자의 움직임으로 다양한 현상을 설명할 수 있다. 케틀레는 물리학에 따라 인간을 원자로 보고 사회의 움직임을 설명하는 이론을 세우려고 한 것이다.
그 대상은 범죄 발생건수, 사망률, 근력, 남녀의 출생비 등 여러 종류에 이르렀다. 당시 키에 관계없이 비만을 나타내는 수치로 케틀레가 제창한 BMI는 현재도 비만의 지표로 사용되고 있다.
케틀레가 제창한 '사회 물리학'은 큰 반향을 불러 일으켜 여러 가지 데이터를 다루는 통계학의 발전으로도 이어 졌다. 그래서 케틀레는 현재 '근대 통계학의 아버지'라고 불린다.
참고자료 : 뉴턴 하일라이트 통계와 확률의 원리
'통계 및 데이터 과학 이야기' 카테고리의 다른 글
생명보험은 '사망률'의 발견에서 비롯되었다. (0) | 2021.07.29 |
---|---|
승부 조작의 가능성을 통계학으로 찾는다. (0) | 2021.07.29 |
주식 고위험/고수익이란 주식의 변동은 정규분포를 따르지 않는다. (0) | 2021.07.29 |
주식 투자 위험을 표준편차 위험을 안다 (0) | 2021.07.28 |
주식의 주가의 변화율의 비교 (0) | 2021.07.28 |