한국인은 몇세에 사망할까?
아래 그래프는 한국인 사망률 그래프이다. 사망률은 어떤 연령의 사람들 집단 가운데 그 해에 사망하는 사람의 비율을 말한다. 예컨데 2019년 30세 사람들의 사망률은 30~34세 사이에 사망한 사람의 수를 30세 시점의 생존지수를 나누면 0.283%가 된다.
2019년 사망률은 갓 태어날 무렵에 높지만, 7세 ~ 10세 무렵까지는 계속 낮아진다. 그 후에는 나이를 먹음에 따라 계속 높아 진다.
위의 왼쪽 그래프를 보면 log를 취한 것이다. log를 취하면, 작은 숫자들을 볼수 있다. 오른쪽 그래프는 원데이터 가지고 그린것이다. 작은 숫자는 log를 취하여야만, 패턴을 볼 수 있다.
현대의 보험산업은
막대한 데이터와 통계학으로 뒷받침 되는 분야 중 하나이다. 원시적인 보험은 통계학이 탄생하기 전부터 존재 했다. 만약 큰 질별이 걸리거나 사고를 당하면 큰돈이 필요해진다. 그리고 만약 젊어서 죽으면 남은 가족의 생활이 곤란해진다. 이러한 생각에서 여러 사람이 돈을 서로 내어 적립해 두고, 불행을 당한 사람이나 그 가족에게 모인 돈을 지불한다는 약속이 세계각지에서 이루어 졌다.
그러나 메커니즘에는 문제가 있었다. 만약 약속한 구성원 중에 젊은 사람과 장년 남성이 섞여 있는 경우, 장년 남성이 질별에 걸리거나 사망하는 경우가 많다는 사실이 경험적으로 밝혀 졌다. 그런데, 서로 내는 돈이 전원이 같은 액수라면 불공평하다. 이런 경우에 돈을 얼마씩 내면 평등해지는지를 알지 못했던 것이다. 누구라도 납득할 만한 지불액 계산 방법이 없었으므로 현재와 같은 보험산업은 존재 하지 않았다.
현대의 보험으로 연결되는 발견이 나오기까지는 17세기까지 기다리지 않으면 안되었다. 1662년 영국의 상인 존그랜트가 런던의 사망자수를 정리해 발표함으로써, 사람들의 일생을 큰 집단으로 보면 여러가지 규칙성이 있음을 처음으로 보여 주었다.
그 후 핼리 혜성으로 이름을 남김 영국의 과학자 애드먼드 핼리가 1693년에 연령별 사망률 일람표인 '생명표'를 정리해 발표 했다. 그것에 의해 사람이 나이를 먹음에 따라 사망자 수가 어느 정도 늘어나는지를 추정할 수 있음을 밝혀 냈다. 또 '어떤 연령의 사람들이 1년 이내에 사망하는 비율(사망률)'을 연령별로 큰 집단으로 보았을 때 매년 거의 일정하다는 점이 널리 알려지게 되었다.
통계 데이터에 근거한 보험은 핼리의 성과에서 비롯된 것이다.
참고자료 : 뉴턴 하일라이트 통계와 확률의 원리
'통계 및 데이터 과학 이야기' 카테고리의 다른 글
산업에서의 데이터 과학 (0) | 2021.08.03 |
---|---|
시계열 개요 및 역사 [의학] (0) | 2021.07.30 |
승부 조작의 가능성을 통계학으로 찾는다. (0) | 2021.07.29 |
정규분포의 왜곡에 나타난 젊은이들의 거짓말 (0) | 2021.07.29 |
주식 고위험/고수익이란 주식의 변동은 정규분포를 따르지 않는다. (0) | 2021.07.29 |