엔리코 페르미가 트리니티 핵실험에서
그 위력의 근사치를 나뭇잎 한장을 떨어뜨리는
것 만으로 15분만에 계산해 내었다는 데에서
유명해진 추정방법이다.
데이터 분야의 분석에서는 모든 자료를 전수로
얻을 수 없기 때문에 이런 추정이 필수적인데
이걸 연습하기 위한 좋은 서적이
"페르미 추정 두뇌훈련법"으로 알려져 있는 듯.
도쿄대학의 스터디에서 출간된 책이라는 것
같은데.. 이전에 습득해 왔던 MECE적인 사고의
기틀 하에 전개되어서 더욱 체계적인 느낌이다.
"9호선의 한달 이용객 수는 몇명일까?"
라는 질문을 스스로에게 던져보았다.
(지금은 강남역으로 가는 지하철 9호선)
질문을 바꾸어 설정할 필요가 있었다.
내가 알 수 있는 정보로.
"지하철 9호선이 하루에 몇차나 운행되나?"
지하철 운행을 결정짓는 운영부에서는
분명 이용객의 데이터를 보고있었을 것이고
그에 맞추어 차량 공급을 했을 것이라 추정.
세어 보니 대략 430차량이 하루에 운행된다.
그리고는 차량 한대에 앉아있는 사람들과 서있는 사람들의 수를 세어 본다.
앉을 수 있는 자리는 50석정도인데 아침 저녁 퇴근시간의 혼잡도까지 고려해서 평균 탑승 추정치를 그의 2배인 100사람으로 본다.
9호선은 총 차량은 4량 (왜이리 적지?)
그러면 평균 400명의 사람이 이용한다고 본다.
430 * 400 * 30(한달) = 510만명
한달 이용객은 대략 510만명 정도로
근사치 추정 가능하다.
실제 결과는 어땠을까?
2009년도 개통 당시의 이용객이 네이버검색으로 보니까 첫 한달 537만여명이었다고 한다.
그 때와 노선도가 많이 바뀌었음을 감안하더라도, 실제 그들이 예상했던 수요만큼 딱 초기에
사람들이 타고 다녔던 것 같다.
2015년 지금은 약 800~1000만명이 이용하고 있는데, 혼잡도라는 기준으로 보았을 때
250%의 혼잡도를 9호선은 자랑하고 있다고 한다.
(사람들이 좌석에 다 앉아있는 경우가 33%, 100%는 손잡이를 다 잡고있고 문옆에 사람들이 다 서있는 경우)
딱, 그들이 원하는 예상 수요인 100%가 500만명대 인걸 보면, 추정은 나름 성공적이었다고 결론!
반응형
'모조리 Data' 카테고리의 다른 글
The best books for every data scientist (0) | 2015.06.23 |
---|---|
6.10 데이터의 단면 (0) | 2015.06.10 |
빅데이터, 파이썬에게 길을 묻다. (0) | 2015.06.02 |
21세기 통계학을 배우는 방법 (0) | 2015.06.01 |
[Weekly BIZ] 직관은 실패해도 빅데이터는 성공하더라 (0) | 2015.06.01 |