본문 바로가기
Data, AI, Tech. & Career

Data literacy - 평균의 함정

by InfosGalaxy 2025. 4. 5.
반응형

평균의 함정

1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?

“대한민국 20대 평균 연봉은 3,050만 원”
“30대는 평균 4,850만 원”
“직장인 평균 퇴근 시간은 18시 40분”

이런 기사를 보면 기분이 이상해진다.
‘어… 나만 못 버는 건가? 나만 퇴근 늦나?’
뭔가 자꾸 뒤처지는 기분, 나만 예외인 것 같은 찜찜함.
그런데 진짜 평균이 ‘보통의 우리’를 말해주는 걸까?

 

평균은 늘 착해 보이지만, 현실은 그렇지 않다

 

‘평균’이라는 단어는 왠지 공정하고 과학적인 느낌이 있다.
하지만 현실에서는 '평균값'이 오히려 우리를 속이기도 한다.

예를 들어 이런 상황을 보자.

[예] 사람연봉

 

A 2,500만 원
B 2,700만 원
C 2,600만 원
D 3,000만 원
E 2억 원

위 다섯 사람의 평균 연봉은?
2,960만 원

 

갑자기 평균이 훅 올라가버렸다.
실제로는 대부분 2천만 원대인데, 단 한 명의 고액 연봉자 때문에 평균값이 현실을 왜곡한 거야.

이걸 ‘평균의 함정’이라고 해.
평균은 ‘중간’이나 ‘일반적’을 의미하지 않아.
특히 소득, 부동산 가격, 퇴근 시간, 수면 시간 같이 편차가 큰 데이터에서는 평균보다 ‘중앙값’이나 ‘분포’를 보는 게 훨씬 정확해.

 

중앙값을 보면 내 자리가 더 잘 보인다

중앙값(Median)은 뭔가를 줄 세웠을 때 딱 중간에 위치한 값이야.
위의 표에서 중앙값은 2,600만 원.
이게 훨씬 현실에 가깝지?

그래서 통계청에서도 최근엔 평균 소득보다 ‘중위소득’을 함께 공개해.
하지만 언론에서는 여전히 평균값을 제목으로 뽑지. 왜?
그게 더 있어 보이고, 낙관적으로 들리니까.

평균 연봉 5,000만 원 돌파!
보다
“중위 연봉 3,200만 원”
이 훨씬 현실적이지만, 덜 ‘자극적’이니까.

 

"평균"에 속지 않으려면?

  1. ‘평균값’이 나왔다면 반드시 ‘중앙값’도 찾아보자.
    평균이 크거나 작게 느껴질 땐 특히 더.
    평균 5,000만 원인데도 내가 그보다 훨씬 못 벌고 있다면, 그건 내가 뒤처진 게 아니라 평균이 왜곡된 것일 수도 있어.
  2. 데이터의 ‘분포’를 보자.
    전체 중 상위 10%, 하위 10%가 얼마나 다른가?
    ‘부자 몇 명’이 전체 수치를 끌어올리는 구조인가?
  3. “나만 이상한가?”라는 생각이 들면, 기준이 잘못된 걸 의심하자.
    실제로 대부분의 사람들은 평균보다 아래에 있어.
    왜냐면 평균은 상위 몇 명이 과도하게 끌어올리기 때문이야.
    이건 너의 문제가 아니라, 숫자의 문제야.

 

우리 삶에 ‘진짜 평균’은 없다

 

“평균 퇴근 시간은 6시 40분”
그럼 퇴근 시간 10시인 나는 뭘까? 이상한 사람? 불쌍한 사람?

아니야.
그 숫자는 전체를 요약하는 하나의 방식일 뿐,
너의 삶을 설명해주진 못해.
‘평균’은 수치지만, 우리는 사람이야.
서로 다른 배경, 환경, 선택들이 쌓인 결과를 한 줄로 정리할 수는 없어.

 

평균은 아무도 살지 않는 허상 속 세상이다.
— 마크 트웨인의 통찰처럼, 우리는 평균에 맞춰 살 필요도 없고, 평균에 좌절할 이유도 없다.

[목차] Part1. 데이터는 왜 우리를 속이는가

[1장. “이 숫자, 진짜일까?”]

[2장. “그래프는 거짓말을 하지 않는다?”]

[3장. “그래프는 거짓말을 하지 않는다?”]

[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]

반응형