Data literacy - 평균의 함정

1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?

“대한민국 20대 평균 연봉은 3,050만 원”
“30대는 평균 4,850만 원”
“직장인 평균 퇴근 시간은 18시 40분”

이런 기사를 보면 기분이 이상해진다.
‘어… 나만 못 버는 건가? 나만 퇴근 늦나?’
뭔가 자꾸 뒤처지는 기분, 나만 예외인 것 같은 찜찜함.
그런데 진짜 평균이 ‘보통의 우리’를 말해주는 걸까?

평균은 늘 착해 보이지만, 현실은 그렇지 않다

‘평균’이라는 단어는 왠지 공정하고 과학적인 느낌이 있다.
하지만 현실에서는 '평균값'이 오히려 우리를 속이기도 한다.

예를 들어 이런 상황을 보자.

[예] 사람연봉

A	2,500만 원
B	2,700만 원
C	2,600만 원
D	3,000만 원
E	2억 원

위 다섯 사람의 평균 연봉은?
→ 2,960만 원

갑자기 평균이 훅 올라가버렸다.
실제로는 대부분 2천만 원대인데, 단 한 명의 고액 연봉자 때문에 평균값이 현실을 왜곡한 거야.

이걸 ‘평균의 함정’이라고 해.
평균은 ‘중간’이나 ‘일반적’을 의미하지 않아.
특히 소득, 부동산 가격, 퇴근 시간, 수면 시간 같이 편차가 큰 데이터에서는 평균보다 ‘중앙값’이나 ‘분포’를 보는 게 훨씬 정확해.

중앙값을 보면 내 자리가 더 잘 보인다

중앙값(Median)은 뭔가를 줄 세웠을 때 딱 중간에 위치한 값이야.
위의 표에서 중앙값은 2,600만 원.
이게 훨씬 현실에 가깝지?

그래서 통계청에서도 최근엔 평균 소득보다 ‘중위소득’을 함께 공개해.
하지만 언론에서는 여전히 평균값을 제목으로 뽑지. 왜?
그게 더 있어 보이고, 낙관적으로 들리니까.

“평균 연봉 5,000만 원 돌파!”
보다
“중위 연봉 3,200만 원”
이 훨씬 현실적이지만, 덜 ‘자극적’이니까.

"평균"에 속지 않으려면?

‘평균값’이 나왔다면 반드시 ‘중앙값’도 찾아보자.
평균이 크거나 작게 느껴질 땐 특히 더.
평균 5,000만 원인데도 내가 그보다 훨씬 못 벌고 있다면, 그건 내가 뒤처진 게 아니라 평균이 왜곡된 것일 수도 있어.
데이터의 ‘분포’를 보자.
전체 중 상위 10%, 하위 10%가 얼마나 다른가?
‘부자 몇 명’이 전체 수치를 끌어올리는 구조인가?
“나만 이상한가?”라는 생각이 들면, 기준이 잘못된 걸 의심하자.
실제로 대부분의 사람들은 평균보다 아래에 있어.
왜냐면 평균은 상위 몇 명이 과도하게 끌어올리기 때문이야.
이건 너의 문제가 아니라, 숫자의 문제야.

우리 삶에 ‘진짜 평균’은 없다

“평균 퇴근 시간은 6시 40분”
그럼 퇴근 시간 10시인 나는 뭘까? 이상한 사람? 불쌍한 사람?

아니야.
그 숫자는 전체를 요약하는 하나의 방식일 뿐,
너의 삶을 설명해주진 못해.
‘평균’은 수치지만, 우리는 사람이야.
서로 다른 배경, 환경, 선택들이 쌓인 결과를 한 줄로 정리할 수는 없어.

“평균은 아무도 살지 않는 허상 속 세상이다.”
— 마크 트웨인의 통찰처럼, 우리는 평균에 맞춰 살 필요도 없고, 평균에 좌절할 이유도 없다.

[목차] Part1. 데이터는 왜 우리를 속이는가

[1장. “이 숫자, 진짜일까?”]

1-1. 매출이 200% 늘었다는데, 진짜 대박일까? ( Data literacy - 기저 효과 )
1-2. 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까? ( Data literacy - 평균의 함정 )
1-3. 97%의 만족? 그 3%가 될 수 있는 나 ( Data literacy - 자기 선택 편향 )
1-4. 표본, 샘플, 응답률 — 누구 말을 믿을까? ( Data literacy - 비응답 편향 )

[2장. “그래프는 거짓말을 하지 않는다?”]

2-1. Y축만 깎았을 뿐인데 매출이 폭등했다 ( Data literacy - Y축 자르기 )
2-2. 누적 그래프와 막대 그래프 사이의 간극 ( Data literacy - 누적과 막대 그래프 )
2-3. 이중축 그래프, 도대체 뭘 비교하자는 거지? ( Data literacy - 상관관계와 인과관계 착각의 함정 )
2-4. 그래프는 ‘보여주는’ 게 아니라 ‘숨기는’ 도구일 때가 많다 ( Data literacy - 선택된 수치의 힘

[3장. “그래프는 거짓말을 하지 않는다?”]

3-1. 선택된 수치의 힘 ( Data literacy - 팩트가 많으면 진실에 가까운가? )
3-2. 데이터를 만든 사람의 입장 ( Data literacy - 데이터를 만든 사람의 입장 )
3-3. 중립을 가장한 편향 ( Data literacy - 중립을 가장한 편향 )
3-4. 팩트가 많으면 진실에 가까운가? ( Data literacy - 팩트가 많을수록 진실에 가까워질까? )

[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]

4-1. 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? ( Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? )
4-2. 내가 뭘 본 줄 아는 ‘그들’의 시선 ( Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 )
4-3. 퍼스널라이징의 함정: 더는 우연이 없는 세상 ( Data literacy - 퍼스널라이징의 함정 )
4-4. 내가 만든 데이터가 나를 규정하는 순간 ( Data literacy - 내가 만든 데이터가 나를 규정하는 순간 )

저작자표시 비영리 변경금지 (새창열림)

'Data, AI, Tech. & Career' 카테고리의 다른 글

Data literacy - 누적과 막대 그래프 (0)	2025.04.08
Data literacy - Y축 자르기 (0)	2025.04.06
Data literacy - 비응답 편향 (0)	2025.04.05
Data literacy - 자기 선택 편향 (1)	2025.04.05
Data literacy - 기저 효과 (1)	2025.04.05
Data Sense literacy - prologue (1)	2025.04.04
제조업체의 AI 도입 전략과 실행 (2)	2025.03.28
AI 활용의 현주소와 접근 방식 (1)	2025.03.18

Data, AI, Career & Tech.

Data literacy - 평균의 함정

1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?

평균은 늘 착해 보이지만, 현실은 그렇지 않다

중앙값을 보면 내 자리가 더 잘 보인다

"평균"에 속지 않으려면?

우리 삶에 ‘진짜 평균’은 없다

[목차] Part1. 데이터는 왜 우리를 속이는가

'Data, AI, Tech. & Career' 카테고리의 다른 글

티스토리툴바

Data literacy - 평균의 함정

1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?

평균은 늘 착해 보이지만, 현실은 그렇지 않다

중앙값을 보면 내 자리가 더 잘 보인다

"평균"에 속지 않으려면?

우리 삶에 ‘진짜 평균’은 없다

[목차] Part1. 데이터는 왜 우리를 속이는가

'Data, AI, Tech. & Career' 카테고리의 다른 글

관련글

티스토리툴바