3장 1절 | 선택적 수치, 보고 싶은 것만 보는 리포트
‘사실’을 말한다고 생각했다.
매출이 늘었고, 전환율이 높아졌고, 고객 이탈률은 개선됐다고 했다.
그래서 우리는 그 수치를 말하는 사람을 신뢰했다.
그런데 어느 순간부터 이상했다.
왜 다들 잘 됐다는데, 상황은 점점 불안하지?
숫자가 늘어날수록 믿음은 줄어들고,
그래프가 예뻐질수록 의심이 커졌다.
그 수치가 진짜일까? 아니면, 그냥 그렇게 보이도록 ‘선택된’ 건 아닐까?
숫자는 선택의 결과다 — 우리는 진실이 아니라 연출을 보고 있다
한 스타트업 마케팅팀에서 일했던 친구의 말이 아직도 기억난다.
“매달 성과 보고서 작성하는데, 항상 고민해.
뭘 보여줘야 ‘잘했다’는 인상을 줄 수 있을까?”
그래서 이런 일이 벌어진다.
- 유입은 줄었지만 전환율은 살짝 올랐을 때
→ “전환율 1.8% → 2.1%, 16% 성장” - 매출은 떨어졌지만 객단가가 올랐을 때
→ “프리미엄 고객이 늘고 있습니다!” - 사용자 수가 줄었지만 평균 체류시간이 길어졌을 때
→ “서비스 집중도가 높아졌습니다!”
각 문장은 틀리지 않았다.
하지만 ‘진짜 핵심’은 빠져 있다.
보고 싶은 것만 골라낸 숫자,
그게 우리가 매일 마주치는 수치의 본모습이다.
선택적 수치의 실전 사례
① 스타트업 IR 자료
한 스타트업이 시리즈A 투자 유치를 위해 만든 피칭 자료.
표지에 적힌 문장:
“누적 거래액 120억 원 돌파!”
“월간 활성 사용자(MAU) 5개월 연속 성장!”
“고객 리텐션율 업계 평균의 1.4배”
딱 봐도 잘 돼 보인다.
근데 실제 내용을 보면 이렇다.
- 누적 거래액 120억? → 4년 누적. 최근 6개월은 거의 정체
- MAU 증가? → 코로나 재유행으로 일시적 유입
- 리텐션율? → ‘2일차 재접속률’ 기준. 실제 7일차 유지율은 10% 미만
즉, 데이터는 진실을 말하고 있지만,
그 진실은 ‘보여주고 싶은 방식’으로 편집된 것에 불과하다.
② 사내 보고서
B2B 서비스 회사의 월간 실적 보고서 중 일부.
- “고객 문의 응답률 96%”
- “서비스 만족도 91점”
- “연속 사용 기업 비율 87%”
이 수치들을 보면 고객 만족도도 높고 서비스도 안정적인 것처럼 보인다.
하지만 숨은 맥락은 이렇다.
- 응답률 96%?
→ ‘응답만 했을 뿐’이고, 해결까지 걸린 평균 시간은 5일 - 만족도 91점?
→ 단 34개의 응답 중 5점 만점 중 4점 이상만 평균낸 수치 - 연속 사용 기업 87%?
→ 실제 결제는 하지 않은 상태로 그냥 계정만 유지된 기업 포함
숫자는 정직한 것 같지만, 해석은 매우 주관적이다.
왜 ‘좋아 보이는 숫자’만 골라서 보여주는 걸까?
이유는 간단하다. 그래야 살아남기 때문이다.
- 회사 내부 보고 → 상사가 원하는 방향으로 프레임을 맞춰야 한다
→ 아무리 ‘팩트’라도 부정적인 메시지는 위험하다
→ 그래서 ‘잘 보일 수 있는 포인트’를 집어넣는다 - 투자자 발표 → 유리한 지표만 강조해서 리스크를 덜어야 한다
→ 숫자는 무기지만, 동시에 방패기도 하다
→ 숫자가 많다고 설득되는 게 아니다. 숫자를 ‘어떻게 보여주느냐’가 핵심이다 - 뉴스 보도 → 클릭 유도, 감정 자극이 중요하다
→ “직장인 10명 중 7명 퇴사 고려”
→ 그 7명은 ‘고려한 적 있음’일 뿐.
→ ‘응답한 직장인’이 전체 직장인을 대표하지는 않음
숫자는 본질보다 감정을 설계하는 데 쓰이는 경우가 훨씬 많다.
어떻게 이런 선택적 수치에 휘둘리지 않을 수 있을까?
❶ 빠진 수치를 상상하라
“이탈률은 왜 안 나왔지?”
“유입은 좋은데 유지율은?”
“만족도 점수는 나왔는데 불만족 건수는?”
❷ 맥락을 묻는 습관을 들이자
“이건 어떤 조건에서 조사된 수치인가요?”
“표본은 누구였고, 설문은 어떻게 했죠?”
“이 지표의 기준은 뭔가요?”
❸ 인과 관계를 의심하자
“사용자 수가 늘었다 → 매출 증가?”
혹시 광고비 때문은 아닐까?
혹시 이벤트 효과일까?
❹ 지표의 단어를 분석하자
‘고객’이라는 말이 실제 유료 사용자인가?
‘재방문’은 로그인 기준인가, 페이지뷰 기준인가?
데이터 리터러시란, 숫자를 해석하는 힘이 아니라
‘숫자를 보는 시선’ 즉, 의심하는 힘이다
우리가 매일 마주하는 수치는 그 자체로 나쁘지 않다.
나쁜 건, 그 숫자가 유일한 진실인 것처럼 느껴지게 만드는 방식이다.
“수치를 보면 한 번 더 생각하자.
그 수치가 왜 선택됐는지.
그리고, 어떤 수치는 왜 빠졌는지를.”
이걸 할 수 있는 사람은
보고서에 속지 않고, 발표에 휘둘리지 않고, 진짜 중요한 걸 골라낸다.
[목차] Part1. 데이터는 왜 우리를 속이는가
[1장. “이 숫자, 진짜일까?”]
- 1-1. 매출이 200% 늘었다는데, 진짜 대박일까? ( Data literacy - 기저 효과 )
- 1-2. 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까? ( Data literacy - 평균의 함정 )
- 1-3. 97%의 만족? 그 3%가 될 수 있는 나 ( Data literacy - 자기 선택 편향 )
- 1-4. 표본, 샘플, 응답률 — 누구 말을 믿을까? ( Data literacy - 비응답 편향 )
[2장. “그래프는 거짓말을 하지 않는다?”]
- 2-1. Y축만 깎았을 뿐인데 매출이 폭등했다 ( Data literacy - Y축 자르기 )
- 2-2. 누적 그래프와 막대 그래프 사이의 간극 ( Data literacy - 누적과 막대 그래프 )
- 2-3. 이중축 그래프, 도대체 뭘 비교하자는 거지? ( Data literacy - 상관관계와 인과관계 착각의 함정 )
- 2-4. 그래프는 ‘보여주는’ 게 아니라 ‘숨기는’ 도구일 때가 많다 ( Data literacy - 선택된 수치의 힘
[3장. “그래프는 거짓말을 하지 않는다?”]
- 3-1. 선택된 수치의 힘 ( Data literacy - 팩트가 많으면 진실에 가까운가? )
- 3-2. 데이터를 만든 사람의 입장 ( Data literacy - 데이터를 만든 사람의 입장 )
- 3-3. 중립을 가장한 편향 ( Data literacy - 중립을 가장한 편향 )
- 3-4. 팩트가 많으면 진실에 가까운가? ( Data literacy - 팩트가 많을수록 진실에 가까워질까? )
[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]
- 4-1. 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? ( Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? )
- 4-2. 내가 뭘 본 줄 아는 ‘그들’의 시선 ( Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 )
- 4-3. 퍼스널라이징의 함정: 더는 우연이 없는 세상 ( Data literacy - 퍼스널라이징의 함정 )
- 4-4. 내가 만든 데이터가 나를 규정하는 순간 ( Data literacy - 내가 만든 데이터가 나를 규정하는 순간 )
'Data, AI, Tech. & Career' 카테고리의 다른 글
Data literacy - 팩트가 많을수록 진실에 가까워질까? (0) | 2025.04.13 |
---|---|
Data literacy - 중립을 가장한 편향 (0) | 2025.04.12 |
Data literacy - 데이터를 만든 사람의 입장 (1) | 2025.04.11 |
Data literacy - 숫자에 가려진 맥락 (0) | 2025.04.10 |
Data literacy - 상관관계와 인과관계 착각의 함정 (0) | 2025.04.09 |
Data literacy - 누적과 막대 그래프 (0) | 2025.04.08 |
Data literacy - Y축 자르기 (0) | 2025.04.06 |
Data literacy - 비응답 편향 (0) | 2025.04.05 |