2장 4절 | 그래프는 보여주는 게 아니라 숨기는 도구일 때가 많다
회사 회의 시간, 팀장이 자료를 띄운다.
PPT 8페이지에 딱 있는 그래프 하나.
막대그래프 몇 개, 깔끔한 타이틀, 아래에 작은 글씨로 “월간 사용자 수 추이”라고 적혀 있다.
선이 올라가고, 막대가 점점 길어진다.
팀장이 말한다.
“보시다시피, 꾸준히 우상향입니다. 좋은 흐름이에요.”
그리고 발표는 그대로 넘어간다.
그 순간, 우리는 저 그래프를 보고 자동으로 ‘아, 잘 되고 있구나’라고 생각한다.
그런데, 혹시 그 안에 ‘지금 상황의 진짜 모습’은 빠져 있는 건 아닐까?
그래프는 ‘사실’을 보여주는 것처럼 보인다.
하지만 실제로는 ‘선택’된 일부만 보여준다.**
데이터는 수많은 수치와 지표, 범주, 시점, 조건으로 구성돼 있다.
그 중에서 어떤 걸 ‘그래프로 만든다’는 건,
이미 한 번의 필터링, 편집, 해석이 들어갔다는 의미다.
보고서에 올라온 그래프가
- 시간축이 특정 구간만 잡혀 있다면?
- 한두 지표만 강조되고 나머진 빠져 있다면?
- 축의 범위가 이상하게 설정되어 있다면?
우리가 보는 건 진실이 아니라 ‘기획된 장면’일 수 있다.
실제 사례: 한 스타트업의 월간 활동 사용자 수 그래프
2023년 말, 한 앱 기반 스타트업이 투자 유치를 앞두고 내부 성과 보고서를 만들었다.
그 보고서엔 이런 그래프가 들어 있었다:
- X축: 1월부터 12월까지
- Y축: 월간 사용자 수
- 결과: 선형 그래프가 꾸준히 상승하는 형태
이걸 보면 단순한 결론이 나온다.
→ “이 앱은 꾸준히 잘 성장하고 있구나.”
그런데 투자자 미팅에서 이런 질문이 나왔다.
“신규 사용자 수는 줄어드는 것 같은데,
실제로는 재방문율 덕분에 올라간 거 아닌가요?”
이후 밝혀진 사실은,
- 신규 유입은 8월 이후 계속 감소 중
- MAU가 증가한 건, 푸시 알림을 강제 발송한 뒤의 반짝 방문 덕분
- 그나마도 다음 달 이탈률이 60% 이상
즉, 그래프에서 ‘사용자가 늘고 있다’고 보여줬지만,
사실은 ‘남아 있는 사용자도 점점 줄고 있었다’.
숨겨지는 건 ‘숫자’가 아니라 ‘의도된 침묵’이다
그래프는 숫자를 숨기지 않는다.
그래서 더 위험하다.
- 우리가 의심하지 않게 만들기 때문이다.
- 오히려 신뢰감을 준다.
- 숫자가 말하는 것처럼 보이지만, 실제로는 ‘말하지 않는 게 훨씬 많다’.
[예] 이런 그래프를 보자.
[그래프 제목] "구매 전환율 추이"
- 1월: 2.1%
- 2월: 2.4%
- 3월: 2.5%
- 4월: 2.7%
- 5월: 2.8%
그림만 보면 "오, 꾸준히 전환율 올라가네!"
근데 빠져 있는 게 있다.
- 전환을 유도하기 위해 광고비는 두 배로 늘었다는 점
- 객단가는 떨어지고 있다는 점
- 사용자당 매출은 되려 낮아지고 있다는 점
‘전환율’이라는 하나의 지표만 뽑아 시각화하면,
그 이면에는 "우리의 사업은 지금 건강한가"에 대한 부분은 완전히 가려진다.
뉴스에서도 숨기는 그래프는 흔하다
뉴스 인포그래픽 중 많은 그래프가 ‘전달’보다 ‘감정 자극’을 위해 만들어진다.
예를 들어, 청년 실업률 관련 뉴스에서 이런 그래프가 있다.
- X축: 2019 ~ 2023
- Y축: 실업률(%)
- 시각적 구성: 붉은색 선, 점점 가팔라지는 기울기
하지만 확인해보면?
- 실업률 증가는 0.3%포인트 수준
- 오히려 취업자 수는 늘었지만 ‘구직 포기자’가 포함된 계산 방식
- 해당 지표만 띄워서 청년층 위기의 ‘정서’를 강조
숫자는 틀리지 않았지만, ‘뭐가 빠졌는지’를 모르면
오해와 감정의 파도가 먼저 몰려온다.
그래프는 ‘조명’이다.
무대를 어떻게 비추느냐에 따라, 주인공이 달라진다.
그래프를 만든 사람은 전체 중에서 어느 부분에 조명을 비출지를 선택한다.
- 증가율을 보여줄지, 절대 수치를 보여줄지
- 현재 수치를 강조할지, 변화 추이를 강조할지
- 어떤 범위를 자를지, 어떤 축을 조정할지
모든 건 연출이다.
우리는 조명이 비춘 곳만 보고 판단해서는 안 된다.
우리가 던져야 할 질문들
이 그래프는 왜 지금, 이 맥락에서 등장했을까?
이 그래프는 무엇을 말하고, 무엇은 말하지 않는가?
빠져 있는 지표는? (ex. 이탈률, 마케팅비, 분산, 표준편차)
의도적으로 감춘 건 없을까?
이 그래프는 ‘사실’을 보여주는가, 아니면 ‘분위기’를 조성하는가?
데이터 리터러시는 '숫자 바깥'을 읽는 능력이다
그래프는 숫자다.
그렇지만 그래프는 숫자를 통해 무언가를 말하려는 ‘사람의 의도’가 담긴다.
“이 그래프를 왜 여기에 넣었지?”
“이건 어떤 결론으로 연결되길 원하고 있지?”
“보이지 않는 데이터는 무엇이지?”
이 질문들을 스스로 던지는 사람만이
그래프의 말에 휘둘리지 않고,
자신만의 결론을 가질 수 있다.
“숫자는 거짓말하지 않지만, 숫자를 고른 사람은 얼마든지 의도를 담는다.”
보여주는 것보다, 보여주지 않는 것을 의심할 수 있을 때,
우리는 드디어 그래프를 ‘보는 사람’이 아니라 ‘읽는 사람’이 되는 것이다.
[목차] Part1. 데이터는 왜 우리를 속이는가
[1장. “이 숫자, 진짜일까?”]
- 1-1. 매출이 200% 늘었다는데, 진짜 대박일까? ( Data literacy - 기저 효과 )
- 1-2. 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까? ( Data literacy - 평균의 함정 )
- 1-3. 97%의 만족? 그 3%가 될 수 있는 나 ( Data literacy - 자기 선택 편향 )
- 1-4. 표본, 샘플, 응답률 — 누구 말을 믿을까? ( Data literacy - 비응답 편향 )
[2장. “그래프는 거짓말을 하지 않는다?”]
- 2-1. Y축만 깎았을 뿐인데 매출이 폭등했다 ( Data literacy - Y축 자르기 )
- 2-2. 누적 그래프와 막대 그래프 사이의 간극 ( Data literacy - 누적과 막대 그래프 )
- 2-3. 이중축 그래프, 도대체 뭘 비교하자는 거지? ( Data literacy - 상관관계와 인과관계 착각의 함정 )
- 2-4. 그래프는 ‘보여주는’ 게 아니라 ‘숨기는’ 도구일 때가 많다 ( Data literacy - 선택된 수치의 힘
[3장. “그래프는 거짓말을 하지 않는다?”]
- 3-1. 선택된 수치의 힘 ( Data literacy - 팩트가 많으면 진실에 가까운가? )
- 3-2. 데이터를 만든 사람의 입장 ( Data literacy - 데이터를 만든 사람의 입장 )
- 3-3. 중립을 가장한 편향 ( Data literacy - 중립을 가장한 편향 )
- 3-4. 팩트가 많으면 진실에 가까운가? ( Data literacy - 팩트가 많을수록 진실에 가까워질까? )
[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]
- 4-1. 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? ( Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? )
- 4-2. 내가 뭘 본 줄 아는 ‘그들’의 시선 ( Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 )
- 4-3. 퍼스널라이징의 함정: 더는 우연이 없는 세상 ( Data literacy - 퍼스널라이징의 함정 )
- 4-4. 내가 만든 데이터가 나를 규정하는 순간 ( Data literacy - 내가 만든 데이터가 나를 규정하는 순간 )
'Data, AI, Tech. & Career' 카테고리의 다른 글
Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? (0) | 2025.04.14 |
---|---|
Data literacy - 팩트가 많을수록 진실에 가까워질까? (0) | 2025.04.13 |
Data literacy - 중립을 가장한 편향 (0) | 2025.04.12 |
Data literacy - 데이터를 만든 사람의 입장 (1) | 2025.04.11 |
Data literacy - 선택된 수치의 힘 (0) | 2025.04.09 |
Data literacy - 상관관계와 인과관계 착각의 함정 (0) | 2025.04.09 |
Data literacy - 누적과 막대 그래프 (0) | 2025.04.08 |
Data literacy - Y축 자르기 (0) | 2025.04.06 |