2장 2절 | 누적 그래프와 막대 그래프 사이의 간극
“사용자 수가 매년 증가하고 있습니다.”
“누적 다운로드 수 1,000만 돌파!”
“누적 가입자 수 200% 증가!”
이런 말, 어디서 많이 들어봤지?
앱 서비스 소개 페이지, 스타트업 보도자료, 투자 피칭, 유튜브 크리에이터 홍보 페이지…
누적 숫자는 늘 멋있어 보이고, 안정감 있어 보이고, 성공의 증거처럼 느껴진다.
근데 질문 하나 해보자.
“최근엔 얼마나 늘었나요?”
그게 누적의 함정이다.
‘지금’이 아니라, ‘지금까지’를 보여주는 숫자
즉, 과거가 현재를 덮고 있는 구조다.
누적 그래프는 절대 줄지 않는다 — 그래서 착각이 시작된다
누적(N累積) 그래프의 본질은 이거야:
- 사용자가 한 명만 추가돼도 그래프는 올라간다
- 신규 유입이 전혀 없어도, 탈퇴자가 표시되지 않으면 숫자는 그대로 유지된다
- 즉, 이탈/하락/위기가 ‘숫자’에 잘 드러나지 않는다
[예] 어떤 쇼핑몰이 2020년에 “누적 가입자 200만 명”이었고, 2024년엔 “누적 가입자 350만 명”이라고 한다.
겉보기엔 4년간 150만 명이 늘었으니 잘 나가는 것처럼 보이지?
하지만 숨겨진 정보는 이럴 수 있어:
- 그중 실제로 활동 중인 사용자는 50만 명
- 2년 전부터 월 신규 가입자는 계속 줄고 있음
- 유입보다 이탈 속도가 더 빠른 시점이 이미 지난 상태
그래프는 계속 올라가지만, 실상은 침체 중일 수 있다는 얘기다.
막대 그래프는 ‘지금의 변화’를 보여준다
반대로 막대 그래프(Bar Chart)는 다음과 같은 특성이 있어:
- 기간별, 항목별 비교에 적합
- 한눈에 증감, 편차, 격차를 보여줌
- 지금 무슨 일이 일어나고 있는지를 보여준다
예를 들어 같은 쇼핑몰의 월별 신규 가입자 수를 막대 그래프로 보면?
1월 | 22,000명 |
2월 | 19,000명 |
3월 | 12,000명 |
4월 | 7,500명 |
→ 이제 보이지?
실제론 사용자 수가 줄고 있다는 사실이 말없이 드러난다.
그런데 만약 저 수치를 누적 그래프로만 보여줬다면
그 하락세는 절대 눈에 띄지 않았을 거야.
[실제 사례] 유튜브 조회수 vs 영상별 조회수
많은 유튜버들이 "누적 조회수 1억 돌파!"라는 문구를 쓴다.
그 숫자, 굉장히 커 보인다.
하지만 세부 데이터를 보면 이럴 수도 있어:
- 과거 몇 개 영상이 대박을 친 후
- 최근 영상은 평균 1~2만 회 조회수
- 신규 구독자 수는 정체 중
- 심지어 시청 지속시간, 반응률, 좋아요 수도 하락세
하지만 전체 누적 조회수는 매일 조금씩 올라가고
‘1억 회’라는 수치는 지금의 상태를 가려버린다.
보고서에서 가장 많이 남용되는 형태: 누적 그래프로 불편한 진실을 덮기
회사 내부 리포트, 고객 보고서, 성과 발표에서도 자주 등장하는 패턴:
- 막대 그래프 → 부정적인 추세가 보임
- 누적 그래프 → 성장 흐름이 유지되는 것처럼 보임
- 그래서 회의 때는 누적 그래프만 보여주고,
→ 신규 수치는 슬쩍 말로 간단히 보고하고 생략한다
이건 의도적이지 않더라도,
‘보이고 싶은 것만 보여주는 시각화’의 대표적 형태야.
누적 vs 막대, 판단은 우리가 해야 한다
두 그래프 중 누가 더 정직하다고 말할 수는 없어.
각각 목적이 다르니까.
- 누적 그래프는 전체 규모, 장기적 성장, 성과의 총량을 보여주기에 적합
- 막대 그래프는 구간별 비교, 변화의 흐름, 하락 혹은 정체를 더 잘 드러냄
하지만 중요한 건 이거야:
누적 그래프만 보여줄 땐, “지금의 변화”가 가려질 수 있다는 걸 항상 의심해야 한다.
우리가 던져야 할 질문들
“누적 수치 말고, **신규는 어떤가요?”
“이번 분기만 보면 어떤가요?”
“실사용자는 몇 명이고, 최근 이탈률은 어떤가요?”
“누적 수치에 포함된 건 전부 활동 중인 유저인가요?”
이런 질문 하나로,
“그래프가 숨기고 있던 진실”을 꺼낼 수 있다.
그리고 그 질문을 잘하는 사람이 숫자를 똑바로 읽는 사람,
바로 데이터 리터러시를 가진 사람이다.
[목차] Part1. 데이터는 왜 우리를 속이는가
[1장. “이 숫자, 진짜일까?”]
- 1-1. 매출이 200% 늘었다는데, 진짜 대박일까? ( Data literacy - 기저 효과 )
- 1-2. 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까? ( Data literacy - 평균의 함정 )
- 1-3. 97%의 만족? 그 3%가 될 수 있는 나 ( Data literacy - 자기 선택 편향 )
- 1-4. 표본, 샘플, 응답률 — 누구 말을 믿을까? ( Data literacy - 비응답 편향 )
[2장. “그래프는 거짓말을 하지 않는다?”]
- 2-1. Y축만 깎았을 뿐인데 매출이 폭등했다 ( Data literacy - Y축 자르기 )
- 2-2. 누적 그래프와 막대 그래프 사이의 간극 ( Data literacy - 누적과 막대 그래프 )
- 2-3. 이중축 그래프, 도대체 뭘 비교하자는 거지? ( Data literacy - 상관관계와 인과관계 착각의 함정 )
- 2-4. 그래프는 ‘보여주는’ 게 아니라 ‘숨기는’ 도구일 때가 많다 ( Data literacy - 선택된 수치의 힘
[3장. “그래프는 거짓말을 하지 않는다?”]
- 3-1. 선택된 수치의 힘 ( Data literacy - 팩트가 많으면 진실에 가까운가? )
- 3-2. 데이터를 만든 사람의 입장 ( Data literacy - 데이터를 만든 사람의 입장 )
- 3-3. 중립을 가장한 편향 ( Data literacy - 중립을 가장한 편향 )
- 3-4. 팩트가 많으면 진실에 가까운가? ( Data literacy - 팩트가 많을수록 진실에 가까워질까? )
[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]
- 4-1. 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? ( Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? )
- 4-2. 내가 뭘 본 줄 아는 ‘그들’의 시선 ( Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 )
- 4-3. 퍼스널라이징의 함정: 더는 우연이 없는 세상 ( Data literacy - 퍼스널라이징의 함정 )
- 4-4. 내가 만든 데이터가 나를 규정하는 순간 ( Data literacy - 내가 만든 데이터가 나를 규정하는 순간 )
'Data, AI, Tech. & Career' 카테고리의 다른 글
Data literacy - 데이터를 만든 사람의 입장 (1) | 2025.04.11 |
---|---|
Data literacy - 숫자에 가려진 맥락 (0) | 2025.04.10 |
Data literacy - 선택된 수치의 힘 (0) | 2025.04.09 |
Data literacy - 상관관계와 인과관계 착각의 함정 (0) | 2025.04.09 |
Data literacy - Y축 자르기 (0) | 2025.04.06 |
Data literacy - 비응답 편향 (0) | 2025.04.05 |
Data literacy - 자기 선택 편향 (1) | 2025.04.05 |
Data literacy - 평균의 함정 (0) | 2025.04.05 |