본문 바로가기
반응형

Data, AI, Tech. & Career71

Data literacy - 선택된 수치의 힘 3장 1절 | 선택적 수치, 보고 싶은 것만 보는 리포트‘사실’을 말한다고 생각했다.매출이 늘었고, 전환율이 높아졌고, 고객 이탈률은 개선됐다고 했다.그래서 우리는 그 수치를 말하는 사람을 신뢰했다.그런데 어느 순간부터 이상했다.왜 다들 잘 됐다는데, 상황은 점점 불안하지?숫자가 늘어날수록 믿음은 줄어들고,그래프가 예뻐질수록 의심이 커졌다.그 수치가 진짜일까? 아니면, 그냥 그렇게 보이도록 ‘선택된’ 건 아닐까? 숫자는 선택의 결과다 — 우리는 진실이 아니라 연출을 보고 있다한 스타트업 마케팅팀에서 일했던 친구의 말이 아직도 기억난다.“매달 성과 보고서 작성하는데, 항상 고민해.뭘 보여줘야 ‘잘했다’는 인상을 줄 수 있을까?” 그래서 이런 일이 벌어진다.유입은 줄었지만 전환율은 살짝 올랐을 때→ “전환율.. 2025. 4. 9.
Data literacy - 상관관계와 인과관계 착각의 함정 2장 3절 | 이중축 그래프, 도대체 뭘 비교하자는 거지?보고서에서 이런 그래프 본 적 있을 거야.왼쪽 Y축: 월 매출 (단위: 억 원)오른쪽 Y축: 신규 가입자 수 (단위: 명)X축: 월별 시간파란 막대: 매출빨간 선: 가입자 수 한눈에 보면 뭔가 있어 보인다.“오, 가입자가 늘면서 매출도 같이 오르네?”“가입자 수가 줄자 매출도 떨어졌네?”이런 식으로 말이지.그런데… 이건 정말 인과관계일까?아니면 그냥 같은 시기에 우연히 움직였을 뿐일까? 이중축 그래프, 이름부터 조심해야 할 이유이중축 그래프(Dual-Axis Chart)는 말 그대로하나의 차트에 두 개의 서로 다른 Y축을 겹쳐서 보여주는 방식이야.왼쪽 축은 A라는 지표,오른쪽 축은 B라는 지표.그리고 그 둘을 마치 관련 있는 것처럼 나란히 보여주지.. 2025. 4. 9.
Data literacy - 누적과 막대 그래프 2장 2절 | 누적 그래프와 막대 그래프 사이의 간극“사용자 수가 매년 증가하고 있습니다.”“누적 다운로드 수 1,000만 돌파!”“누적 가입자 수 200% 증가!” 이런 말, 어디서 많이 들어봤지?앱 서비스 소개 페이지, 스타트업 보도자료, 투자 피칭, 유튜브 크리에이터 홍보 페이지…누적 숫자는 늘 멋있어 보이고, 안정감 있어 보이고, 성공의 증거처럼 느껴진다. 근데 질문 하나 해보자.“최근엔 얼마나 늘었나요?”그게 누적의 함정이다.‘지금’이 아니라, ‘지금까지’를 보여주는 숫자즉, 과거가 현재를 덮고 있는 구조다. 누적 그래프는 절대 줄지 않는다 — 그래서 착각이 시작된다누적(N累積) 그래프의 본질은 이거야:사용자가 한 명만 추가돼도 그래프는 올라간다신규 유입이 전혀 없어도, 탈퇴자가 표시되지 않으.. 2025. 4. 8.
Data literacy - Y축 자르기 2장 1절 | Y축만 깎았을 뿐인데 매출이 폭등했다그래프는 우리에게 말없이 많은 걸 말해준다.숫자 하나하나를 따로 읽지 않아도, 선 하나가 올라가면 “오, 성장했구나”,막대가 크게 솟아 있으면 “이 제품이 압도적이네”라고 믿는다.직관적이고, 빠르고, 한눈에 들어오니까.그런데 너무 ‘빠르다’는 건,그만큼 속기도 쉽다는 뜻이다. 그래프는 숫자보다 더 ‘설득력 있는 거짓말’을 할 수 있다 [예]어떤 기업이 투자 유치를 앞두고 IR 자료를 만든다.매출을 보여주는 그래프를 이렇게 꾸민다:2021년: 1.1억2022년: 1.2억2023년: 1.35억성장 폭은 숫자만 보면 아주 크진 않다.하지만 Y축의 시작점을 1.0억으로 설정하고, 눈금을 0.05억 간격으로 자르면?그래프는 이렇게 보인다:📈 1.1 → 1.2 .. 2025. 4. 6.
Data literacy - 비응답 편향 1장 4절 | 표본, 샘플, 응답률 — 누구 말을 믿을까?뉴스 헤드라인을 보다가 이런 문장 본 적 있을 거야.“전국 20~30대 남녀 1,000명 대상으로 조사한 결과…”“직장인 87%가 재택근무를 긍정적으로 평가했다.”“2030 여성의 65%가 MZ 감성 브랜드에 호감을 보였다.”“20~30대 직장인 80%가 이직을 고려 중이다” “2030 여성의 65%가 ‘비혼이 낫다’고 응답”“직장인 10명 중 7명, 퇴사 후 창업 고려” 이런 수치를 보면 사실처럼 느껴지고, 꽤 신뢰감도 생기지?근데 여기엔 꼭 따져봐야 할 질문들이 있어.“그 1,000명, 도대체 누구?” 모든 조사는 ‘표본’이라는 선택의 결과다 세상 모든 사람을 대상으로 조사할 수는 없어.그래서 우리는 일부만 뽑아서 조사하고,그걸 전체의 의견처럼.. 2025. 4. 5.
Data literacy - 자기 선택 편향 1장 3절 | 97%가 만족? 그 3%가 될 수 있는 나“사용자 97%가 만족한 토너!”“체험단 전원이 피부 개선 효과를 봤어요”“리뷰 평점 ★★★★★ 4.9점, 믿고 사는 제품!”…근데 정작 내가 써보면?"어? 그냥 그렇던데?", 심하면 "이거 왜 이렇게 피부 뒤집어져?"분명 만족도 97%라는데 왜 나만 별로일까?문제는 제품이 아니라, 그 ‘97%’가 어떻게 만들어졌는가에 있어. 만족도는 ‘사실’이 아니라 ‘구성된 수치’다 예를 들어볼게.어떤 화장품 브랜드에서 신제품 테스트를 진행했어.총 30명이 참여했고, 그중 29명이 “만족”이라고 답했대.→ 97% 만족도!근데 그 30명은 누구였을까?기존 VIP 회원체험단으로 뽑힌 사람들제품 무료로 받았거나 뷰티 커뮤니티 활동 중인 사람들“솔직한 후기 남겨주시면.. 2025. 4. 5.
반응형