본문 바로가기
반응형

data literacy6

Data literacy - 누적과 막대 그래프 2장 2절 | 누적 그래프와 막대 그래프 사이의 간극“사용자 수가 매년 증가하고 있습니다.”“누적 다운로드 수 1,000만 돌파!”“누적 가입자 수 200% 증가!” 이런 말, 어디서 많이 들어봤지?앱 서비스 소개 페이지, 스타트업 보도자료, 투자 피칭, 유튜브 크리에이터 홍보 페이지…누적 숫자는 늘 멋있어 보이고, 안정감 있어 보이고, 성공의 증거처럼 느껴진다. 근데 질문 하나 해보자.“최근엔 얼마나 늘었나요?”그게 누적의 함정이다.‘지금’이 아니라, ‘지금까지’를 보여주는 숫자즉, 과거가 현재를 덮고 있는 구조다. 누적 그래프는 절대 줄지 않는다 — 그래서 착각이 시작된다누적(N累積) 그래프의 본질은 이거야:사용자가 한 명만 추가돼도 그래프는 올라간다신규 유입이 전혀 없어도, 탈퇴자가 표시되지 않으.. 2025. 4. 8.
Data literacy - 비응답 편향 1장 4절 | 표본, 샘플, 응답률 — 누구 말을 믿을까?뉴스 헤드라인을 보다가 이런 문장 본 적 있을 거야.“전국 20~30대 남녀 1,000명 대상으로 조사한 결과…”“직장인 87%가 재택근무를 긍정적으로 평가했다.”“2030 여성의 65%가 MZ 감성 브랜드에 호감을 보였다.”“20~30대 직장인 80%가 이직을 고려 중이다” “2030 여성의 65%가 ‘비혼이 낫다’고 응답”“직장인 10명 중 7명, 퇴사 후 창업 고려” 이런 수치를 보면 사실처럼 느껴지고, 꽤 신뢰감도 생기지?근데 여기엔 꼭 따져봐야 할 질문들이 있어.“그 1,000명, 도대체 누구?” 모든 조사는 ‘표본’이라는 선택의 결과다 세상 모든 사람을 대상으로 조사할 수는 없어.그래서 우리는 일부만 뽑아서 조사하고,그걸 전체의 의견처럼.. 2025. 4. 5.
Data literacy - 자기 선택 편향 1장 3절 | 97%가 만족? 그 3%가 될 수 있는 나“사용자 97%가 만족한 토너!”“체험단 전원이 피부 개선 효과를 봤어요”“리뷰 평점 ★★★★★ 4.9점, 믿고 사는 제품!”…근데 정작 내가 써보면?"어? 그냥 그렇던데?", 심하면 "이거 왜 이렇게 피부 뒤집어져?"분명 만족도 97%라는데 왜 나만 별로일까?문제는 제품이 아니라, 그 ‘97%’가 어떻게 만들어졌는가에 있어. 만족도는 ‘사실’이 아니라 ‘구성된 수치’다 예를 들어볼게.어떤 화장품 브랜드에서 신제품 테스트를 진행했어.총 30명이 참여했고, 그중 29명이 “만족”이라고 답했대.→ 97% 만족도!근데 그 30명은 누구였을까?기존 VIP 회원체험단으로 뽑힌 사람들제품 무료로 받았거나 뷰티 커뮤니티 활동 중인 사람들“솔직한 후기 남겨주시면.. 2025. 4. 5.
Data literacy - 평균의 함정 1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?“대한민국 20대 평균 연봉은 3,050만 원”“30대는 평균 4,850만 원”“직장인 평균 퇴근 시간은 18시 40분”이런 기사를 보면 기분이 이상해진다.‘어… 나만 못 버는 건가? 나만 퇴근 늦나?’뭔가 자꾸 뒤처지는 기분, 나만 예외인 것 같은 찜찜함.그런데 진짜 평균이 ‘보통의 우리’를 말해주는 걸까? 평균은 늘 착해 보이지만, 현실은 그렇지 않다 ‘평균’이라는 단어는 왠지 공정하고 과학적인 느낌이 있다.하지만 현실에서는 '평균값'이 오히려 우리를 속이기도 한다.예를 들어 이런 상황을 보자.[예] 사람연봉 A2,500만 원B2,700만 원C2,600만 원D3,000만 원E2억 원위 다섯 사람의 평균 연봉은?→ 2,960만 원 갑자기.. 2025. 4. 5.
Data literacy - 기저 효과 1장 1절 | 매출이 200% 늘었다는데, 진짜 대박일까?“이 브랜드, 작년보다 매출이 200% 늘었대!”이 한 문장만으로 우리는 쉽게 '성공'이라는 단어를 떠올린다. 누군가는 "오, 투자해야 하나?"라고 생각하고, 누군가는 "그 브랜드 진짜 잘나가네"라고 감탄한다. 그런데, 잠깐. 정말 ‘200% 증가’라는 말은 대단한 걸까? 퍼센트 숫자, 그거 말장난일 수도 있어요 먼저 간단한 예시 하나 들어볼게요.작년에 온라인에서 '핸드메이드 마카롱'을 팔던 친구가 있었어요. 총 매출 50만원 그리고 올해 150만원이 되었다.그럼 어떻게 말할 수 있죠?“매출 200% 성장! 무려 3배!” 우와! 대박!근데 잠깐… 50만 원에서 150만 원 된 거잖아요?그걸 3배라고 하는 건 맞지만, 절대적인 숫자로 보면 여전히 작.. 2025. 4. 5.
Data Sense literacy - prologue 프롤로그 | “데이터는 우리를 모르지만, 우리는 데이터를 알아야 한다” 지금 이 순간에도, 우리가 누군가에게 “좋아요”를 누르고, 배달 앱에서 떡볶이를 시키고, 유튜브에서 알고리즘이 던져준 영상 하나를 클릭하는 순간에도 - 우리는 데이터의 세계 안에서 살고 있다.문제는, 대부분의 사람들이 데이터 안에 살면서도 데이터에 대해 너무 모르고 있다는 것이다. 마치 수영을 못하는 사람이 바다 한가운데에 던져진 기분이랄까. 다들 “데이터 중요해요”, “데이터 기반으로 판단해야죠” 라고 말은 하는데, 그 데이터가 어떻게 만들어졌는지, 어떤 편향이 있을 수 있는지, 어떤 식으로 우리를 유혹하고 있는지는 모른다. 그냥 숫자가 많으면 그럴듯해 보이고, 그래프가 예쁘면 믿게 된다.우리는 숫자, 도표, 말 잘하는 프레젠테이션.. 2025. 4. 4.
반응형