본문 바로가기
반응형

Data, AI, Tech. & Career74

Data literacy - 중립을 가장한 편향 3장 3절 | 데이터는 중립적이지 않다: 왜 수치는 편향될 수밖에 없는가“우리는 데이터로 말합니다.”“숫자는 거짓말하지 않습니다.”“팩트에 기반한 결정을 내립니다.” 회의실에서, 마케팅 브리핑에서, 보도자료에서 이런 말은 거의 주문처럼 반복된다.하지만 진짜일까?우리는 그동안 ‘데이터’라는 단어에 너무 많은 신뢰를 줬었다.숫자는 감정이 없고, 입장이 없고, 누구의 편도 아닌 순수한 정보라고 믿었던 거다.하지만 현실은 정반대다.데이터는 그 자체로도 이미 편향되어 있을 수밖에 없고,그 편향은 ‘보기 좋게’ 잘 포장돼서 우리 앞에 놓인다. 데이터는 ‘있는 그대로의 세상’을 보여주는가?아니다. 보여주기로 선택된 조각만 보여준다.데이터는 공기 중에 떠다니는 게 아니다.사람이 설계하고, 선택하고, 수집하고, 편집한 .. 2025. 4. 12.
Data literacy - 데이터를 만든 사람의 입장 3장 2절 | 누가 데이터를 만들었는가: 기관, 기업, 언론의 의도아침에 스마트폰 알림으로 뉴스 하나가 떴다.“2030 세대의 72%, 연애보다 혼자가 편하다 응답”기사 안에는 그래프도 있었고, 퍼센트도 있었다.“오, 요즘 사람들 진짜 연애 안 하나 보다”그렇게 우리는 또 하나의 통계를 믿는다.그런데 그 데이터, 누가 만든 걸까? 숫자에는 입장이 있다.데이터는 ‘사실’이 아니라 ‘설계된 이야기’다.대부분 사람들은 “데이터는 객관적이다”라고 생각한다.하지만 데이터는 생성, 수집, 선택, 표현 — 이 모든 과정에서 사람의 선택이 들어간다.그리고 그 사람들은 각자의 입장, 목적, 의도를 가지고 있다.데이터는 그 자체로 정치적이다.‘정치’라는 말이 거창하게 들릴 수도 있지만, 여기서 말하는 정치란“누가 말하고 .. 2025. 4. 11.
Data literacy - 숫자에 가려진 맥락 2장 4절 | 그래프는 보여주는 게 아니라 숨기는 도구일 때가 많다회사 회의 시간, 팀장이 자료를 띄운다.PPT 8페이지에 딱 있는 그래프 하나.막대그래프 몇 개, 깔끔한 타이틀, 아래에 작은 글씨로 “월간 사용자 수 추이”라고 적혀 있다.선이 올라가고, 막대가 점점 길어진다.팀장이 말한다.“보시다시피, 꾸준히 우상향입니다. 좋은 흐름이에요.”그리고 발표는 그대로 넘어간다.그 순간, 우리는 저 그래프를 보고 자동으로 ‘아, 잘 되고 있구나’라고 생각한다.그런데, 혹시 그 안에 ‘지금 상황의 진짜 모습’은 빠져 있는 건 아닐까? 그래프는 ‘사실’을 보여주는 것처럼 보인다.하지만 실제로는 ‘선택’된 일부만 보여준다.**데이터는 수많은 수치와 지표, 범주, 시점, 조건으로 구성돼 있다.그 중에서 어떤 걸 ‘그.. 2025. 4. 10.
Data literacy - 선택된 수치의 힘 3장 1절 | 선택적 수치, 보고 싶은 것만 보는 리포트‘사실’을 말한다고 생각했다.매출이 늘었고, 전환율이 높아졌고, 고객 이탈률은 개선됐다고 했다.그래서 우리는 그 수치를 말하는 사람을 신뢰했다.그런데 어느 순간부터 이상했다.왜 다들 잘 됐다는데, 상황은 점점 불안하지?숫자가 늘어날수록 믿음은 줄어들고,그래프가 예뻐질수록 의심이 커졌다.그 수치가 진짜일까? 아니면, 그냥 그렇게 보이도록 ‘선택된’ 건 아닐까? 숫자는 선택의 결과다 — 우리는 진실이 아니라 연출을 보고 있다한 스타트업 마케팅팀에서 일했던 친구의 말이 아직도 기억난다.“매달 성과 보고서 작성하는데, 항상 고민해.뭘 보여줘야 ‘잘했다’는 인상을 줄 수 있을까?” 그래서 이런 일이 벌어진다.유입은 줄었지만 전환율은 살짝 올랐을 때→ “전환율.. 2025. 4. 9.
Data literacy - 상관관계와 인과관계 착각의 함정 2장 3절 | 이중축 그래프, 도대체 뭘 비교하자는 거지?보고서에서 이런 그래프 본 적 있을 거야.왼쪽 Y축: 월 매출 (단위: 억 원)오른쪽 Y축: 신규 가입자 수 (단위: 명)X축: 월별 시간파란 막대: 매출빨간 선: 가입자 수 한눈에 보면 뭔가 있어 보인다.“오, 가입자가 늘면서 매출도 같이 오르네?”“가입자 수가 줄자 매출도 떨어졌네?”이런 식으로 말이지.그런데… 이건 정말 인과관계일까?아니면 그냥 같은 시기에 우연히 움직였을 뿐일까? 이중축 그래프, 이름부터 조심해야 할 이유이중축 그래프(Dual-Axis Chart)는 말 그대로하나의 차트에 두 개의 서로 다른 Y축을 겹쳐서 보여주는 방식이야.왼쪽 축은 A라는 지표,오른쪽 축은 B라는 지표.그리고 그 둘을 마치 관련 있는 것처럼 나란히 보여주지.. 2025. 4. 9.
Data literacy - 누적과 막대 그래프 2장 2절 | 누적 그래프와 막대 그래프 사이의 간극“사용자 수가 매년 증가하고 있습니다.”“누적 다운로드 수 1,000만 돌파!”“누적 가입자 수 200% 증가!” 이런 말, 어디서 많이 들어봤지?앱 서비스 소개 페이지, 스타트업 보도자료, 투자 피칭, 유튜브 크리에이터 홍보 페이지…누적 숫자는 늘 멋있어 보이고, 안정감 있어 보이고, 성공의 증거처럼 느껴진다. 근데 질문 하나 해보자.“최근엔 얼마나 늘었나요?”그게 누적의 함정이다.‘지금’이 아니라, ‘지금까지’를 보여주는 숫자즉, 과거가 현재를 덮고 있는 구조다. 누적 그래프는 절대 줄지 않는다 — 그래서 착각이 시작된다누적(N累積) 그래프의 본질은 이거야:사용자가 한 명만 추가돼도 그래프는 올라간다신규 유입이 전혀 없어도, 탈퇴자가 표시되지 않으.. 2025. 4. 8.
반응형