본문 바로가기
Data, AI, Tech. & Career

Data literacy - 자기 선택 편향

by InfosGalaxy 2025. 4. 5.
반응형

 

 

1장 3절 | 97%가 만족? 그 3%가 될 수 있는 나

“사용자 97%가 만족한 토너!”
“체험단 전원이 피부 개선 효과를 봤어요”
“리뷰 평점 ★★★★★ 4.9점, 믿고 사는 제품!”

…근데 정작 내가 써보면?
"어? 그냥 그렇던데?", 심하면 "이거 왜 이렇게 피부 뒤집어져?"

분명 만족도 97%라는데 왜 나만 별로일까?
문제는 제품이 아니라, 그 ‘97%’가 어떻게 만들어졌는가에 있어.

 

만족도는 ‘사실’이 아니라 ‘구성된 수치’다

 

예를 들어볼게.
어떤 화장품 브랜드에서 신제품 테스트를 진행했어.
총 30명이 참여했고, 그중 29명이 “만족”이라고 답했대.
97% 만족도!

근데 그 30명은 누구였을까?

  • 기존 VIP 회원
  • 체험단으로 뽑힌 사람들
  • 제품 무료로 받았거나 뷰티 커뮤니티 활동 중인 사람들
  • “솔직한 후기 남겨주시면 다음 제품도 드려요” 같은 조건

이 상황에서 솔직하게 “별로였어요”라고 말할 수 있을까?
대부분 ‘좋은 말만 골라 쓰는 구조’가 이미 짜여 있어.

이게 바로 ‘자기선택 편향(self-selection bias)’이야.
즉, 스스로 참여한 사람들이 특정한 특성을 이미 가지고 있어서, 그 결과는 일반화가 어려워.

 

숫자가 커 보이게 만드는 마케팅의 기술

만족도 97%는 괜히 나온 게 아니야.
브랜드들은 의도적으로 좋은 수치만 골라서 보여주는 기술을 아주 잘 안다.

예:

  • “만족한 사용자 비율” → 불만족한 사람은 조사 대상에서 제외됨
  • “사용자 200명 중 194명이 긍정 응답” → 그 ‘사용자 200명’은 어떤 방식으로 뽑은 사람들일까?
  • “피부 개선에 도움을 줬다고 느낀 비율” → 느낌? 효과? 기준이 애매해

이건 팩트처럼 보이지만, 사실상 ‘해석’에 가까운 수치야.

 

우리가 꼭 기억해야 할 질문 3가지

  1. 이 조사는 누가 했는가?
    •    브랜드 내부 조사? 제3의 독립 기관?
    •    설문 플랫폼? 리뷰 조작 가능성은?
  2. 조사 대상은 누구인가?
    •    자발적 참여자 vs 무작위 표본
    •    팬심 가진 고객 vs 일반 소비자
  3. 질문 방식은 어땠는가?
    •    “만족하셨나요?” vs “어떤 점이 불만족스러우셨나요?”
      → 단어 하나에 따라 결과는 완전히 달라져

 

그 3%가 당신일 수 있다는 걸 잊지 마

만족도 97%는 ‘전체의 감정’이 아니라 ‘선별된 사람들의 평균적 반응’일 뿐이야.
당신은 그 3%일 수 있고, 또 그 3%가 틀린 것도 아니야.
다른 사용성, 다른 피부, 다른 조건 속에서,
우리는 각자의 기준으로 평가해야 해.

“다수가 그렇다 해서 나도 그래야 하는 건 아니다.”
진짜 데이터 리터러시는,
숫자의 대세에 휩쓸리지 않고 자기 기준을 갖는 데서 시작돼.

[목차] Part1. 데이터는 왜 우리를 속이는가

[1장. “이 숫자, 진짜일까?”]

[2장. “그래프는 거짓말을 하지 않는다?”]

[3장. “그래프는 거짓말을 하지 않는다?”]

[4장. “당신이 클릭하는 순간, 데이터는 당신을 읽는다”]

반응형