숫자보다 더 중요한 ‘비정형 데이터’ 다루기
그리고 숫자만 꺼낸다. 매출, 전환율, 이탈률, 클릭 수, 반응률, 평균 시간…
그런데 뭔가 이상하다.
분석은 했는데, 정작 고객이 왜 떠났는지는 모르겠다.
리포트는 잘 만들었지만, “그래서 우리 팀 분위기는 요즘 어떤가요?”라는 질문엔 대답을 못 한다.
왜일까? 숫자에 없는 이야기들이, 더 중요한 경우가 많기 때문이다.
숫자는 결과를 말하고, 비정형 데이터는 이유를 말한다
한 가지 예를 들어보자.
어떤 앱의 하루 사용자 수가 줄었다. 숫자로는 ‘문제 상황’이다.
하지만 왜 줄었는지는 숫자가 말해주지 않는다.
그걸 알려주는 건,
- 고객 문의에 남긴 불만의 문장
- 앱 리뷰의 댓글
- 설문 응답 중 자유서술형
- 고객센터 통화 내용
- 직원 간 이메일, 회의 메모, 잡담 기록…
이런 것들이 바로 비정형 데이터다. 표에 정리되어 있지 않고, 수치로 요약되지 않지만 의미와 맥락, 감정과 태도는 여기에 담겨 있다.
현실은 텍스트와 감정으로 구성돼 있다
- 직원의 사직 사유서에는 숫자가 없다. 하지만 팀 문제의 핵심은 그것에 있다.
- 고객의 리뷰 하나에 ‘왜 이탈했는지’가 숨겨져 있다.
- 자유 서술형 응답은 번거롭지만, 진심이 담겨 있다.
- 갑작스런 수치 변화의 배경은, 회의 중 한 마디에 들어 있기도 하다.
📍 우리는 수치를 좋아하지만, 현실은 말과 감정으로 이루어져 있다.
비정형 데이터를 다룬다는 건, 숫자 바깥을 읽는 감각을 키우는 일이다.
누구나 할 수 있는 3가지 비정형 데이터 접근
1. “반복되는 표현”에 집중하기
예: 고객 리뷰 100개 중 자주 등장하는 단어 찾기
→ “답답하다”, “느리다”, “불편하다”
→ “앱이 느림”, “로딩 오래 걸림” → ‘속도 문제’ 분류
📍 반복은 힌트다. 말의 반복은 패턴을 만든다.
2. “강조된 문장”에 주목하기
감정이 강한 표현은 더 강력한 메시지를 담고 있다.
→ “절대 다시는 안 씁니다.”
→ “기능은 좋은데 정말 불친절했어요.”
📍 감정의 극단에는 ‘불만’ 혹은 ‘충성’의 시그널이 있다.
3. “숫자와 문장을 함께 보기”
숫자와 텍스트를 같이 놓고 봤을 때 보이는 불일치에 주목하기
→ NPS 점수는 높지만 코멘트는 부정적
→ 사용 시간은 길지만 리뷰에선 불만이 반복됨
📍 숫자만 보면 보이지 않던 문제의 본질이 보인다.
정형 vs 비정형, 무엇이 더 중요한가?
둘 다 중요하다. 하지만 실무에서 가장 자주 간과되고 있는 것은 비정형 데이터다.
왜냐하면 숫자는 보기 편하고, 텍스트는 읽기 귀찮기 때문이다.
하지만 리더가 이런 말을 한다면 어떨까?
저희 앱 평점은 4.5점인데요,
리뷰에서 ‘불안하다’, ‘불편하다’는 말이 많이 나옵니다.
이건 단순 수치 이상의 문제입니다.
→ 이 사람은 데이터를 수치로만 보지 않고, 맥락과 감정까지 해석하는 사람이다.
→ 그리고 그런 사람은 ‘현장을 이해하는 사람’으로 인정받는다.
숫자는 좋다.
하지만 숫자 바깥의 이야기까지
볼 수 있어야 진짜 데이터 감각이다.
[5장. “ 엑셀과 친하지 않아도 데이터 감각은 생긴다 ”]
- 5-1. 정제되지 않은 데이터가 말하는 진짜 이야기 ( Data literacy - 정제되지 않은 데이터 )
- 5-2. 쓸모 있는 시각화 vs 보기 좋은 장식 ( Data literacy - 쓸모 있는 시각화 )
- 5-3. 숫자보다 더 중요한 ‘비정형 데이터’ 다루기 (Data literacy - 비정형 데이터)
- 5-4. 나만의 데이터 리포트, 어떻게 시작할까? ( Data literacy - 나만의 데이터 리포트 )
'Data, AI, Tech. & Career' 카테고리의 다른 글
Data literacy - 나만의 데이터 리포트 (0) | 2025.04.23 |
---|---|
Data literacy - 쓸모 있는 시각화 (0) | 2025.04.21 |
Data literacy - 정제되지 않은 데이터 (0) | 2025.04.20 |
Data literacy - 내가 만든 데이터가 나를 규정하는 순간 (1) | 2025.04.18 |
Data literacy - 퍼스널라이징의 함정 (0) | 2025.04.16 |
Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 (1) | 2025.04.15 |
Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? (0) | 2025.04.14 |
Data literacy - 팩트가 많을수록 진실에 가까워질까? (0) | 2025.04.13 |