본문 바로가기
Data, AI, Tech. & Career

Data literacy - 비정형 데이터

by InfosGalaxy 2025. 4. 22.
반응형
5장 3절.

숫자보다 더 중요한 ‘비정형 데이터’ 다루기

“데이터 분석하겠습니다!”
그리고 숫자만 꺼낸다. 매출, 전환율, 이탈률, 클릭 수, 반응률, 평균 시간…
그런데 뭔가 이상하다.
분석은 했는데, 정작 고객이 왜 떠났는지는 모르겠다.
리포트는 잘 만들었지만, “그래서 우리 팀 분위기는 요즘 어떤가요?”라는 질문엔 대답을 못 한다.

왜일까? 숫자에 없는 이야기들이, 더 중요한 경우가 많기 때문이다.

숫자는 결과를 말하고, 비정형 데이터는 이유를 말한다

한 가지 예를 들어보자.

어떤 앱의 하루 사용자 수가 줄었다. 숫자로는 ‘문제 상황’이다.

하지만 왜 줄었는지는 숫자가 말해주지 않는다.

그걸 알려주는 건,

  • 고객 문의에 남긴 불만의 문장
  • 앱 리뷰의 댓글
  • 설문 응답 중 자유서술형
  • 고객센터 통화 내용
  • 직원 간 이메일, 회의 메모, 잡담 기록…

이런 것들이 바로 비정형 데이터다. 표에 정리되어 있지 않고, 수치로 요약되지 않지만 의미와 맥락, 감정과 태도는 여기에 담겨 있다.

현실은 텍스트와 감정으로 구성돼 있다

  • 직원의 사직 사유서에는 숫자가 없다. 하지만 팀 문제의 핵심은 그것에 있다.
  • 고객의 리뷰 하나에 ‘왜 이탈했는지’가 숨겨져 있다.
  • 자유 서술형 응답은 번거롭지만, 진심이 담겨 있다.
  • 갑작스런 수치 변화의 배경은, 회의 중 한 마디에 들어 있기도 하다.

📍  우리는 수치를 좋아하지만, 현실은 말과 감정으로 이루어져 있다.

비정형 데이터를 다룬다는 건, 숫자 바깥을 읽는 감각을 키우는 일이다.

누구나 할 수 있는 3가지 비정형 데이터 접근

1. “반복되는 표현”에 집중하기

예: 고객 리뷰 100개 중 자주 등장하는 단어 찾기
→ “답답하다”, “느리다”, “불편하다”
→ “앱이 느림”, “로딩 오래 걸림” → ‘속도 문제’ 분류
📍  반복은 힌트다. 말의 반복은 패턴을 만든다.

 

2. “강조된 문장”에 주목하기

감정이 강한 표현은 더 강력한 메시지를 담고 있다.
→ “절대 다시는 안 씁니다.”
→ “기능은 좋은데 정말 불친절했어요.”
📍  감정의 극단에는 ‘불만’ 혹은 ‘충성’의 시그널이 있다.

 

3. “숫자와 문장을 함께 보기”

숫자와 텍스트를 같이 놓고 봤을 때 보이는 불일치에 주목하기
→ NPS 점수는 높지만 코멘트는 부정적
→ 사용 시간은 길지만 리뷰에선 불만이 반복됨
📍  숫자만 보면 보이지 않던 문제의 본질이 보인다.

정형 vs 비정형, 무엇이 더 중요한가?

둘 다 중요하다. 하지만 실무에서 가장 자주 간과되고 있는 것은 비정형 데이터다.

왜냐하면 숫자는 보기 편하고, 텍스트는 읽기 귀찮기 때문이다.

하지만 리더가 이런 말을 한다면 어떨까?

저희 앱 평점은 4.5점인데요,
리뷰에서 ‘불안하다’, ‘불편하다’는 말이 많이 나옵니다.
이건 단순 수치 이상의 문제입니다.

 

→ 이 사람은 데이터를 수치로만 보지 않고, 맥락과 감정까지 해석하는 사람이다.
→ 그리고 그런 사람은 ‘현장을 이해하는 사람’으로 인정받는다.

숫자는 좋다.
하지만 숫자 바깥의 이야기까지
볼 수 있어야 진짜 데이터 감각이다.

 

비정형데이터

 

[5장. “ 엑셀과 친하지 않아도 데이터 감각은 생긴다 ”]

반응형