반응형 Data, AI, Tech. & Career74 Data literacy - 정제되지 않은 데이터 5장 1절.정제되지 않은 데이터가 말하는 진짜 이야기“이 데이터, 좀 지저분한데요?”“빈칸도 많고, 숫자도 이상해요.”“정제 먼저 하고 분석합시다.”데이터 분석을 하자고 하면, 가장 먼저 나오는 말들이다. 하지만 정작 진짜 이야기는, 그런 ‘이상한 데이터’ 속에 있다. 현실 데이터는 깨끗하지 않다. 그리고 그게 정상이다. 실제 데이터를 처음 열어보면 이런 생각이 든다.“왜 이름이 두 개씩 있는 사람이 있지?”“날짜가 2021년, 2022년, 1022년? 오타인가?”“빈칸이 이렇게 많은데, 뭘 분석하라는 거지?”“이건 숫자고, 저건 문자열이고… 정리가 안 돼 있다.”그리고 곧 이런 말이 따라붙는다.“이건 못 써요.”“다시 받아오죠.”“클렌징부터 해야겠네요.”맞다. 정제는 중요하다. 하지만 우리는 너무 쉽게.. 2025. 4. 20. Data literacy - 내가 만든 데이터가 나를 규정하는 순간 4장 4절.내가 만든 데이터가 나를 규정하는 순간나는 나를 안다고 생각했다. 나는 ‘내가 선택한다’고 믿었다. 하지만 어쩌면 지금의 나는 어제의 내가 남긴 데이터가 만든 결과일지도 모른다. 데이터는 과거의 나를 기억한다. 그리고 현재를 해석하고, 미래를 예측한다.내가 클릭한 상품들,내가 끝까지 본 영상들,내가 스크롤하다 멈춘 시간,내가 찜해두고 결국 사지 않은 장바구니…이 모든 데이터는 단순한 ‘흔적’이 아니라 해석의 단서가 된다.“이 사람은 이런 제품을 좋아한다”“이 사람은 늦은 밤에 혼자 영상 소비를 많이 한다”“이 사람은 이 카테고리에 관심이 많고, 구매력도 있다”그렇게 만들어진 프로파일은 나의 취향을 예측하고, 내가 어떤 소비자, 어떤 사용자, 어떤 사람인지를 정의한다.데이터는 삶의 조건을 바꾼다.. 2025. 4. 18. Data literacy - 퍼스널라이징의 함정 4장 3절.퍼스널라이징의 함정: 더는 우연이 없는 세상우리는 지금 모든 것이 개인화된 세상에 살고 있다. ‘너를 위한 추천’은 더 이상 특별한 기술이 아니다. 이제는 기본이다.넷플릭스는 내가 좋아할 영화만 보여주고유튜브는 내가 끝까지 볼 만한 영상만 추천한다쿠팡은 내가 한 달 뒤에 다시 살 것 같은 제품을 먼저 띄워준다스포티파이는 내가 좋아하는 음악만 골라 플레이리스트를 만들어준다이건 기적 같고, 너무나 편리한 일이다. 하지만 그 편리함의 끝에 무엇이 있는지는, 아무도 말해주지 않는다. “다 알고 있으니까, 넌 생각 안 해도 돼.”개인화의 핵심은 이거다.“너는 이미 이런 걸 좋아하잖아.”“네가 예전에 이런 걸 봤으니까, 이번에도 분명히 좋아할 거야.” 추천 시스템은 나의 선택을 대신하고, 내가 뭘 좋아할.. 2025. 4. 16. Data literacy - 내가 뭘 본 줄 아는 ‘그들’의 시선 4장 2절.내가 뭘 본 줄 아는 ‘그들’의 시선처음엔 아무렇지 않았다. 그냥 한번 뉴스 기사를 읽었고, 한 번 검색했으며, 잠깐 영상 하나를 클릭했을 뿐이었다.그런데 이상한 일이 벌어진다. 같은 제품 광고가 인스타그램, 유튜브, 네이버, 심지어 뉴스 기사 안에까지 따라온다. 방금 읽은 기사와 연관된 콘텐츠가 포털 메인에 추천된다. 전혀 말을 한 적 없는 관심사가, 어느 날 갑자기 피드에 줄줄이 뜬다. “이걸 어떻게 알았지?” 그 순간, 문득 소름 돋는 한 가지 생각이 스친다. ‘나를 지켜보고 있는 그들’이 있다. 디지털 세계에는 '관찰자'가 있다현대의 대부분 서비스는 사용자를 직접 ‘기록’하지 않는다. 하지만, 사용자의 행동을 정교하게‘관찰’한다.어떤 콘텐츠를 얼마나 스크롤했는가어디서 멈췄고, 어디서 나.. 2025. 4. 15. Data literacy - 추천 알고리즘은 왜 내 취향을 이렇게 잘 알까? 4장 1절.추천 알고리즘은 왜 내 취향을 이렇게 잘 알까?넷플릭스를 켜면, 마치 나보다 나를 더 잘 아는 것 같은 콘텐츠가 떠 있다. 유튜브 홈 화면은 내가 누르지 않아도, 이미 ‘보고 싶은 것들’로 채워져 있다. 쿠팡에 접속했는데, 몇 시간 전 친구와 얘기했던 그 물건이 바로 떠 있다. 처음엔 놀랍고 편했다. 하지만 점점 이상했다. “어떻게 이렇게 잘 알지?” 우리는 지금, 내가 클릭한 순간, 나보다 먼저 나를 해석하고 예측하는 세상에 살고 있다. 추천 시스템은 '기억'하지 않는다. '예측'한다.많은 사람들은 추천 시스템이 단순히 ‘내가 봤던 걸 기억해서 보여주는 것’이라고 생각한다. 하지만 사실 그건 ‘기억’이 아니라 ‘예측’이다. 내가 뭘 봤는지뿐 아니라,그걸 언제 봤는지어떤 기기에서 봤는지본 뒤에.. 2025. 4. 14. Data literacy - 팩트가 많을수록 진실에 가까워질까? 3장 4절 | 팩트가 많을수록 진실에 가까워질까?“정보는 많을수록 좋지.”“데이터가 많으면 판단도 더 정확해지는 거 아냐?”“팩트를 쌓다 보면 결국 진실에 다다르겠지.”우리 모두가 한 번쯤 이렇게 생각해봤을 거야.실제로도 데이터 기반 의사결정(data-driven decision)이라는 말은요즘 회사와 조직에서 거의 교과서처럼 쓰이는 원칙이지.하지만 이 믿음, 과연 맞는 걸까? 팩트는 많아도, 방향은 틀릴 수 있다한 번 예를 들어보자.직장인 대상 커머스 플랫폼에서 “고객 리포트”를 작성했다고 해보자.그 보고서엔 이런 수치들이 들어있다:1개월 내 신규 고객 유입 수: 4,302명주간 재방문율: 23.6%객단가 평균: 41,000원반품률: 12.7%NPS 점수: +43장바구니 이탈률: 58%앱 실행 평균 시.. 2025. 4. 13. 이전 1 2 3 4 5 ··· 13 다음 반응형