본문 바로가기
생각의견

모두 거짓말을 한다, 세스 스티븐스 다비도위츠 지음

by 해뜰시간 2021. 4. 13.
728x90

 

모두 거짓말을 한다, 세스 스티븐스 다비도위츠 지음

 

내용 간단 요약- 빅데이터, 새로운 데이터, 그리고 인터넷이 우리에 대해 무엇을 알려주는 지 밝혔다. 구글 트랜드 등을 분석하여 사람들이 타인을 의식하지 않고 검색한 결과(사람들이 관심 갖고 있는 실제를 보여 주는)로 우리 속내를 밝혔으며, 페이스북 등 SNS를 통해 드러낸(다소 포장된) 취향 등은 어떠한 지도 알려준다. 섹스, 아동학대, 낙태 등에 대해 여러 통계 자료가 말하는 결과와 실제 사람들이 생각하고 주장하며 행동하는 결과가 어떻게 다른지 알아보는 묘미가 있다. 인간의 욕망, 호기심에 대해 적나라하게 드러낸다.

대표사진 삭제

사진 설명을 입력하세요.

<기억에 남는 구절>

출처 입력

-미국인 대다수가 구글에 매우 사적인 사항을 이야기 한다는 너무도 강력한 증거가 있다. 예를 들어 미국인들은 '날씨'보다 '포르노'를 더 많이 검색한다.

남성 25퍼센트와 여성 8퍼센트만이 포르노를 본다고 인정한 설문조사 데이터와는 거리가 한참 멀다.

 

-빅데이터 혁명은 점점 더 많은 데이터를 수집하는 것이 아니라, 적절한 데이터를 수집하는 것(영리한 빅데이터 기업들은 종종 데이터를 줄인다.)

 

-빅데이터의 힘: 새로운 유형의 데이터 제공, 솔직한 데이터 제공, 작은 집단도 클로즈업해서 보기, 인과적 실험의 실행 가능성

 

-(데이트 언어 분석 결과) 데이트 때 여성들이 마시는 음료가 '별로'라거나 '그럭저럭' 춥다거나 '아마도' 다른 전체 요리를 먹을 거라고 말한다면, '대체로','아마도','별로' 당신이

마음에 들지 않는 뜻으로 받아들이면 된다. 여성들이 '제 말은'등 자기 이야기를 한다면 상대에게 관심 있을 가능성이 높다. 이에 반해 남성들이 여성에게 반응하는 여러 요소 중에서

대화는 극히 작은 역할만 한다. 남성에게는 외모가 그 무엇보다 중요하다. (너무 적나라한 사실인데 ..ㅎㅎ)

 

-페이스북은 디지털 허풍이다. 페이스북 세상에서는 토요일 밤 모든 젊은이들이 근사한 파티에 간다. 하지만 실제로 대부분 집에서 혼자 넷플릭스 드라마를 몰아서 본다.

디지털 진실 : 검색, 조회수 , 클릭수 , 결제

디지털 거짓: SNS포스팅, SNS '좋아요', 데이트 프로필

 

-'사람들에 관한 비밀'이란 사람들이 알지 못하는 자신에 관한 것 또는 남들에게 알리고 싶지 않아 숨기는 것'으로 정의한다. 위대한 사업은 사람들의 비밀을 바탕으로 한다.

(ex. 페이스북 : 페이스 매시라는 얼굴 평가에서 시작, 넷플릭스: 사람들이 보고 싶다고 담아놓은 영화가 아닌 실제로 클릭해서 본 영화를 기반으로 영화 추천하는 시스템으로 성공 = 사람들이 말하는 것을 믿지 말고 행동하는 것을 믿어라)

 

-빅데이터가 무엇이며, 어떻게 이것으로 세상을 다시 보고 이해할 수 있는지, 특히 숨기고 싶은 인간들의 관심사와 행동양식은 물론 그런 사고와 행동을 일으킨 요인,

 

즉 인과관계를 밝히는 흥미로운 연구결과를 보여준다. 일례로 야구 팬인 자신과 야구 혐오자인 동생을 비교하며 야구 팬은 어떤 나이대에 많으며 언제부터 팬으로 또는 무관심자로 확정되는지 등을 SNS분석으로 알아낸다. 일상지사의 소재에서 재밌는 아이디어를 찾아 자료를 분석해 인과관계를 밝힌다.

 

생각

출처 입력

빅데이터에 대한 명확한 정의를 내리진 못할지라도

구글, 유튜브, 페이스북, 넷플릭스가 우리의 데이터를 끌어모아 그에 기반한 알고리즘으로 광고를 띄우고 영상과 글들을 선별해 보여준다는 것 정도는 누구나 다 안다.

 

이 책은 그런 빅데이터가 전통적 데이터 수집 방식인 서베이를 대체해 다양한 분야의 연구에 엄청난 데이터를 제공할 수 있다는 점을 여러 사례를 통해 보여준다. 무엇보다 그는 우리가 구글의 검색창에 입력하는 수많은 키워드와 질문들이야말로 엄청나게 유용한 데이터라는 점을 강조한다.

 

구글 검색창이 주는 익명성은 (물론 구글은 그걸 모두 수집하고 있지만) 우리가 차마 다른 사람들에게 공개적으로 묻지 못하는 질문들을 하게끔 이끌어낸다. 단적인 예로 사람들은 성과 관련된 극히 사적인 질문도 주저 없이 구글링을 하며 키보드 밖을 떠나면 남들에게 쉽게 내보이지 않을 인종차별적 성향도 구글 앞에선 여과 없이 드러낸다.

 

이는 사람 대 사람으로 이루어지는 기존의 서베이 방식에서는 쉽게 얻기 힘든 데이터였다.

서베이에 참여할 때, 특히 사회적 인식이나 도덕적 규범과 관련된 문항을 접하면 사람들은 더 나은

사람으로 보이기 위해, 흔히 거짓말을 한다.

 

그렇기에 전통적 방식의 서베이는 실제에 비해 상당히 왜곡된 결과를 도출할 가능성이 높았다.

(하지만 반대로 구글 검색은 공개적으로 언급하기에 부적절한 생각 쪽으로 편향되어 있을 가능성 또한 높다)

 

솔직한 데이터 수집이 가능하다는 점과 더불어 빅데이터는 이전에는 짐작만 할 수 있었던 영역에 새로운 형태의 데이터를 제공해 주며, 작은 규모의 한정적인 집단에 포커를 맞춰 유의미한 결과를 도출할 수 있게끔 해준다. 전통적 방식과 달리 통제 실험이 간단하기에 인과관계를 파악하는데 유용할 수도 있다는 것이 저자가 말하는 빅데이터의 힘이다. 사회과학이 자연과학 앞에 늘 컴플렉스로 가졌던 인간 행동의 인과관계 예측에 대한 객관적 데이터 부족이 조금은 해소될 수 있는 지점이다.

 

하지만 빅데이터가 순기능만 하는 것은 아니다. 빅데이터가 단순히 양으로 승부한다고 생각하면 오산인데,

더 많은 데이터를 수집하는 게 전부가 아니라, 적절한 데이터에 포커스를 맞췄을 때 유의미한 분석이 가능하다는 것. 그리고 빅데이터처럼 많은 데이터를 다루다 보면 통계적으로 유의미한 결과가 하나 정도는 나오게 되는데, 이때 기하급수적으로 많은 변수 중 정확한 것을 제대로 파악하지 못한 채

성급히 인과관계를 단정 짓은 '차원의 저주' 역시 문제가 될 수 있다. 또한 빅데이터는 그 자체로 완전무결한 것이 아니며 기존의 소규모 데이터 방법론과

서로 보완관계에 있어야 한다는 점을 저자는 지적한다.

 

무엇보다 사회적으로 문제 될 소지가 있는 부분은 바로 빅데이터 사용의 도덕적, 윤리적 측면이다. 빅데이터에 접근 가능한 기업, 정부, 개인이나 조직들이 개인의 사적 영역을 침해할 가능성이 높다. 내가 검색한 키워드는 클릭한 포스팅이나 웹사이트가 데이터라는 이름으로

차곡차곡 기록으로 남아 기업들의 서버 안에 존재한다는 게 생각해 보면 얼마나 섬뜩한 일인가 !

 

EU가 제정한 개인정보보호 규정(GDPR) 의 등장 배경은 바로 이러한 맥락이다. 여전히 대부분의 사람들이 이에 큰 관심을 갖지 않고 팝업창에 떠오르는 개인정보 이용 관련 안내에 무심히 Agree 버튼을 누른다는 게 문제이지만.

 

아무튼 빅데이터가 어떤 방식으로 사용될 수 있는지, 그 영향력에 대해 알고 싶은 사람이라면 흥미롭게 읽을 수 있는 책인 거 같다. 데이터는 거짓말을 하지 않는다. 그리고 데이터 과학자의 목표는 이를 토대로 세상을 이해하는 것이다. 새로운 데이터로 사람들의 거짓말을 꿰뚤어 볼 수 있다. 새로운 장르, 관점에서 사고의 폭을 넓혀줄 수 있는 책이 였다. 그리고 저자 스스로도 스티븐 래빗으로부터 영향을 받았다고 밝히고 있듯, <괴짜경제학>을 좋아하는 사람이라면 이 책도 흥미로운 부분들이 많이 있을 것 같다.

 

https://www.youtube.com/watch?v=LhFkgBuR-EA

 

 

'생각의견' 카테고리의 다른 글

20210505 나비효과  (0) 2021.05.05
너무 뻔해서 어처구니가 없는 성공의 비밀  (0) 2021.04.09
완벽한 하루  (0) 2021.04.09
습관을 바꾸고 싶다면 무조건 적어라  (0) 2021.04.09
무언가를 선택한다는 건  (0) 2021.04.07