[이슈 속 세상돋보기] #4. 구글, BIG BROTHER? – LG 공식 블로그
본문 바로가기

[이슈 속 세상돋보기] #4. 구글, BIG BROTHER?

작성일2013-06-25

메이저리그 야구 영화 머니볼 Mnoeyball
요즘 국내에서는 LG트윈스가 살아나고, 미국에서는 류현진선수가 선전하면서 야구 인기가 한창인데요. 

메이저리그 야구 영화 <머니볼 Mnoeyball>은 2002년의 실화를 바탕으로 제작됐습니다. 연봉 총액 4천만 달러인 오클랜드가 아메리칸리그 역사상 최다연승 기록인 20연승을 기록하며,연봉 총액 1억2천5백만 달러인 뉴욕양키스에 버금가는 성과를 올렸습니다. 

야구팀 단장인 브래드피트는 과학적 데이터를 기반으로 선수를 선발해 성과를 거두면서, 빅데이터에 대한 지혜를 보여줍니다. 오늘은 쉽게 말해서 ‘사람들이 유무선 컴퓨터 활용을 통해 남긴 발자국’으로 이해되는 빅데이터(Big Data Processing) 얘기를 해보려합니다.

 

 

최근 다음소프트社는 한 종합병원 연구팀과 함께 앞으로 ‘자살주의보’나 ‘자살경보’를 내릴 수 있는 일기예보 같은 자살예보시스템을 도입하겠다고 밝혔습니다. 이 시스템은 미국 학술지 ‘플로스원(PLOS ONE)’에 실렸는데, 현실화된다면 우리나라가 ‘자살공화국’이라는 오명에서 벗어나는데 도움이 될 수도 있으리라는 전망입니다.

이 예보시스템은 인공위성으로 기상상태 사진을 넘겨받아  ‘자살주의보’를 내리는 것이 아니라, SNS(소셜네트워크서비스)  방대한 데이터를 분석합니다.

1억 5천만 건의 데이터 분석을 통해 국내에서 자살률이  높아질 때, SNS에서 ‘힘들다’와 ‘자살’ 등의 단어가  많아졌고, 개인 블로그나 트위터 등에서는 ‘힘들어 죽겠다’ 거나 ‘자살하고 싶다’는 등의 용어로 표현되는데 착안한 것입니다

또 자살과 연관이 있다고 알려진 물가, 실업률, 주가지수, 일조량, 기온, 유명인 자살 등의 요인을 총 망라했다는 설명입니다

서울시는 심야버스의 새 노선을 만드는데 빅데이터를 이용하기로 했습니다. 하루 통화량이 1억 건이 넘는 KT의 도움을 받아, 서울에서 밤 12시부터 다음날 새벽 5시까지의 통화내역을 위치별로 추려내고, 이용자의 주소지가 포함된 자치구의 통화내역을 제외하면 서울 시민들이 심야 시간에 주로 어느 위치에서 많이 활동하는지에 대한 정보가 집약된다는 설명입니다.

이 통신 정보를 기초로 오는 7월부터 추가 편성될 6개 심야버스 노선을 만드는 작업이 진행 중입니다. 또 내년부터는 택시 미터기에 들어 있는 위치정보와 통신사들이 보유한 통화 위치정보를 활용해 시민들에게는 택시를 타기 쉬운 장소를 안내하고 택시 기사들에게는 시민들이 많이 몰려 있는 곳의 위치를 알려주는 서비스를 도입하기로 했습니다.

빅데이터는 일반적으로 고객의 특성을 파악해 효과적인 타깃광고를 가능하게 해줍니다. 이를 위해 소비습관에 관한 정보, 신용기록, 웹서핑기록, 소셜네트워크 분포도, 인구학적 정보 등 많은 데이터를 수집합니다. 어디서나 스마트폰을 휴대하고 신용카드로 계산을 하고, CCTV 가득한 거리를 다니면서, 사생활과 익명성을 보호받기란 점점 어려워지는 추세인데요.

미국 북부, 스칸디나비아반도 출신 이민자가 많은 미네소타주의 일화는 빅데이터에 대해 다시 한번 생각하게 만듭니다. 2012년 어느날 대형마트인 ‘타킷’의 매장에 중년 남성이 찾아와 매니저를 만나게 해달라고 요구했습니다.

“왜 고등학생인 내 딸에게 아가용 침대와 옷을 사라고 할인쿠폰을 보내는 겁니까? 여고생에게 빨리 임신을 하라고 부추기는 겁니까?”라며 강력히 항의했습니다. 하지만 며칠 뒤, 그 중년 남성은 겸연쩍게 말합니다. “내 딸의 출산 예정일이 8월이랍니다. 정말 미안합니다” 부모도 모르는 딸의 임신을 마트 관리자는 어떻게 알았을까요?

‘찰스 두히그’의 저서 <습관의 힘 THE POWER OR HABIT>에 소개된 일화입니다. 소비자들의 소비 패턴이 가장 많이 바뀔 때가 임신, 출산을 했을 때라는 사실에 주목한 ‘타깃’은 모든 데이터베이스를 이용해 ‘임신 예측 모델’을 고안했습니다.

이에 따르면 임신한 여성은 커피 같은 카페인 음료를 줄이다가, 임신 넉 달째가 되면 향기가 없는 로션을 구매하는 경향이 강하고, 임신 20주가 되면 마그네슘과 아연, 칼슘이 함유된 영양제를 구입하는 경우가 많습니다. 기저귀 가방으로 쓸 만한 큼직한 핸드백과 면봉, 손세정제와 작은 수건을 많이 쇼핑했다면 몇 달 안에 분만할 가능성이 높다는 분석입니다.

KAIST 물리학과 정하웅 교수는 그의 저서 <구글 신은 모든 것을 알고 있다>에서 구글이 특정지역의 독감 발생을, 담당 정부기관인 질병통제예방센터(CDC)보다 훨씬 빨리 파악하고 있다고 밝혔습니다. 특정 지역에서 감기 또는 감기약의 검색어를 사용하는 빈도가 늘어나면, CDC가 전통적으로 파악하는 방법보다 더 빠르고 효율적으로 독감의 확산을 알 수 있다는 것입니다.

구글의 검색 빈도와 트랜드를 통한 상황 예측은 선거에서도 적용된다고 정하웅 교수는 지적합니다. 그는 2011년 서울시장 재보궐선거 하루 전인 10월 25일 밤 11시 15분, 구글에 당시 후보인 ‘나경원’과 ‘박원순’을 검색했다는데요.

결과는 나경원 후보의 이름이 들어간 웹페이지가 약 4,660만 개, 박원순 후보는 5,430만 개였다고 합니다. 실제 선거결과는 46.2%대53.4%로 박원순 후보가 서울시장에 당선됐습니다.

미래의 상황도 검색과 트랜드 추척으로 가능하고, 개인의 사생활도 대부분 노출되는 요즘, 조지 오웰의 소설 <1984>에 나오는 ‘빅브라더’가 ‘빅데이터’는 아닐까 하는 생각도 듭니다.

 

 

스마트폰을 내던지고 마스크를 쓰고 현금만 지불하며 살아 간다면 빅데이터의 그물에서 벗어날 수도 있겠지만,
구글트랜드(google.com/trends)에서 한국과 지구촌의 흐름을 짚어보는 것도
오늘의 세상을 살아가는 한 방법일 듯합니다.

안형준 프로필

글로벌 무한경쟁 시대. 시시각각 변화하며 새롭게 부각되는 세계 속 숨은 이슈와 다양하게 나타나는 현상들을 냉철한 시각으로 담아내어 이 시대를 살아가는 사람들에게 올바른 시각의 메시지를 전하고픈 세상 돋보기의 안형준입니다.

'이슈 속 세상돋보기' 시리즈보기