본문 바로가기

카테고리 없음

"가짜 뉴스 '확산의 원인은 로봇이 아닌 인간이었다 --MIT 발표

출처 : https://jp.techcrunch.com/2018/03/18/2018-03-08-false-news-spreads-faster-than-truth-online-thanks-to-human-nature/



거짓말 전해지는 속도는 몇 세기에 걸쳐 전해지고 있으며, 1710 년의 시점에서 이미 조나단 스위프트 ( 「걸리버 여행기」의 저자)이 "먼저 거짓말이 퍼져, 진실은 그 뒤를 느릿 느릿 및 따라갈 것이다 "라는 말을 남기고있을 정도 다. 그러면서도 이러한 사실을 증거하는 것은 지금까지 거의 존재하지 않았다. 그러나 최근 몇 년 소셜 미디어의 모습을 보면 거짓말이 진실에 큰 차이를하면서 놀라운 속도로 퍼지고있어 더 이상이 당연히도 느껴진다.

그리고 이번에 MIT가 10 년에도 트윗을 분석 한 결과, 거짓말이 진실보다 빠르게 확산뿐만 아니라 로봇과 네트워크 효과가 그 원인과는 단언 할 수 없다 - 즉, 우리 인간이 거짓말을 넓혀 있다 -라는 것을 알 것이다.

3 월 9 일, Science에 발표 된 이 연구는 트위터에서 확산 된 (또는 확산되지 않았다) 10 만건 이상의 뉴스 (제삼자 기관에 의해 허위 뉴스 여부가 결정되는 것 )이 어떻게 전파 갔는지에 초점이 맞춰져있다. 결과는 보고서의 요지 (Abstract)에 기록 된 바와 같이 "어떤 카테고리에도 거짓말은 진실보다 멀리 빨리 깊고 광범위하게 퍼져 나갔다."

Image : Bryce Durbin / TechCrunch

이 결과를보고 러시아와 시계열에 줄 지어 않은 뉴스 피드 선거 등을 비난의 대상에 드는 것은 경솔한 생각이다. 왜냐하면 거짓 뉴스 (정치적 의도를 내포 이른바 '가짜 뉴스'와 구별하기 위해 굳이이 단어를 사용하는)이 이렇게 빨리 확산되는 배경에는 우리 인간이 존재하기 때문이다 .

"거짓말이 진실보다 확산 쉬운 것은 인간이 올바른 정보보다 허위 뉴스를 리트 윗하기 때문이라는 것을 조사 결과는 강하게 나타내고있다"고이 보고서의 공동 저자 Sinan Aral는 말한다.

한편, 그는 다음과 같이주의를 촉구.

"물론 사람의 머릿속에 들어가 어떤 정보를 소비하거나 리트 할 과정을 조사한 것은 아니기 때문에, 본 연구에서는 아직 문제의 심층부에 가까스로 도착할 않은 원래, 어떻게 허위 뉴스가 인터넷에서 확산할지에 대한 대규모 조사는 거의 이루어지지 않았기 때문에 아직 지속적인 노력이 필요하다 "

그렇다고는해도, "인간은 허위 뉴스를 확산 경향이다 '라는 MIT의 연구 결과는 매우 직선적이고 강렬한 인상을 받는다.

불행히도 인간은 알고리즘 및 가격 모델처럼 업데이트 할 수있는 것이어야 언론처럼 무시할 수있는 것도 없기 때문에이 결과는 일종의 좌절감도 느낄 것이다. 왜냐하면 보고서에서도 지적 된 바와 같이, 명확한 해결책 등 존재하지 않는 것이다. 그렇다고 문제을 외면해서는 안된다.

10 년 분의 트윗을 분석

MIT의 연구 과정은 다음과 같다. 또한, 공동 저자 중 한 명이다 Soroush Vosoughi에 따르면 '가짜 뉴스'에 관한 소란이 일어날 오래 전부터이 연구는 진행되고 있던 것 같다.

우선 연구팀은 2006 ~ 2017 년 사이에 출판 된 수백만 건의 트윗을 모아 6 가지 팩트 체커 (Snopes, PolitiFact, FactCheck.org, Truth or Fiction, Hoax Slayer, About.com)의 적어도 하나 하나 진위 판정이 행해진 12 만 6000 건 뉴스와 관련이 있는지를 조사. 그 결과에 따라 트윗을 분류 해 갔다.

그럼 트윗 · 리트 수가 일정 참여 수에 도달 할 때까지의 시간, 정보 표가되는 계정에서 본 도달 범위 등의 지표를 바탕으로 각 뉴스가 어떻게 퍼져 나갔다을 관찰.

마지막으로, 각 지표를 바탕으로 '폭포'와 같은 그래프가 생성되었다. 예를 들어 급격히 확산 된 뒤 곧바로 화제에서 사라져 버렸다 정보는 옆 확산 (= 확산 정도)이지만, 깊이 (대원 트윗에서 여러 층에 걸쳐 리트되었는지)는 대부분 없이 바이러스 가능성도 낮다.

그리고 허위 뉴스와 진실 "폭포"를 비교 한 결과, 몇 가지 예외를 제외하고 거짓 뉴스가 더 많은 사람들에게 더 빠르게 퍼져 여러 층에 걸쳐 리트되는 수 나타났다.

게다가 이것은 몇 % 등의 수준의 차이가 아니다. 구체적인 수치에 대해서는 다음을 참조하기 바란다.

  • 진실은 1000 명 이상으로 도달하는 것조차 거의없는 반면, 허위 뉴스 중 확산 정도에서 상위 1 %에 해당하는 것은 거의 항상 1000~10 만명의 사람들에게 도달하고 있었다.
  • 진실이 1500 명에 도달하려면 거짓말보다 6 배 가까운 시간이 걸린다.
  • 허위 소식은 광범위하게 확산하고 그래프의 어느 부분에서도 리트 단위로 진실을 웃돌았다.
  • 정치에 관한 허위의 뉴스는 곧 여러 층에 걸쳐 리트되어 결과적으로 다른 카테고리의 거짓 뉴스가 1 만명에 도달하는 것보다 3 배 가까운 속도로 2 만 명 이상의 사용자에게 도달 한 .

이상과 같이, 어느 각도에서 봐도 거짓 뉴스 쪽이 진실보다 몇 배 또는 몇 제곱 더 빨리 많은 사람들에게 도달하는 것으로 나타났다.

반대 의견

위의 연구 결과 고찰 및 연구자가 생각하는 해결책 미래의 연구 아이디어에 대해 만지기 전에 예상되는 반대 의견에 대해 생각해 보자.

봇이 원인 인 것은? 결론부터 말하면 봇의 영향은 거의 없다. 연구원은 봇을 탐지하는 알고리즘을 사용하여 분명히 봇에 의한다고 생각되는 트윗은 사전에 제거했다. 또한 로봇의 행동 패턴을 별도로 조사하고 수집 된 데이터를 봇 고유의 패턴과 봇 무 패턴으로 테스트했지만 앞서 언급 한 경향에 변화는 볼 수 없었던 것이다. 이 점에 Vosoughi는 "봇도 약간 진실보다 거짓 뉴스를 전파 쉽다는 것을 알 수 있지만, 우리의 결론에 영향을 미칠 정도는 아니었다. 즉 확산 정도의 차이는 봇은 설명이되지 않는다" 고 말했다.

"허위 뉴스의 확산에 봇이 깊은 관계가 있다는 최근 자주 듣는 설과는 정반대의 결과가 연구에서 밝혀졌다. 이는 로봇의 영향을 부정하는 것은 아니지만, 적어도 봇을 거짓말 확산의 원동력이라고 부를 수는 없다 "고 Aral도 Vosoughi에 동참.

팩트 체크 사이트에 바이어스가 걸려있는 것은? 물론 전혀 바이어스되지 않은 팩트 체커라는 것은 존재할 수 없지만, 연구자가 언급 한 6 개의 사이트에 관하여 정보가 진실 여부의 판정은 95 % 이상의 비율로 공통하고있다. 객관성과 증거를 중시하는 이러한 사이트 모두에게 공통의 바이어스가 걸려 있다고 생각하는 것은 더 이상 음모론의 영역과도 있겠다. 그래도 납득할 수없는 사람은 다음 Aral의 의견을 참조하기 바란다.

"팩트 체커를 포함하여 연구 대상으로 선택 편견이 생기지 않도록 우리는 세심한주의를 기울이고 있었다. 그 증거로 기본 연구와는 별도로 1 만 3000 건 뉴스로 구성된 또 하나의 대조 군에 대해 독자적으로 진위를 확인하고 데이터를 분석 한 결과 거의 유사한 결과를 얻을 수 있었다 "

이 팩트 체크는 MIT의 학부생 3 명이 한 것으로, 판정 결과는 90 % 이상의 비율로 공통했다.

허위 뉴스의 확산은 대규모 네트워크가 관계하고있는 것은?  보고서에 따르면, 현실은 그 반대 인 것 같다.

네트워크의 구조와 각 사용자의 특징에서 허위 정보가 확산 쉬운 배경을 설명 할 수있는 것은, 생각하는 사람도 있을지 모른다. 즉, 허위 정보를 확산 사람 일수록 팔로이나 팔로워 수, 트윗 수가 많아 인증 배지를 받고있는 사람이나 옛날부터 Twitter를 이용하고있는 사람의 비율도 많은 것이 아니냐는 설이다. 그러나 거짓말과 진실의 확산 정도를 비교하면, 실은 그 반대가 옳다는 것을 알 수 있었다.

허위 뉴스를 전파하기 쉬운 사용자의 특징은 다음과 같다.

  • 팔로워 수가 적은
  • 팔로가 적은
  • 트윗 빈도가 낮은
  • 인증 된 사용자의 비율은 적다
  • 계정의 보유 기간이 짧은

"이러한 특징을 볼 수에도 불구하고 허위 뉴스를 빠르고 넓게 확산했다"고 연구자는 적고있다.

왜 거짓 뉴스가 더 빨리 확산 할 것인가?

이 물음에 대한 대답은 추측에 지나지 않지만 적어도 이번 연구에 참여한 MIT 연구원의 "추측"은 데이터에 의지 한 것이라는 사실은 無碍 할 수 없다. 또한 거짓말의 대규모 확산은 최근 볼 수있게 된 현상에서 충분히 연구되지 않았다고하지만 다행히도 사회학이나 심리학에서 얼마 가지 시사를 얻을 수있다.

"커뮤니케이션 학 분야에서는 특정 뉴스가 확산되는 이유에 대해 이미 포괄적 인 연구가 이루어지고있다"고 세 번째 공동 저자 Deb Roy는 말한다. "사람은 긍정적 인 뉴스보다 부정적인 뉴스 평화 뉴스보다 충격적인 소식을 전파하기 쉬운 경향이 있다는 것은 이미 잘 알려져있다."

만약 정말 사람이 다른 새롭고하고 (Roy 왈 "참신 이야말로 가장 중요한 요소") 부정적 ( "피가 흐르면 톱 뉴스가 될 것"현상) 소식을 전파하기 쉽다고하면 남은 의문은 거짓 뉴스가 진실보다 다른 새롭고 부정적인 여부는 점 뿐이다.

Photo : SuperStock / Getty Images

그래서 MIT의 연구진은 일부 사용자의 활동을 분석하고 허위 정보가 포함 된 트윗과 진실 밖에 포함되지 않은 트윗 참신을 비교했다. 그러자 확실히, "새로움에 대한 어떤 지표를 기준으로도 거짓 뉴스가 진실을 상회 '라는 것을 알 것이다.

또한 트윗에서 사용 된 단어와 관련된 감정에 주목했는데, 허위 뉴스는 놀라움과 불쾌감을 나타내는 리플이 붙어 반면, 올바른 정보에 대한 대답에는 슬픔과 기대감 기쁨과 신뢰 같은 감정이 담겨있는 것이 많다고 밝혀졌다.

아직 많은 검증이 필요하지만, 본 연구에서 거짓 뉴스는 진실보다 빠르게 확산, 전자는 후자보다 다른 새롭고 부정하다는 결론이 도출되었다. 그리고는 "다른 새롭고하고 부정적인 그래서 허위의 정보는 빠르게 확산 '이라는 양자의 인과 관계를 입증하는 연구 발표가 기다려진다.

우리는 무엇을 할 수 있습니까?

본 연구에서 나타난 바와 같이, 허위 뉴스를 인간이 넓은 있다고하면 그것을 방지하기 위해 어떻게됩니까? 모두의 조너선 스위프트의 말대로 이것은 결코 최근 태어난 것이 아니라, 사람들은 지금까지 몇 세기에 걸쳐이 문제에 대해 어떤 대책을 강구하고왔다. 굳이 말하면, 문제의 규모에 차이가있을 수 있습니다.

"수백만 - 여러 플랫폼을 정리하면 수십억 명 - 무슨 사람들이 실시간으로 뉴스의 확산 정도에 영향을 미친다는 것은 지금까지 없었던 것 같다"고 Roy는 말한다. "네트워크로 연결된 사람들의 행동에 대해뿐만 아니라, 그것이 뉴스와 정보의 전파에 어떤 영향을 미칠 것인가하는 점에 대해서는 추가 연구가 필요하다."

또한 Roy는이 문제를 인간의 건강 상태와 같이 파악하고있다. 사실 Jack Dorsey (Twitter의 공동 창업자이자 CEO)도 Roy이 설립 한 비영리 조직 Cortico 의 블로그 포스트를 인용 소스로 비슷한 비유를 이용한 다음 트윗 을 게시했다.

우리는 공동체 전체의 건강 상태와 개방성, 심지어 플랫폼에서주고받는 대화의 매너 향상에 노력하는 것과 동시에, 그 진행에 책임을 약속한다.

또한 Roy을 비롯한 연구자들은 Twitter는 물론 Facebook과 Instagram, 온라인 게시판 등 플랫폼의 "건강 진단기 '의 개발에 임하고있다. 그러나 Roy는 이러한 플랫폼은 빙산의 일각에 불과하며, 전체 인터넷 "건강"을 향상시키기 위해 더 많은 노력이 필요하다고 지적한다.

이와 관련, Aral은 경제적 인 활동을 예로 들며 "소셜 미디어에서의 광고 활동이 허위 뉴스를 확산하는 인센티브가되고있다. 왜냐하면 광고주에게는 뷰가 가장 중요한 지표이기 때문이다 "고 말했다. 즉 허위 뉴스를 줄이면 광고 비용도 줄어 버리기 때문에 플랫폼의 건전화를위한 인센티브가 생기기 어려운 것이다.

"단기적으로는 허위 뉴스의 확산을 막을 수에 금전적 인 단점이 발생하지만, 그렇다고 방치 해두면 장기적으로 문제가 발생한다. 예를 들어, 플랫폼이 허위 뉴스 및 부적 마라 대화로 가득 차 버리면, 사용자는 그 플랫폼을 일절 사용하지 않게되어 버릴지도 모른다. 그런 의미에서 Facebook과 Twitter는 장기적인 이익을 보장하기 위해이 문제를 해결 인센티브가 생각하고있다 "(Aral)

그러나 문제의 근간이 인간뿐만 아니라 알고리즘 및 광고료도 관계하고 있다고한다면 어떻게됩니까?

"중요한 것은 사용자의 손을 일단 중지하고 자신들의 행동이 어떤 영향을 가질 수있는 하나 생각한 것이지만, 행동 경제학의 세계에서 잘 알려진 바와 같이 이것은 엄청나게 어려운 일이다"고 Roy 는 말한다. 하지만 만약 그 과정이 쉽고 어디서나 도입해야하는 상황이라면 어떨까?

"슈퍼에 쇼핑하러 갈 때를 생각해 보면 좋겠다. 모든 음식은 제조 공정 및 제조 · 판매원, 견과류가 포함되어 있는지 등의 정보를 담은 라벨이 부착되어있다. 그러나 정보 는 그런 상표는 존재하지 않는다. "이 회사는 허위의 정보를 발신 할 수 많은지?" "이 매체는 3 개의 독립적 인 소스와 대조해 진위를 판정하고 있는지 (아니면 하나 만 가지)? ""몇 명이이 보도에 관련되어 있는가? "라는 물음에 대한 대답은 뉴스에 포함되지 않고, 우리 소비자는 단지 미디어가 제시하는 정보를 소비 할 수밖에 없다" (Aral)

또한 Aral는 정보가 Twitter에서 확산하기 전에 그 신뢰성을 측정 할 수있는 알고리즘을 Vosoughi가 고안했다고 말했다 (Vosoughi 본인은 겸손 때문인지, 단지 잊었는지, 취재시는이 점에 대해 언급하지 않았다). 그럼 왜 Facebook 또는 Google과 같이 방대한 데이터와 기계 학습 · 언어에 관한 지식을 가지고 플랫폼의 정보와 활동, 참여, 심지어 사이트 전체에 대해 다양한 변화를 거쳐 온 기업이 Vosoughi의 대처 하지 않겠 느냐는 점에 대해서는 의문이 남는다.

이 문제에 대해 논의가 활발하게 진행되고 있지만, 좀처럼 그것이 구체적인 행동으로는 연결되지 않은 것 같다. 또한 Roy는 Twitter와 Facebook 등의 사이트에서는 특효약 같은 해결책은 태어난 않을 것이라고 못 박는 다.

"소셜 미디어를 운영하기 위해서는 다양한 점에주의해야 말라. 플랫폼 자체는 물론 매우 중요하지만 그 외에도 콘텐츠를 만드는 사람과 광고주, 영향력, 그리고 사용자가 존재한다. 그들은 역할은 다르기 때문에 정책의 변경이나 새로운 룰 도구의 도입에 따른 영향은 이해 관계자에 의해 변화한다 "

"그 자체가 나쁜 것은 아니다. 왜냐하면 그렇지 이기에 우리 같은 연구자가 이러쿵 저러쿵 말할 수 있으니까"

데이터 세트에 대해 동일한 수 있겠다. 또한 본 연구에서 사용 된 데이터는 (Twitter의 동의하에) 공개 될 예정이므로 누구나 MIT의 연구 결과를 확인하고 더 고찰을 심화하고있다.

향후 본 문제에 대해 더 많은 연구가 이루어지기를 기대하고 싶다.