-
SNS에서 떠도는 루머를 구분할 수 있을까?
권세정 박사과정 학생(좌)과 차미영 교수(우)
- “루머는 팔로워 수가 적은 사용자들을 중심으로 산발적으로 전파” -- 2006년 이후 발생한 100여개의 트위터 상 미국 루머 사례 조사 -
트위터, 페이스북 등 SNS상에서 떠도는 정보의 진위여부를 가릴 수 있을까?
우리 학교 문화기술대학원 차미영 교수 연구팀(제1저자 권세정 박사과정)은 서울대 정교민 교수 및 마이크로소프트 아시아 연구소의 Wei Chen, Yajun Wang 박사와 공동연구를 통해 트위터 내에서 광범위하게 전파되는 정보의 진위 여부를 90%까지 정확하게 구분해낼 수 있는 기술을 개발했다.
이번 연구를 통해 루머에 대해 SNS 데이터를 바탕으로 한 새로운 수리적 모델과 네트워크 구조 및 언어적 특징을 도출함은 물론, 향후 인터넷 루머의 특성과 규제에 도움이 되는 루머 구분 기술을 확보하는 계기가 될 것으로 기대된다.
SNS는 누구에게나 손쉽게 정보의 생산과 유통 및 전파 과정에 참여하는 긍정적인 기능을 한다. 하지만 역기능으로 검증되지 않은 정보가 빠르게 확산되어 개인·기업·국가에 해를 끼칠 수 있는 악성 루머의 발판을 마련하기도 한다. 따라서 인터넷 루머를 감지하고 확산을 방지하고자 하는 노력이 중요하다.
차 교수 연구팀은 2006년에서 2009년 사이 미국 트위터에서 광범위하게 전파된 100개 이상의 사례를 조사해 루머의 특성을 분석했다. 수집된 자료는 정치·IT·건강·연예인 등 다양한 분야를 포함하며, 이러한 분석을 통해 90%의 정확도로 루머 여부를 판단할 수 있었다. 특히 특정 인물이나 기관의 비방이나 욕설이 포함된 루머의 경우 더욱 높은 정확도로 루머 여부의 판단이 가능했다. 연구팀은 일반 정보의 전파와는 확연히 다른 루머 전파의 특징을 크게 세 가지로 분류했다.
첫째, 루머는 일반 정보와는 달리 지속적으로 전파되는 경향을 보인다. 뉴스와 같은 일반 정보의 경우 한 번의 광범위한 전파 이후 미디어 내에서 거의 언급되지 않지만, 루머는 수년간의 긴 기간 동안 지속적으로 언급된다.
둘째, 루머의 전파는 서로 연관이 없는 임의 사용자들의 산발적인 참여해 이뤄진다. 일반 정보는 온라인 내의 친구관계를 통해 전파의 경로가 유추되는 반면 루머는 연결되지 않은 개개인의 참여로 이루어지는 특징을 보였다. 아울러 루머는 인지도가 낮은 사용자들로부터 시작돼 유명인에게로 전파된다. 이 현상은 연예인이나 정치인과 관련된 루머에서 자주 관찰됐다.
셋째, 루머는 일반 정보와 다른 언어적 특성을 보인다. 루머는 정보의 진위 여부를 의심·부정·유추하는 심리학적 과정과 연관된 단어(아니다, 사실일지는 모르겠지만, 확실치는 않지만, 내 생각에는, 잘 기억나진 않지만) 사용이 월등히 높다.
연구팀이 루머로 구분한 사례 중에는 미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있고 미국 시민권을 부당 취득했다는 내용 등 그를 음해하는 정치적 루머도 포함됐다. 또 영화배우 니콜 키드먼이 성전환 수술을 했으며 그녀가 양성애자라고 언급한 사례 역시 연구팀의 기술을 통해 루머로 명백히 구분됐다.
차 교수는 “이 연구는 통계·수학적 모델은 물론 사회·심리학 이론의 융합 연구로 사회적으로 주목을 받는 루머의 특성을 풍부한 데이터를 통해 도출했다”며 “루머 전파 극초기에 해당 정보의 진위여부를 판별하는 것은 아직 어렵지만, 일정시간 경과 혹은 정보확산이 이루어질 경우 해당 빅데이터를 기반으로 하여 진위여부를 판단하는 것이 가능하다"고 밝혔다.
이번 연구결과는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야의 최고 학술대회인 IEEE 데이터마이닝 국제 회의(IEEE International Conference on Data Mining)에서 발표됐다. 또 해외 유명 과학 잡지인 New Scientist에 Bigfoot found? AI tool sifts fact from myth on Twitter 라는 제목으로 소개됐으며 Washington Post에도 Korean scientists create a tool that can help separate fact from fiction on Twitter의 기사명으로 소개됐다.
그림1. 각 주제 별로 관련 내용을 트위터 내에서 언급한 수(x축: 관찰일, y축:트윗수). 루머의 경우 일반적인 정보가 한 번의 광범위한 전파 후 거의 퍼지지 않는 것과 달리 지속적으로 언급되고 있음을 보여준다.
그림2. 트위터 내 사용자들 간 정보 전파를 네트워크의 형식으로 표현한 확산 네트워크. 각 점은 사용자를 의미하며, 선은 사용자들 간의 관계를 통한 정보 확산이 있었음을 의미한다.
2014.01.09
조회수 20058