본문 바로가기
대메뉴 바로가기
KAIST
연구뉴스
유틸열기
홈페이지 통합검색
-
검색
메뉴 열기
%EC%B0%A8%EB%AF%B8%EC%98%81
최신순
조회순
인공지능으로 북한 등 경제지표 추정하다
유엔기구(UN)의 지속가능발전목표(SDGs)에 따르면 하루 2달러 이하로 생활하는 절대빈곤 인구가 7억 명에 달하지만 그 빈곤의 현황을 제대로 파악하기는 쉽지 않다. 전 세계 중 53개국은 지난 15년 동안 농업 관련 현황 조사를 하지 못했으며, 17개국은 인구 센서스(인구주택 총조사)조차 진행하지 못했다. 이러한 데이터 부족을 극복하려는 시도로, 누구나 웹에서 받아볼 수 있는 인공위성 영상을 활용해 경제 지표를 추정하는 기술이 주목받고 있다. 우리 대학 차미영-김지희 교수 연구팀이 기초과학연구원, 서강대, 홍콩과기대(HKUST), 싱가포르국립대(NUS)와 국제공동연구를 통해 주간 위성영상을 활용해 경제 상황을 분석하는 새로운 인공지능(AI) 기법을 개발했다고 21일 밝혔다. 연구팀이 주목한 것은 기존 통계자료를 기반으로 학습하는 일반적인 환경이 아닌, 기초 통계도 미비한 최빈국(最貧國)까지 모니터링할 수 있는 범용적인 모델이다. 연구팀은 유럽우주국(ESA)이 운용하며 무료로 공개하는 센티넬-2(Sentinel-2) 위성영상을 활용했다. 연구팀은 먼저 위성영상을 약 6제곱킬로미터(2.5×2.5㎢)의 작은 구역으로 세밀하게 분할한 후, 각 구역의 경제 지표를 건물, 도로, 녹지 등의 시각적 정보를 기반으로 AI 기법을 통해 수치화했다. 이번 연구 모델이 이전 연구와 차별화된 점은 기초 데이터가 부족한 지역에도 적용할 수 있게끔 인간이 제시하는 정보를 인공지능의 예측에 반영하는 `인간-기계 협업 알고리즘'에 있다. 즉, 인간이 위성영상을 보고 경제 활동의 많고 적음을 비교하면, 기계는 이러한 인간이 제공한 정보를 학습하여 각각의 영상자료에 경제 점수를 부여한다. 검증 결과, 기계학습만 사용했을 때보다 인간과 협업할 경우 성능이 월등히 우수했다. 이번 연구를 통해 연구팀은 기존 통계자료가 부족한 지역까지 경제분석의 범위를 확장하고, 북한 및 아시아 5개국(네팔, 라오스, 미얀마, 방글라데시, 캄보디아)에도 같은 기술을 적용하여 세밀한 경제 지표 점수를 공개했다. (그림 1) 이 연구가 제시한 경제 지표는 기존의 인구밀도, 고용 수, 사업체 수 등의 사회경제지표와 높은 상관관계를 보였으며, 데이터가 부족한 저개발국가에 적용 가능함을 연구팀은 확인했다. 이러한 변화탐지를 북한에 적용한 결과, 대북 경제제재가 심화된 2016년과 2019년 사이에 북한 경제에서 세 가지 경향을 발견할 수 있었다. 첫째, 북한의 경제 발전은 평양과 대도시에 더욱 집중되어 도시와 농촌 간 격차가 심화됐다. 둘째, 경제제재와 달러 외환의 부족을 극복하기 위해 설치한 관광 경제개발구에서는 새로운 건물 건설 등 유의미한 변화가 위성영상 이미지와 연구의 경제 지표 점수 변화에서 드러났다. 셋째, 전통적인 공업 및 수출 경제개발구 유형에서는 반대로 변화가 미미한 것으로 확인됐다. 연구에 참여한 우리 대학 전산학부·IBS 데이터사이언스그룹 CI 차미영 교수는 "전산학, 경제학, 지리학이 융합된 이번 연구는 범지구적 차원의 빈곤 문제를 다룬다는 점에서 중요한 의미가 있으며, 이번에 개발한 인공지능 알고리즘을 앞으로 이산화탄소 배출량, 재해재난 피해 탐지, 기후 변화로 인한 영향 등 다양한 국제사회 문제에 적용해 볼 계획이다ˮ 라고 말했다. 이 연구에는 경제학자인 우리 대학 기술경영학부 김지희 교수, 서강대 경제학과 양현주 교수, 홍콩과기대 박상윤 교수도 함께 참여하였다. 이들은 “이 모델은 저비용으로 개발도상국의 경제 상황을 상세하게 확인할 수 있어 국제개발협력(ODA) 사업에 도움을 줄 수 있을 것으로 예상된다”며 “이번 연구가 선진국과 후진국 간의 데이터 격차를 줄이고 유엔과 국제사회의 공동목표인 지속가능한 발전을 달성하는 데 기여할 수 있기를 바란다ˮ고 밝혔다. 위성영상과 인공지능을 활용한 SDGs 지표의 개발과 이의 정책적 활용은 국제적인 주목을 받고 있는 기술 분야 중 하나이며 한국이 앞으로 주도권을 가지고 이끌 수 있는 연구 분야이다. 이에 연구팀은 개발한 모델 코드를 무료로 공개하며, 측정한 지표가 여러 국가의 정책 설계 및 평가에 유용하게 사용될 수 있도록 앞으로도 기술을 개선하고 매해 새롭게 업데이트되는 인공위성 영상에 적용하여 공개할 계획이다. 한편 이번 연구 결과는 전산학부 안동현 박사과정, 싱가포르 국립대 양재석 박사과정이 공동 1저자로 국제 학술지 네이처 출판 그룹의 `네이처 커뮤니케이션즈(Nature Communications)'에 지난 10월 26일 자 게재됐다. (논문명: A human-machine collaborative approach measures economic development using satellite imagery, 인간-기계 협업과 위성영상 분석에 기반한 경제 발전 측정). 논문링크: https://www.nature.com/articles/s41467-023-42122-8
2023.11.21
조회수 4764
취침시간 지리/문화적 영향에 따라 더 늦어져
수면은 건강과 웰빙, 생산성에 큰 영향을 미치지만, 현대인이 얼마나 오래 그리고 잘 수면을 취하는지에 대해 정확히 보고되지 않았다. 수면의 양과 질은 개인의 선택일까, 아니면 문화와 지리와 같은 사회적 요인에 얼마나 영향을 받을까? 우리 대학 전산학부 차미영 교수가 이끄는 IBS(원장 노도영) 연구팀과 영국의 노키아 벨 연구소(Nokia Bell Labs)는 공동 연구를 통해 현대인의 ‘수면’이 어떤 사회적 및 개인적 요인에 영향을 받는다고 6일 밝혔다. 연구팀은 스마트 워치가 상용화되며 데이터의 대량 수집이 가능해진 기회에 주목했다. 노키아에서 개발한 스마트 워치를 착용한 미국, 캐나다, 스페인, 영국, 핀란드, 한국, 일본을 포함 11개국의 30,082명으로부터 4년간 수집한 5,200만 건의 데이터를 분석해 나라별 디지털 로그 기반 수면 패턴을 분석했다. 먼저 연구팀은 나라별 취침 시간, 기상 시간, 총 수면시간이 어떤지를 살폈다. 스마트워치 데이터에 기록된 취침 시간은 기존 설문지 기반 조사에 보고된 결과 대비 나라마다 수십 분에서 한 시간까지도 늦었다. 전 세계 평균 취침 시간은 자정(00:01)이고 기상 시간은 오전 7시 42분이었다. 이러한 차이는 설문조사가 가지는 편향과 함께 스마트 워치의 모션 센서가 뒤척임 없이 수면을 시작하는 순간을 정밀히 기록하는 데서 기인한다. 기상 시간은 나라별 비슷하지만 취침 시간은 지리적 문화적 영향을 상당히 받았다. 특히 국민 소득(GDP)이 높을수록 취침 시간이 늦어졌으며, 문화적으로 개인주의보다는 집단주의 지수가 높을수록 취침 시간이 늦었다. 조사된 나라 중 일본은 총 수면시간이 평균 7시간 미만으로 가장 적었으며 핀란드는 평균 수면시간이 8시간으로 가장 길었다. (그림 1) 연구팀은 이와 더불어 그동안 임상 연구에서 사용된 다양한 수면의 요소들을 정량화하여 수면 효율성(설명: 취침 중 깨지 않고 연속으로 자는 시간의 비율)과 같은 질적 요인을 분석했다. 빅데이터를 사용해 성향 점수 매칭 기법(propensity score matching methods, PSM)으로, 개인마다 문화적 요인을 고정한 상태에서 운동량을 늘어나면 수면이 어떻게 변하는지에 대한 가상 테스트를 진행했다. 그 결과 걸음 수가 늘수록 취침 시 더 빨리 잠들고 밤에 덜 깨는 긍정적 효과를 확인했다. 운동량은 수면의 질을 개선하지만, 총 수면시간을 늘리지는 않았다. 흥미롭게도 이러한 운동의 긍정적 효과는 국가별로 다르며, 특히 미국과 핀란드에서 효과가 강하게 나타난 반면 일본에서는 운동의 효과가 미미했다. 강원대학교 박성규 교수, 우리 대학 차미영 교수, 노키아 연구소의 퀘르시아 박사가 주저자로 참여한 이번 연구 결과는 국제 학술지 네이처 출판 그룹의 ‘사이언티픽 리포트(Scientific Reports)’에 게재됐다. (논문명: Social dimensions impact individual sleep quantity and quality, 사회적 차원이 개인의 수면 양과 질에 미치는 영향) 퀘르시아 박사는 “수면의 양과 질에 사회적 영향이 절반이나 차지했다. 고소득 국가에서 업무 스케줄이 과도하고 근무시간이 길어지며 취침 시간이 늦어지고, 집단주의가 강한 스페인과 일본은 사회적 요구에 부응하기 위해 취침 시간이 지연될 수 있다”고 연구 결과를 해석했다. 차미영 교수는 “수면은 웰빙, 비만, 치매 등과도 연관이 있다고 알려져 중요하다. 고령화 사회에서 국민의 건강 증진을 위해 적절한 수면의 양을 보장하고 수면의 질을 높이기 위해 개인의 노력은 물론 사회적 지원이 함께해야 한다”고 말했다. 연구팀은 이번 연구에서 개발한 수면의 지표를 쉽게 계산하는 코드를 무료로 공개해 첨단 수면 산업 발달에 기여하며, 다양한 생체 신호를 포함하는 수면에 대한 벤치마크 데이터도 추후 공개할 예정이다.
2023.07.06
조회수 3538
경제 발전할수록 도심 녹지가 시민 행복에 직결돼
경제가 발전한 도시일수록 도심 속 녹지 공간이 시민의 행복에 큰 영향을 준다는 연구결과가 나왔다. 우리 대학 전산학부 차미영 교수 (기초과학연구원 수리및계산과학연구단 데이터 사이언스 그룹 CI) 연구팀은 정우성 포스텍 산업경영공학과 교수, 원동희 미국 뉴저지공대 교수 등과의 공동연구를 통해 인공위성 이미지 빅데이터를 분석해 세계 60개 국가의 도시 녹지 공간을 찾아내고, 녹지와 시민 행복 사이의 상관관계를 분석했다. 공원, 정원, 천변 등 도시 속 녹지 공간은 미적 즐거움은 물론 신체활동 및 사회적 상호작용 촉진 등 육체와 건강에 유익한 영향을 준다. 도심 녹지와 시민 행복간의 상관관계를 규명하기 위한 많은 연구가 이뤄졌지만, 지금까지는 주로 일부 선진국을 대상으로만 연구가 진행됐다. 이 때문에 녹지의 긍정적인 영향이 범지구적인 현상인지, 또 국가의 경제적 상황에 따라 영향이 어떻게 달라지는지에 대해서는 파악이 어려웠다. 또한, 현장을 직접 방문하는 실태조사나, 항공사진은 대대적인 조사가 이뤄지기 어려워 데이터 수집의 한계가 있었다. 연구진은 유럽우주국(ESA)이 운용하는 고해상도 위성인 센티넬-2(Sentinel-2) 위성자료를 이용해 세계 60개국, 90개 도시의 녹지 면적을 조사했다. 인구 밀도가 가장 높은 도시(최소 국가 인구의 10%를 포함하는 도시)를 분석대상으로 삼았으며, 선명한 이미지를 위해 각 지역의 여름 시기를 분석했다. 북반구는 2018년 6~9월, 남반구는 2017년 12월~2018년 2월의 이미지가 쓰였다. 이후 정량화된 도시 별 녹지 면적 데이터를 국제연합(UN)의 2018 세계행복보고서 및 국가별 국내총생산(GDP, 2018년 기준 한국 11위) 자료와 교차하여 녹지와 경제의 시민 행복과의 상관관계를 총괄 분석했다. 그 결과, 국가의 경제적 상황과 무관하게 모든 도시에서 녹지의 면적이 넓을수록 시민 행복도가 높아지는 경향이 있음을 파악했다. 다만, 60개 국가 중 GDP 하위 30개 국가는 경제 성장이 행복과 더 밀접한 관련이 있었다. 1인당 국민총소득(GNI)이 3만8,000달러(약 4,223만 원)가 넘는 도시에서는 녹지 공간 확보가 경제 성장보다 행복에 더 중요한 요소로 작용했다. 우리나라의 경우 서울 지역이 분석에 쓰였으며, 도심 녹지의 면적이 과거보다 증가하며 행복도가 높아지는 경향이 나타났다. 차미영 교수는 “최근 위성영상 빅데이터를 활용해 사회 난제를 해결하려는 연구가 활발하게 진행되고 있다”며 “이번에 개발된 도구를 호수 및 해안 등 수생 환경의 면적을 정량화하는데 적용하고, 수생 환경과 시민 행복간의 상관관계를 분석하는 연구도 진행할 수 있을 것”이라고 말했다. 공동 교신저자인 정우성 포스텍 교수는 “경제 발전 단계에서는 경제 성장이 시민 행복에 가장 중요한 요소지만, 경제가 일정 수준 발전한 뒤에는 다른 사회적 요인이 행복에 더 직접적인 영향을 미친다”며 “이번 연구에서는 빅데이터를 분석해 도심 녹지 공간이 행복감을 향상시키는 사회적 요인 중 하나임을 확인한 것”이라고 설명했다. 이번 연구는 막연하게 연관 있을 것이라 추측해온 녹지, 경제 그리고 행복간의 상관관계를 정밀하게 분석하고, 모든 국가에 걸쳐 분석할 수 있는 도구를 마련했다는 의미가 있다. 연구진은 실제 시민의 삶에 도움 될 수 있는 데이터 기반 정책 수립이 필요하다고 제언했다. 연구결과는 데이터 과학 분야 국제학술지인 ‘EPJ 데이터 사이언스(EPJ Data Science, IF 5.08)’ 5월 30일자 온라인 판에 게재됐다. UNICEF에서 발간한 2022년 보고서(제목: Places and Spaces: Environments and children's well-being)에서는 전세계 어린이들의 행복도에 영향을 미치는 중요한 지표 중 하나로 연구팀이 제시한 Urban Green Space Index를 언급하고 있다. <참고> UNICEF 보고서: https://www.unicef-irc.org/places-and-spaces
2021.06.08
조회수 56871
세관 통관 속임수 적발하는 알고리즘 개발
우리대학 전산학부 차미영 교수 연구팀이 면세범위 초과 물품, 위장 반입, 원산지 조작 등 세관에서 벌어지는 불법적 행위를 빈틈없이 적발할 수 있는 기술을 개발했다. 차 교수는 기초과학연구원(IBS, 원장 노도영) 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI(Chief Investigator)을 맡아 세계관세기구(WCO‧World Customs Organization)와의 협업을 통해 스마트 관세 행정을 위한 알고리즘 개발을 마쳤다. 데이터 사이언스 그룹은 2019년 9월부터 WCO의 바꾸다(BACUDA) 프로젝트(*한국정부가 WCO에 공여하는 세관협력기금(Customs Cooperation Fund of Korea)로 설립, 운영)에 참여해 알고리즘 개발을 주도해왔다. WCO는 지난 2월 홈페이지 기사를 통해 “세관 데이터 분석(BAnd of CUstoms Data Analysis)의 앞 글자를 따서 바꾸다 프로젝트로 이름 지었다”며 “한글로는 ‘변화’를 뜻하는 것처럼 스마트 관세 체계로의 변화를 추구하는 회원국들을 돕기 위해 데이터과학자들과 협업을 시작했다”고 프로젝트의 취지를 알렸다. IBS가 WCO, 대만 국립성공대(NKCU‧National Cheng Kung University)와 함께 개발한 알고리즘 데이트(DATE DATE : Dual-Attentive Tree-aware Embedding for Customs Fraud Detection의 약자)는 불법적 행위 발생 가능성이 높으면서도 세수 확보에 도움이 되는 물품을 우선적으로 선별해 세관원에게 알린다. 기존 알고리즘은 세관 검사 대상만 추천했으나, 데이트는 검사 대상의 선별 이유까지 설명해줌으로써 사기 적발의 근거를 세관원이 충분히 확보할 수 있다는 특징이 있다. 우리대학 산업및시스템공학과(지식서비스공학대학원)을 졸업한 김선동 IBS 연구위원은 “설명력이 훌륭한 데이트는 인간개입(human-in-the-loop)으로 작동하는 현 세관 시스템에 가장 적합한 알고리즘”이라며 “저위험 물품 검사 에 쓰이는 세관원의 불필요한 노동을 줄이고, 복잡한 통관 프로세스를 효율화하는 데 도움이 될 것으로 기대하고 있다”고 설명했다. 바꾸다 그룹은 지난 3월 나이지리아의 틴캔(Tin Can)과 온네(Onne) 항구에 데이트를 시범 도입했다. 사전 테스트 결과, 데이트 도입으로 인해 기존의 전수 조사 통관 방법에 비해 40배 이상 효율적으로 세관 사기를 적발할 수 있음이 확인됐다. 시범운영을 마치면 알고리즘을 개선하고, 기술이전을 통해 WCO 회원국 대상으로 확대 적용해나갈 계획이다. 데이터 사이언스 그룹은 데이트 개발 성과를 오는 8월 데이터 마이닝 및 인공지능 분야의 최고 학술대회인 ACM SIGKDD(The Association for Computing Machinery’s Special Interest Group on Knowledge Discovery and Data Mining) 2020에서 발표할 예정이다. 차미영 CI는 “데이트는 세관원들의 물품 검사 및 적발된 수입자와의 소통을 도와줌으로써 스마트 세관 행정 정착에 큰 기여를 할 것”이라며 “향후 물품의 X선 이미지를 활용하거나, 전이 학습(Transfer learning)을 통해 여러 국가의 통관 데이터를 함께 활용하는 방법까지 추가해 알고리즘의 정확성을 높여나갈 계획”이라고 말했다.
2020.06.01
조회수 11063
이동만 교수, 빅데이터로 SNS 분석해 맞춤형 장소 제공 기술 개발
<좌측부터 전산학부 이동만 교수, 신병헌 박사과정 학생, 최인경 박사과정 학생> 전산학부 이동만 교수 연구팀이 소셜 네트워크 서비스(SNS)의 사진과 글을 기반으로 장소의 특성을 분석해 사용자에게 맞춤형 장소를 제공하는 기술을 개발했다. 이 기술은 현재의 위치기반 추천서비스를 인공지능형 개인비서서비스로 도약시키는 원천기술이 될 것으로 기대된다. 이번 연구는 기존 위치기반 장소 검색 및 추천서비스의 검색 수준을 향상시켜 사용자들이 장소를 선택하는 기준을 다양하게 적용시킬 수 있다. 사용자의 트렌드를 반영해 실시간으로 변화된 장소 추천을 할 수 있을 것으로 보인다. 문화기술대학원 이원재, 박주용 교수와 전산학과 차미영 교수가 공동으로 참여한 이번 연구의 API(응용 프로그래밍 인터페이스)는 http://placeness.kaist.ac.kr:8080/ 을 통해 공개됐고 관련 정보는 http://placeness.kaist.ac.kr/wiki/doku.php 에서 열람할 수 있다. 맛집 추천서비스, 소셜 커머스 등 위치를 기반으로 정보 검색 및 추천서비스를 제공하는 업체들은 주로 고객의 후기를 수집하거나 직접 방문을 통해 경험한 내용을 토대로 음식점 혹은 매장을 평가한다. 이는 비교적 정확한 정보를 제공하지만 시간적, 경제적 비용이 많이 소모된다. 또한 사용자 전체의 관심과 선택의 평균에 중점을 두기 때문에 사용자 개인의 특성을 충분히 고려하지 못한다는 한계가 있다. 시간이 지날수록 사용자는 평균 중심의 예상 가능한 선택지를 추천받을 확률이 높아진다. 따라서 같은 장소라도 사용자가 방문하고자 하는 목적이 다르기 때문에(모임, 상견례, 소개팅 등) 방문 목적과 사회적 맥락을 파악할 수 있는 추가적인 기능이 필수적이다. 이를 위해 기본적으로 제공되는 정보 외에도 실제 사람들이 각 장소에서 어떤 세부적 활동을 하며 공간을 소비했는지에 대한 데이터 수집이 필요하다. 연구팀은 문제 개선을 위해 특정 소셜 네트워크 서비스(인스타그램)에 올라온 사진과 텍스트 자료를 바탕으로 이를 분석하는 알고리즘을 개발했다. 기존에 존재하는 딥러닝 방식을 이용해 사진을 분석하는 기술과 연구팀이 새로 개발한 텍스트 분석 기술인 워드백(Wordbag) 기술을 결합했다. 특정 상황이나 분위기에 사용되는 단어들을 분석하고 단어마다 가중치를 둬 분류하는 기술이다. 연구팀은 API에서 주요 연구 이슈에 따라 크게 4개의 세부 분야별 정보를 제공한다. ▲상위 장소의 장소성(장소의 성격 : placeness), ▲상위 장소 내에 있는 세부 장소의 장소성 추론, ▲감성분석 기반의 장소 분위기 추론, ▲사용자와 장소성 간 연관성을 제공한다. 연구팀의 API는 SNS에 존재하는 연구개발 대상으로 지정된 특정 상위장소(코엑스. 아이파크 몰) 및 그 내부의 세부장소에 대해 언급된 데이터를 분석해 행위, 방문자, 시간, 분위기 등 다양한 관점에서 공간의 활용 가능성을 제공한다. 이는 같은 장소라도 사용자가 시간대, 목적에 따라 다르게 활용했던 이력이나 기존 서비스에서 제공이 어려웠던 분위기(ex. 밝은, 전통적인 등)나 방문 목적(ex. 데이트, 공부, 회의)을 데이터로 수집할 수 있기 때문에 사용자의 의도에 따라 장소를 추천할 수 있다. 이 교수는 “이 연구에서 개발된 API를 통해 기존의 위치기반 장소 검색 및 추천 서비스의 검색 수준을 향상시키고 방문자들의 트렌드 변화에 따라 자동으로 변화된 장소를 추천할 수 있다”고 말했다. 또한 “기존 비정형 텍스트 데이터 분석의 한계를 극복하기 위해 사진과 텍스트를 동시에 분석해 공간에 대한 사회적 정보를 추론할 수 있어 현재의 위치기반 추천 서비스가 인공지능형 개인비서서비스로 도약하는 핵심 기술이 될 것이다”고 말했다. 이번 연구는 과학기술정보통신부 디지털콘텐츠 원천기술개발사업의 지원을 받아 수행됐다.
2017.08.29
조회수 17825
SNS에서 떠도는 루머를 구분할 수 있을까?
권세정 박사과정 학생(좌)과 차미영 교수(우) - “루머는 팔로워 수가 적은 사용자들을 중심으로 산발적으로 전파” -- 2006년 이후 발생한 100여개의 트위터 상 미국 루머 사례 조사 - 트위터, 페이스북 등 SNS상에서 떠도는 정보의 진위여부를 가릴 수 있을까? 우리 학교 문화기술대학원 차미영 교수 연구팀(제1저자 권세정 박사과정)은 서울대 정교민 교수 및 마이크로소프트 아시아 연구소의 Wei Chen, Yajun Wang 박사와 공동연구를 통해 트위터 내에서 광범위하게 전파되는 정보의 진위 여부를 90%까지 정확하게 구분해낼 수 있는 기술을 개발했다. 이번 연구를 통해 루머에 대해 SNS 데이터를 바탕으로 한 새로운 수리적 모델과 네트워크 구조 및 언어적 특징을 도출함은 물론, 향후 인터넷 루머의 특성과 규제에 도움이 되는 루머 구분 기술을 확보하는 계기가 될 것으로 기대된다. SNS는 누구에게나 손쉽게 정보의 생산과 유통 및 전파 과정에 참여하는 긍정적인 기능을 한다. 하지만 역기능으로 검증되지 않은 정보가 빠르게 확산되어 개인·기업·국가에 해를 끼칠 수 있는 악성 루머의 발판을 마련하기도 한다. 따라서 인터넷 루머를 감지하고 확산을 방지하고자 하는 노력이 중요하다. 차 교수 연구팀은 2006년에서 2009년 사이 미국 트위터에서 광범위하게 전파된 100개 이상의 사례를 조사해 루머의 특성을 분석했다. 수집된 자료는 정치·IT·건강·연예인 등 다양한 분야를 포함하며, 이러한 분석을 통해 90%의 정확도로 루머 여부를 판단할 수 있었다. 특히 특정 인물이나 기관의 비방이나 욕설이 포함된 루머의 경우 더욱 높은 정확도로 루머 여부의 판단이 가능했다. 연구팀은 일반 정보의 전파와는 확연히 다른 루머 전파의 특징을 크게 세 가지로 분류했다. 첫째, 루머는 일반 정보와는 달리 지속적으로 전파되는 경향을 보인다. 뉴스와 같은 일반 정보의 경우 한 번의 광범위한 전파 이후 미디어 내에서 거의 언급되지 않지만, 루머는 수년간의 긴 기간 동안 지속적으로 언급된다. 둘째, 루머의 전파는 서로 연관이 없는 임의 사용자들의 산발적인 참여해 이뤄진다. 일반 정보는 온라인 내의 친구관계를 통해 전파의 경로가 유추되는 반면 루머는 연결되지 않은 개개인의 참여로 이루어지는 특징을 보였다. 아울러 루머는 인지도가 낮은 사용자들로부터 시작돼 유명인에게로 전파된다. 이 현상은 연예인이나 정치인과 관련된 루머에서 자주 관찰됐다. 셋째, 루머는 일반 정보와 다른 언어적 특성을 보인다. 루머는 정보의 진위 여부를 의심·부정·유추하는 심리학적 과정과 연관된 단어(아니다, 사실일지는 모르겠지만, 확실치는 않지만, 내 생각에는, 잘 기억나진 않지만) 사용이 월등히 높다. 연구팀이 루머로 구분한 사례 중에는 미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있고 미국 시민권을 부당 취득했다는 내용 등 그를 음해하는 정치적 루머도 포함됐다. 또 영화배우 니콜 키드먼이 성전환 수술을 했으며 그녀가 양성애자라고 언급한 사례 역시 연구팀의 기술을 통해 루머로 명백히 구분됐다. 차 교수는 “이 연구는 통계·수학적 모델은 물론 사회·심리학 이론의 융합 연구로 사회적으로 주목을 받는 루머의 특성을 풍부한 데이터를 통해 도출했다”며 “루머 전파 극초기에 해당 정보의 진위여부를 판별하는 것은 아직 어렵지만, 일정시간 경과 혹은 정보확산이 이루어질 경우 해당 빅데이터를 기반으로 하여 진위여부를 판단하는 것이 가능하다"고 밝혔다. 이번 연구결과는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야의 최고 학술대회인 IEEE 데이터마이닝 국제 회의(IEEE International Conference on Data Mining)에서 발표됐다. 또 해외 유명 과학 잡지인 New Scientist에 Bigfoot found? AI tool sifts fact from myth on Twitter 라는 제목으로 소개됐으며 Washington Post에도 Korean scientists create a tool that can help separate fact from fiction on Twitter의 기사명으로 소개됐다. 그림1. 각 주제 별로 관련 내용을 트위터 내에서 언급한 수(x축: 관찰일, y축:트윗수). 루머의 경우 일반적인 정보가 한 번의 광범위한 전파 후 거의 퍼지지 않는 것과 달리 지속적으로 언급되고 있음을 보여준다. 그림2. 트위터 내 사용자들 간 정보 전파를 네트워크의 형식으로 표현한 확산 네트워크. 각 점은 사용자를 의미하며, 선은 사용자들 간의 관계를 통한 정보 확산이 있었음을 의미한다.
2014.01.09
조회수 20081
어떻게 트위터가 급성장 할 수 있었나?
- 트위터 네트워크의 성장은 오프라인 사회관계망에서 점차적으로 시작 - 전통적인 미디어의 영향력으로 네트워크가 폭발적으로 성장함을 관찰 트위터가 세계적으로 유명세를 타는 데는 전통적인 사회관계망의 역할뿐만 아니라 미디어의 주목이 커다란 기여를 했다는 사실이 국내연구진에 의해 규명됐다. 우리 학교 문화기술대학원 차미영 교수가 최근 MIT 마르타 곤잘레즈(Marta Gonzalez) 연구팀과 함께 오프라인에서 인간관계에 절대적인 영향을 미치는 지역, 사회, 경제적 요인과 더불어 미디어의 주목이 초기 트위터의 성장에 커다란 영향을 미쳤음을 분석해냈다. 대다수 신기술처럼 트위터는 가장 먼저 젊고, 과학기술을 잘 이용하는 샌프란시스코와 보스톤의 사용자들에게 먼저 도입됐다. 그다음 단계에서는 인접도시로 점진적으로 확산되기 시작해 오프라인 사회관계망이 정보전파에 주된 역할을 했음이 연구결과 조사됐다. 예를 들어 처음 도입한 두 도시와 지역적으로 근거리에 있는 캘리포니아의 버클리와 매사추세츠 주의 소머빌의 사용자들이 트위터를 도입했고, 이후에는 산타페, LA 등을 통해 최종적으로 팜비치, 뉴왁 등 전국으로 확산됨을 보여줬다. 이번 연구에서 사회관계망과 더불어 주목한 것은 텔레비전이나 신문과 같은 전통미디어의 역할이다. 차 교수 연구팀은 매주 구글 뉴스를 검색해 기사에 트위터가 몇 번이나 언급되었는지 데이터를 모으고 또 같은 시점의 트위터 사용자 수를 조사했다. 그리고 나서 뉴스기사에서의 트위터 언급 횟수와 사용자 수의 상관관계를 분석한 결과 이 둘은 같은 추이를 보인 것으로 나타나 미디어가 트위터의 성장에 커다란 영향을 준 것으로 결론을 내렸다. 차 교수팀은 이와 함께 트위터의 성장에 대한 미디어의 영향을 알아보기 위해 또 다른 흥미로운 사례에 주목했다. 2009년 4월 할리우드 영화배우 애쉬튼 커쳐는 CNN에 출연해 누가 먼저 백만명의 팔로어를 갖게 될 것인지에 대한 내기를 제안했고, 약 이틀 만에 백만명의 팔로어를 보유하게 됐다. 또한 오프라 윈프리가 첫 번째 트윗을 하는 것이 미디어에서 다뤄지는데 이는 또 다시 트위터 사용자수의 급격한 증가를 불러일으킨 계기가 됐다. KAIST 차미영 교수가 MIT연구팀과 공동으로 실시한 이번 연구는 2006년부터 2009년까지의 트위터 데이터를 바탕으로 미국 내 408개 도시에서의 트위터 성장세를 분석해, 이를 토대로 전염병의 확산모델과 유사한 사회관계망 기반의 확산모델을 수립해 밝혀냈다. 한편, 이번 연구결과는 미국의 온라인 과학전문지 ‘공중과학도서관 원(Public Library of Science ONE)’ 저널에 곧 게재될 예정이며 MIT news, 미국 과학전문 소셜미디어 Mashable.com, 그리고 MSNBC.com등에도 소개됐다. [그림.1] 해당 시간대에 각 지역별로 최종 가입자의 13.5%에 해당하는 ‘크리티컬 매스’에 해당하는 사용자들이 가입을 한 지역이 검은 원으로 표기된다. 작은 회색원은 이미 크리티컬 매스에 이른 지역을 표기한다. 트위터의 첫 도입은 샌프란시스코에서 시작되었으며 다음으로 주변 도시들에서 도입되는 것을 통해, 오프라인 사회관계망이 확산에 중요함을 시사한다. 반면 보스톤과 같은 지역에서도 초기 도입이 되었으며 이는 사회관계망 뿐만 아니라 인터넷과 같은 매체의 영향을 시사한다. [그림.2] a. 그래프에서 검은 실선은 주별 최대가입자수를 1.0으로 보았을 때 매주별 트위터 가입자수의 변화를 나타낸다. 빨간실선은 같은 해당주에 대해 구글 뉴스에서 트위터가 언급된 비율을 나타낸다. 트위터 서비스가 시작된지 140주 이후에 각종 미디어를 통해 트위터가 많이 언급됨을 볼 수 있고, 따라서 트위터의 주별 가입자수 역시 급격히 상승하는 트렌드를 볼 수 있다. b. 그래프는 매주 트위터에 가입한 총사용자수를 나타내는 검은 선과 이를 예측하는 다양한 모델의 결과를 보여주는 점선을 보여준다. 전통적인 확산모델의 경우 (파란점선) 초기 트위터의 성장세는 잘 예측하지만, 추후 미디어의 영향력 이후의 급성장을 보여주지 못한다. 구글 검색 결과를 반영하여 확산모델을 변형하면 (검은점선 및 노란점선) 실제 데이터와 유사한 트렌드를 예측할 수 있다. [동영상링크]http://www.youtube.com/watch?feature=player_embedded&v=Ncon_z67VQs 지도상의 각 원은 트위터 사용자들이 있는 미국 내 도시를 의미한다. 시간에 따라 더욱 많은 사용자가 트위터에 가입할수록 원의 크기가 커진다. 각 지역별로 최종 가입자의 13.5%에 해당하는 ‘크리티컬 매스’에 해당하는 사용자들이 가입을 하면 원은 빨간색으로 표기된다. 화면 중앙에 하얀선으로 표기되는 그래프는 시간에 따른 트위터의 주별 가입자수를 의미한다.
2012.01.04
조회수 13776
KAIST 출신 차미영 박사, 트위터 사용자 영향력 분석
- 트위터 팔로워 숫자는 영향력 결정기준으로 무의미 - 팔로워 수에 집착하는 트위터 문화나 현재 광고 기법의 오류를 지적 소셜 미디어(Social media)의 직접링크는 우정에서 공통의 관심사 혹은 최신뉴스나 유명인의 가십까지 모든것을 얻을 수 있다. 이런 직접링크는 정보의 흐름을 결정하며 다른 사람에 대한 사용자의 영향력을 암시하기도 한다. 이것은 바이럴 마케팅(Viral Marketing)과 사회학 분야에서 중요한 개념이다. 대표적인 소셜 미디어인 트위터 연구를 통해 ‘많은 팔로워(follower)를 가진 사람이 인기있는 트위터일 수 있지만 그들의 영향력과는 반드시 관계있는 것은 아니다‘라는 연구결과가 나왔다. 이 연구는 KAIST 전산학과를 졸업학고 독일의 저명한 막스 플랑크(Max Planck)연구소에서 박사후 연구원으로 있는 차미영 박사를 주축으로 하는 연구팀이 트위터 사용자의 영향력(influence)을 어떻게 측정할 수 있을까에 대한 주제를 다룬 것이다. 5천만의 트위터 사용자 정보(User Accounts)와 20억개의 소셜 팔로워 링크(Social Follow Links), 그리고 17억개의 트윗메시지(Tweets) 등 대용량 데이터가 연구자료로 사용됐다. 차 박사팀은 트위터의 이 자료를 통해 트위터의 세가지 기능적인 측면, 트위터 사용자는 정보를 받을 수 있고(indegree), 재전송하고(retweet), 인용하는(mention) 측면에서 영향력을 분석, 비교해 흥미있는 사실을 발견했다. 가장 많이 보는 트위터, 가장 많이 재전송되는 트위터, 가장 많이 언급되는 트위터는 연관성 없이 각각 별개의 요소로 영향력을 행사하고 있었다. 이 세가지 측면에서 선정된 20개의 트위터 가운데 중복된 트윗은 단 두 개뿐이었다. 또한 다른 사람에게 중대한 영향력을 행사하는 트위터 사용자는 전문가로서 특정한 분야에 대해 영향력을 행사하지 않고 광범위한 주제에 걸쳐 중요한 영향력을 행사하고 있었다. 이번결과로 연구팀은 세 가지 결론은 얻었다. 첫째, 많은 팔로워를 가진 유명한 사용자는 정보의 재전송(retweet)와 인용(mention) 측면에서 살펴보면 큰 영향력이 있지 않다. 둘째, 대부분의 영향력 있는 사용자는 다양한 토픽에서 큰 영향력을 가지고 있다.셋째, 영향력은 즉각적으로 또한 우연히 얻어지는 것이 아니라 하나의 주제에 대해 받는 정보의 조건인 트위터 수를 제한하는 일련의 노력으로 얻어진다. 즉, 어떤 주제에 관심이 있을 경우 무작위로 모든 트위터로부터 정보를 제공받지 않고 선별해서 받는다. 해당 연구에서는 이를 ‘백만 팔로워의 오류(The Million Follower Fallacy)‘라고 말한다. 차 박사팀은 이러한 발견이 바이럴 마켓팅에 관한 새로운 견해를 제시하고 있다. 즉, 인기있는 트위터(블로그)를 통한 바이럴 마켓팅 전략이 반드시 효율적이지 않을 수 있다는 견해다. 정보를 받아들이는 표면적인 수치만으로는 사용자의 영향력을 가늠하기 어렵다는 것이다. KAIST 전산학과 문수복 교수는 “차 박사의 이번 연구는 소셜 미디어 분야에서 트위터가 가지는 무한한 가능성을 제시한 논문으로써 경제학, 사회학, 전산학 등 다양한 학문 분야 간 융합 연구의 디딤돌이 될 연구”이라고 말했다. 특히 트윗 메시지 데이터는 트위터 서비스의 초반부터 모든 사용자가 적은 공개 메시지를 포함하고 있어 앞으로 사회과학의 다양한 문제들을 해결할 수 있는 가능성을 지니고 있다. 이러한 데이터는 2009년 여름 트위터의 허가 아래 수집된 것으로 추후 연구를 위해 http://twitter.mpi-sws.org/에서 공개할 예정이다. 차 박사는 현재 트위터 데이터를 활용하여 이미 국내외 과학자들과 협업을 하고 있다. 이 중 KAIST 전산학과 오혜연 교수와는 트위터의 사용을 통해 행복(happiness)이 전파될 수 있는지를 살펴봄으로써 소셜 미디어가 가진 심리적 기능성을 연구하고 있다. 또한 KAIST 전산학과 정교민 교수와 트위터와 같은 쇼셜 미디어에서 메시지를 더 빠르게 전파시키거나 혹은 메시지의 전파를 막을 수 있는 기법에 대한 연구를 진행중이다. 이번 연구는 뉴욕타임즈와 ReadWriteWeb.com과 같은 유명 블로그 및 소셜 미디어에서 소개된 바 있다. 차 박사는 2008년 2월 KAIST 전산학과 문수복 교수의 ‘첨단 네트워킹 연구실’에서 박사과정을 마쳤다. <뉴욕타임즈> http://www.nytimes.com/external/readwriteweb/2010/03/19/19readwriteweb-the-million-follower-fallacy-audience-size-d-3203.html http://www.readwriteweb.com/archives/the_million_follower_fallacy_audience_size_doesnt_prove_influence_on_twitter.php <용어설명> ○소셜 미디어(Social media) : 쌍방향 커뮤니케이션이 가능한 인터넷 미디어를 말한다. 신문이나 방송처럼 일방향으로 정보를 전달하는 것이 아니라 사용자들이 참여하고 그 정보를 공유할수 잇도록 만드는 참여형 미디어로 트위터, 블로그, 유투브, UCC 등이 있다. 사람들이 자신의 생각과 의견, 경험, 관점 등을 서로 공유하고 참여하기 위해 사용하는 개방화된 온라인 툴과 미디어 플랫폼으로 가이드와이어 그룹의 창업자인 크리스 쉬플리가 처음 이 용어를 사용하였다. 소셜미디어는 그 자체가 일종의 유기체처럼 성장하기 때문에 소비와 생산의 일반적인 매커니즘이 동작하지 않으며, 양방향성을 활용하여 사람들이 참여하고 정보를 공유하며 사용자들이 만들어 나가는 미디어를 소셜미디어라 부른다. ○ 바이럴 마케팅(Viral Marketing) : 마케팅의 주체가 불특정 다수에게 대량의 메시지를 전달하는 대신 소비자에게 직접 홍보행위를 하도록 한 마케팅. 특정 인플루엔자에 의해서 불러일으킬 수 있는 특정 정보나 이슈가 생성되고 바이러스처럼 전파되어 메가 트랜드로 변이하는 것. 어떤 제품과 서비스에 대해 두 사람 이상의 사람들이 주고받는 커뮤니케이션. ○ indegree : (graph theory)The number of edges directed into a vertex in a directed graph. 이 논문에서는 팔로워 링크를 그래프로 표현할 때 indegree로 표현함.
2010.03.31
조회수 23802
<<
첫번째페이지
<
이전 페이지
1
>
다음 페이지
>>
마지막 페이지 1