-
세관 통관 속임수 적발하는 알고리즘 개발
우리대학 전산학부 차미영 교수 연구팀이 면세범위 초과 물품, 위장 반입, 원산지 조작 등 세관에서 벌어지는 불법적 행위를 빈틈없이 적발할 수 있는 기술을 개발했다.
차 교수는 기초과학연구원(IBS, 원장 노도영) 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI(Chief Investigator)을 맡아 세계관세기구(WCO‧World Customs Organization)와의 협업을 통해 스마트 관세 행정을 위한 알고리즘 개발을 마쳤다.
데이터 사이언스 그룹은 2019년 9월부터 WCO의 바꾸다(BACUDA) 프로젝트(*한국정부가 WCO에 공여하는 세관협력기금(Customs Cooperation Fund of Korea)로 설립, 운영)에 참여해 알고리즘 개발을 주도해왔다.
WCO는 지난 2월 홈페이지 기사를 통해 “세관 데이터 분석(BAnd of CUstoms Data Analysis)의 앞 글자를 따서 바꾸다 프로젝트로 이름 지었다”며 “한글로는 ‘변화’를 뜻하는 것처럼 스마트 관세 체계로의 변화를 추구하는 회원국들을 돕기 위해 데이터과학자들과 협업을 시작했다”고 프로젝트의 취지를 알렸다.
IBS가 WCO, 대만 국립성공대(NKCU‧National Cheng Kung University)와 함께 개발한 알고리즘 데이트(DATE DATE : Dual-Attentive Tree-aware Embedding for Customs Fraud Detection의 약자)는 불법적 행위 발생 가능성이 높으면서도 세수 확보에 도움이 되는 물품을 우선적으로 선별해 세관원에게 알린다.
기존 알고리즘은 세관 검사 대상만 추천했으나, 데이트는 검사 대상의 선별 이유까지 설명해줌으로써 사기 적발의 근거를 세관원이 충분히 확보할 수 있다는 특징이 있다.
우리대학 산업및시스템공학과(지식서비스공학대학원)을 졸업한 김선동 IBS 연구위원은 “설명력이 훌륭한 데이트는 인간개입(human-in-the-loop)으로 작동하는 현 세관 시스템에 가장 적합한 알고리즘”이라며 “저위험 물품 검사 에 쓰이는 세관원의 불필요한 노동을 줄이고, 복잡한 통관 프로세스를 효율화하는 데 도움이 될 것으로 기대하고 있다”고 설명했다.
바꾸다 그룹은 지난 3월 나이지리아의 틴캔(Tin Can)과 온네(Onne) 항구에 데이트를 시범 도입했다. 사전 테스트 결과, 데이트 도입으로 인해 기존의 전수 조사 통관 방법에 비해 40배 이상 효율적으로 세관 사기를 적발할 수 있음이 확인됐다. 시범운영을 마치면 알고리즘을 개선하고, 기술이전을 통해 WCO 회원국 대상으로 확대 적용해나갈 계획이다.
데이터 사이언스 그룹은 데이트 개발 성과를 오는 8월 데이터 마이닝 및 인공지능 분야의 최고 학술대회인 ACM SIGKDD(The Association for Computing Machinery’s Special Interest Group on Knowledge Discovery and Data Mining) 2020에서 발표할 예정이다.
차미영 CI는 “데이트는 세관원들의 물품 검사 및 적발된 수입자와의 소통을 도와줌으로써 스마트 세관 행정 정착에 큰 기여를 할 것”이라며 “향후 물품의 X선 이미지를 활용하거나, 전이 학습(Transfer learning)을 통해 여러 국가의 통관 데이터를 함께 활용하는 방법까지 추가해 알고리즘의 정확성을 높여나갈 계획”이라고 말했다.
2020.06.01
조회수 11069
-
SNS에서 떠도는 루머를 구분할 수 있을까?
권세정 박사과정 학생(좌)과 차미영 교수(우)
- “루머는 팔로워 수가 적은 사용자들을 중심으로 산발적으로 전파” -- 2006년 이후 발생한 100여개의 트위터 상 미국 루머 사례 조사 -
트위터, 페이스북 등 SNS상에서 떠도는 정보의 진위여부를 가릴 수 있을까?
우리 학교 문화기술대학원 차미영 교수 연구팀(제1저자 권세정 박사과정)은 서울대 정교민 교수 및 마이크로소프트 아시아 연구소의 Wei Chen, Yajun Wang 박사와 공동연구를 통해 트위터 내에서 광범위하게 전파되는 정보의 진위 여부를 90%까지 정확하게 구분해낼 수 있는 기술을 개발했다.
이번 연구를 통해 루머에 대해 SNS 데이터를 바탕으로 한 새로운 수리적 모델과 네트워크 구조 및 언어적 특징을 도출함은 물론, 향후 인터넷 루머의 특성과 규제에 도움이 되는 루머 구분 기술을 확보하는 계기가 될 것으로 기대된다.
SNS는 누구에게나 손쉽게 정보의 생산과 유통 및 전파 과정에 참여하는 긍정적인 기능을 한다. 하지만 역기능으로 검증되지 않은 정보가 빠르게 확산되어 개인·기업·국가에 해를 끼칠 수 있는 악성 루머의 발판을 마련하기도 한다. 따라서 인터넷 루머를 감지하고 확산을 방지하고자 하는 노력이 중요하다.
차 교수 연구팀은 2006년에서 2009년 사이 미국 트위터에서 광범위하게 전파된 100개 이상의 사례를 조사해 루머의 특성을 분석했다. 수집된 자료는 정치·IT·건강·연예인 등 다양한 분야를 포함하며, 이러한 분석을 통해 90%의 정확도로 루머 여부를 판단할 수 있었다. 특히 특정 인물이나 기관의 비방이나 욕설이 포함된 루머의 경우 더욱 높은 정확도로 루머 여부의 판단이 가능했다. 연구팀은 일반 정보의 전파와는 확연히 다른 루머 전파의 특징을 크게 세 가지로 분류했다.
첫째, 루머는 일반 정보와는 달리 지속적으로 전파되는 경향을 보인다. 뉴스와 같은 일반 정보의 경우 한 번의 광범위한 전파 이후 미디어 내에서 거의 언급되지 않지만, 루머는 수년간의 긴 기간 동안 지속적으로 언급된다.
둘째, 루머의 전파는 서로 연관이 없는 임의 사용자들의 산발적인 참여해 이뤄진다. 일반 정보는 온라인 내의 친구관계를 통해 전파의 경로가 유추되는 반면 루머는 연결되지 않은 개개인의 참여로 이루어지는 특징을 보였다. 아울러 루머는 인지도가 낮은 사용자들로부터 시작돼 유명인에게로 전파된다. 이 현상은 연예인이나 정치인과 관련된 루머에서 자주 관찰됐다.
셋째, 루머는 일반 정보와 다른 언어적 특성을 보인다. 루머는 정보의 진위 여부를 의심·부정·유추하는 심리학적 과정과 연관된 단어(아니다, 사실일지는 모르겠지만, 확실치는 않지만, 내 생각에는, 잘 기억나진 않지만) 사용이 월등히 높다.
연구팀이 루머로 구분한 사례 중에는 미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있고 미국 시민권을 부당 취득했다는 내용 등 그를 음해하는 정치적 루머도 포함됐다. 또 영화배우 니콜 키드먼이 성전환 수술을 했으며 그녀가 양성애자라고 언급한 사례 역시 연구팀의 기술을 통해 루머로 명백히 구분됐다.
차 교수는 “이 연구는 통계·수학적 모델은 물론 사회·심리학 이론의 융합 연구로 사회적으로 주목을 받는 루머의 특성을 풍부한 데이터를 통해 도출했다”며 “루머 전파 극초기에 해당 정보의 진위여부를 판별하는 것은 아직 어렵지만, 일정시간 경과 혹은 정보확산이 이루어질 경우 해당 빅데이터를 기반으로 하여 진위여부를 판단하는 것이 가능하다"고 밝혔다.
이번 연구결과는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야의 최고 학술대회인 IEEE 데이터마이닝 국제 회의(IEEE International Conference on Data Mining)에서 발표됐다. 또 해외 유명 과학 잡지인 New Scientist에 Bigfoot found? AI tool sifts fact from myth on Twitter 라는 제목으로 소개됐으며 Washington Post에도 Korean scientists create a tool that can help separate fact from fiction on Twitter의 기사명으로 소개됐다.
그림1. 각 주제 별로 관련 내용을 트위터 내에서 언급한 수(x축: 관찰일, y축:트윗수). 루머의 경우 일반적인 정보가 한 번의 광범위한 전파 후 거의 퍼지지 않는 것과 달리 지속적으로 언급되고 있음을 보여준다.
그림2. 트위터 내 사용자들 간 정보 전파를 네트워크의 형식으로 표현한 확산 네트워크. 각 점은 사용자를 의미하며, 선은 사용자들 간의 관계를 통한 정보 확산이 있었음을 의미한다.
2014.01.09
조회수 20086