-
인과관계 추정 정확도 높인 새로운 방법론 개발
우리 대학 수리과학과 김재경 교수 연구팀이 수학 모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다. 복잡한 계산 과정을 없애 기존보다 빠른 속도로 추론이 가능하면서도, 정확도는 획기적으로 높였다.
매 순간 다양한 데이터가 기록되고 있다. 그중 시간의 흐름을 기준으로 기록된 ‘시계열 데이터’는 일기 예보와 경제 분야뿐만 아니라 의학 분야에서도 가치 있게 쓰인다. 입원 환자의 심전도 측정을 통해 심장 발작의 직접적인 요인을 찾는 것과 같이 인과관계를 추정하는 것이 대표적이다. 최근에는 스마트 워치 등 웨어러블 기기를 통해 일상에서 건강 데이터를 쉽게 수집할 수 있게 되면서, 의학 분야에서 시계열 데이터 분석의 중요성이 더 커지고 있다.
시계열 데이터에서 인과관계를 추정하는 대표적인 방법으로는 2003년 노벨 경제학상을 수상한 클라이브 그레인저 미국 샌디에이고캘리포니아대(UC샌디에이고) 교수가 제시한 ‘그레인저 인과관계 검정(Granger causality test)’이 있다. 이는 미래 경제지표 예측, 질병 요인분석, 지구온난화의 원인 등 수많은 분야에 걸쳐 응용됐다. 그레인저 인과관계 검정을 개선한 정보 이론 기반의 다양한 인과관계 추정 방법이 개발됐지만, 일련의 방법들은 시계열 데이터가 비슷한 주기로 변화하는 동시성을 가지기만 하면, 인과관계가 있다고 잘못 예측하는 경우가 많았다. 또한, 직접적인 인과관계와 간접적인 인과관계를 구별하지 못한다는 한계도 있었다.
이러한 한계를 극복하기 위해 최근 수리 모델을 기반으로 하는 방법론들이 등장했다. 수리 모델로 주어진 시계열 데이터를 잘 맞출 수 있는지 확인하는 방법을 통해 인과관계를 예측한다. 수리 모델이 정확하기만 하면 기존 그레인저 인과관계 검정의 한계인 동시성과 간접적인 영향을 인과관계와 혼동하지 않는다는 장점이 있다. 그러나 정확한 수리 모델을 알기 힘들고, 현재까지 제시된 수리 모델 기반 방법론들은 복잡한 계산이 필요해 추정 시간이 많이 걸린다는 단점이 있다.
이러한 상황에서 연구팀은 기존 방법론들의 한계를 모두 해결한 새로운 방법론 ‘GOBI(General ODE-Based Inference)’를 개발했다. 우선, 연구팀은 시계열 데이터가 일반적인 수학 모델로 표현될 수 있는지 확인하는 수학 이론을 만들었다. 그리고 이 이론을 바탕으로 정확한 수리 모델이나 복잡한 계산 없이도 시계열 데이터로부터 인과관계를 추정하는 방법론을 개발했다.
개발한 방법론을 인과관계 분석에 적용해 본 결과 세포 내 분자들의 상호작용, 생태계 네트워크, 기상 시스템 등 다양한 분야의 데이터에서 기존 방법론에 비해 월등한 성능을 보여줬다. 특히, 동시성 및 간접적인 영향을 가지는 시계열 데이터에서도 인과관계를 성공적으로 추론했다. 연구진은 GOBI를 통해서 여러 오염 물질 중 이산화질소와 호흡기로 유입되는 부유 미립자(직경 10㎛ 이하의 입자)가 심혈관계 질환에 영향을 미친다는 것을 확인할 수 있었다.
김재경 교수는 “수학과 통계를 결합하여 정확하면서도 다양한 시스템에 유연하게 적용할 수 있는 새로운 인과관계 추정 방법론을 개발했다”며 “사회 및 자연과학 분야에 걸쳐 두루 사용되는 인과관계 추정 연구에 새로운 패러다임을 제시할 것으로 예상된다”고 말했다.
연구결과는 7월 24일 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 17.694)’ 온라인판에 실렸으며, 우리 대학 박세호 학사과정(제1저자)과 하석민 학사과정(제2저자)이 참여했다.
2023.07.26
조회수 5017
-
사진 위변조 탐지하는 실용 소프트웨어 개발
위조되거나 변조된 사진·영상자료를 손쉽게 탐지해내는 고성능 소프트웨어가 우리 연구진에 의해 개발됐다. 이 기술은 논문 발표 수준에만 머물러 있던 사진과 영상자료의 위·변조 탐지기술을 국내 최초로, 세계에서 두 번째로 실용화 단계로 끌어 올렸다는 점에서 의미가 크다.
우리 대학 전산학부 이흥규 교수 연구팀이 인공신경망을 이용해 디지털 형태의 사진 변형 여부를 광범위하게 탐지하는 실용 소프트웨어 `카이캐치(KAICATCH)'를 개발했다고 3일 밝혔다.
최근 딥페이크(deepfake)를 포함해 각종 위·변조 영상의 등장과 온라인 유통으로 인한 위·변조 탐지기술에 관한 관심이 급속히 증가하고 있다. 그러나 위·변조 여부를 직접 확인할 수 있는 객관적인 분석 도구가 없기 때문에 사실확인 작업이나 정황 판단 등에 의존해 진위를 판단함으로써 주관적 판단 여부의 논란 등 문제가 자주 발생하고 있다.
특히 기존의 디지털사진 포렌식 기술은 개개 변형의 유형에 대응해 개발돼서 변형 유형이 다양하거나, 사전 특정되기 전에는 일정 수준 이상의 높은 신뢰도를 확보하기가 어렵다. 즉, 기존 기술들은 제한된 형식과 알려진 특정 변형에 대해서는 만족할 만한 탐지 성능을 보여주지만, 어떤 변형들이 가해진 것인지 전혀 알 수 없는 임의의 디지털사진을 분석해야 하는 실제 상황에서는 판독의 정확성과 신뢰도가 크게 떨어질 수 밖에 없다.
다양한 변형이 가해진 채 온라인에서 유통되는 사진이나 영상에 대한 변형 여부의 탐지는 극소수 전문가들의 주관적인 판단의 영역에 머물러 왔기 때문에 이런 문제해결을 위해 많은 도전적 연구들이 진행되고 있다.
이흥규 교수 연구팀이 개발한 이 기술은 국내 최초이자 세계 두 번째로 거둔 쾌거이다. 연구팀은 일반인들을 대상으로 2015년 6월부터 `디지털 이미지 위·변조 식별 웹서비스'를 통해 수집한 30여만 장의 실 유통 이미지 데이터와 특징기반·신경망 기반의 포렌식 영상 데이터, 딥페이크와 스테고 분석을 위한 대량의 실험 영상자료를 정밀 분석해 활용한 연구 결과물이다.
이 교수팀은 특정 변형을 탐지하는 개개의 알고리즘들을 모아놓은 기존 기술의 한계를 극복하고, 다양한 변형에 대한 탐지를 유기적으로 통합하는 기술에 주목했다.
이를 위해 잘라 붙이기·복사 붙이기·지우기·이미지 내 물체 크기 변화와 이동·리터칭 등 일상적이면서 자주 발생하는 변형들에서 언제나 발생하는 변이들을 분류, 정리해 필수 변이로 정의하고 이들을 종합 탐지하는 연구를 수행했다. 그 결과 변형의 유형을 특정하지 못하는 상태에서도 변형이 발생했는지 여부를 판단함으로써 탐지 신뢰도를 크게 높였다.
연구팀은 이어 BMP·TIF·TIFF·PNG 등 무압축, 무손실 압축을 포함해 50여 개의 표준 양자화 테이블과 1,000여 개가 넘는 비표준화된 양자화 테이블에 기반한 JPEG 이미지들도 포괄적으로 처리하는 기술을 포함한 실용 소프트웨어를 개발하는 데 성공했다.
이 교수팀이 개발한 `카이캐치'는 전통적인 영상 포렌식 기술, 스테그 분석 기술 등 픽셀 단위의 미세한 변화를 탐지하는 기술들을 응용해, `이상 영역 추정 엔진'과 `이상 유형 분석 엔진' 두 개의 인공지능 엔진으로 구성됐으며 이를 기반으로 결과를 판단하고 사진에 대한 다양한 변형 탐지 기능과 사진의 변형 영역 추정 기능 등을 함께 제공한다.
이흥규 교수는 "다양한 변형 시 공통으로 발생하는 픽셀 수준에서의 변형 탐지와 인공지능 기술을 융합한 영상 포렌식 기술을 카이캐치에 담았는데 이 기술은 특히 임의의 환경에서 주어진 디지털사진의 변형 여부를 판단하는데 탁월한 성능을 보인다ˮ고 말했다.
이 교수는 이어 "향후 각종 편집 도구들의 고급 기능들에 대한 광범위한 탐지 기능을 추가하는 한편 현재 확보한 실험실 수준의 딥페이크 탐지 엔진과 일반 비디오 변형 탐지 엔진들도 실용화 수준으로 발전시켜 카이캐치에 탑재하겠다ˮ 고 덧붙였다.
한편 이번 연구는 우리 대학 창업기업인 ㈜디지탈이노텍(http://www.kaicatch.com/) 과 산학협력 연구로 수행됐다.
2020.11.04
조회수 24705