본문 바로가기 대메뉴 바로가기

KAIST

연구뉴스

홈페이지 통합검색

-

%EB%8D%B0%EC%9D%B4%ED%8A%B8

인공지능이 상황에 따라 알아서 업데이트되다 최근 실생활에 활용되는 인공지능 모델이 시간이 지남에 따라 성능이 점차 떨어지는 현상이 다수 발견되었고, 이에 따라 지속가능한 인공지능 학습 기술에 대한 필요성이 커지고 있다. AI 모델이 꾸준히 정확한 판단을 내리는 것은 더욱 안전하고 신뢰할 수 있는 인공지능을 만들기 위한 중요한 요소이다. 우리 대학 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다. 최근 인공지능이 다양한 분야에서 인간의 능력을 뛰어넘을 정도의 높은 성능을 보여주고 있지만, 대부분의 좋은 결과는 AI 모델을 훈련시키고 성능을 테스트할 때 데이터의 분포가 변하지 않는 정적인 환경을 가정함으로써 얻어진다. 하지만 이러한 가정과는 다르게 SK 하이닉스의 반도체 공정 과정에서 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변화하는 드리프트 현상이 관측되고 있다. 시간이 지나면서 데이터와 정답 레이블 간의 결정 경계 패턴이 변경되면, 과거에 학습되었던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되면서 모델의 성능이 점차 악화될 수 있다. 본 연구팀은 이러한 문제를 해결하기 위해, 데이터를 학습했을 때 AI 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입하여 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있음을 이론적으로 실험적으로 분석했다. 그리고 이러한 분석을 바탕으로 효과적인 학습 데이터 선택 기법을 제안하여, 데이터의 분포와 결정 경계가 변화해도 모델을 강건하게 학습할 수 있는 지속 가능한 데이터 중심의 AI 학습 프레임워크를 제안했다. 본 학습 프레임워크의 주요 이점은, 기존의 변화하는 데이터에 맞춰서 모델을 적응시키는 모델 중심의 AI 기법과 달리, 드리프트의 주요 원인이라고 볼 수 있는 데이터 자체를 직접 전처리를 통해 현재 학습에 최적화된 데이터로 바꿔줌으로써, 기존의 AI 모델 종류에 상관없이 쉽게 확장될 수 있다는 점에 있다. 실제로 본 기법을 통해 시간에 따라 데이터의 분포가 변화되었을 때에도 AI 모델의 성능, 즉 정확도를 안정적으로 유지할 수 있었다. 제1 저자인 김민수 박사과정 학생은 "이번 연구를 통해 인공지능을 한번 잘 학습하는 것도 중요하지만, 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다ˮ고 밝혔다. 연구팀을 지도한 황의종 교수는 “인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 말했다. 본 연구에는 KAIST 전기및전자공학부의 김민수 박사과정이 제1 저자, 황성현 박사과정이 제2 저자, 그리고 황의종 교수(KAIST)가 교신 저자로 참여했다. 이번 연구는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제학술 대회인 ‘국제 인공지능 학회(Association for the Advancement of Artificial Intelligence, AAAI)’에서 발표되었다. (논문명: Quilt: Robust Data Segment Selection against Concept Drifts) 한편, 이 기술은 SK 하이닉스 인공지능협력센터(AI Collaboration Center; AICC)의 지원을 받은 ‘노이즈 및 변동성이 있는 FDC 데이터에 대한 강건한 학습’ 과제 (K20.05) 와 정보통신기획평가원의 지원을 받은 ‘강건하고 공정하며 확장가능한 데이터 중심의 연속 학습’ 과제 (2022-0-00157) 와 한국연구재단의 지원을 받은 ‘데이터 중심의 신뢰 가능한 인공지능’ 과제 성과다.
2024.03.14 조회수 7205
세관 통관 속임수 적발하는 알고리즘 개발 우리대학 전산학부 차미영 교수 연구팀이 면세범위 초과 물품, 위장 반입, 원산지 조작 등 세관에서 벌어지는 불법적 행위를 빈틈없이 적발할 수 있는 기술을 개발했다. 차 교수는 기초과학연구원(IBS, 원장 노도영) 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI(Chief Investigator)을 맡아 세계관세기구(WCO‧World Customs Organization)와의 협업을 통해 스마트 관세 행정을 위한 알고리즘 개발을 마쳤다. 데이터 사이언스 그룹은 2019년 9월부터 WCO의 바꾸다(BACUDA) 프로젝트(*한국정부가 WCO에 공여하는 세관협력기금(Customs Cooperation Fund of Korea)로 설립, 운영)에 참여해 알고리즘 개발을 주도해왔다. WCO는 지난 2월 홈페이지 기사를 통해 “세관 데이터 분석(BAnd of CUstoms Data Analysis)의 앞 글자를 따서 바꾸다 프로젝트로 이름 지었다”며 “한글로는 ‘변화’를 뜻하는 것처럼 스마트 관세 체계로의 변화를 추구하는 회원국들을 돕기 위해 데이터과학자들과 협업을 시작했다”고 프로젝트의 취지를 알렸다. IBS가 WCO, 대만 국립성공대(NKCU‧National Cheng Kung University)와 함께 개발한 알고리즘 데이트(DATE DATE : Dual-Attentive Tree-aware Embedding for Customs Fraud Detection의 약자)는 불법적 행위 발생 가능성이 높으면서도 세수 확보에 도움이 되는 물품을 우선적으로 선별해 세관원에게 알린다. 기존 알고리즘은 세관 검사 대상만 추천했으나, 데이트는 검사 대상의 선별 이유까지 설명해줌으로써 사기 적발의 근거를 세관원이 충분히 확보할 수 있다는 특징이 있다. 우리대학 산업및시스템공학과(지식서비스공학대학원)을 졸업한 김선동 IBS 연구위원은 “설명력이 훌륭한 데이트는 인간개입(human-in-the-loop)으로 작동하는 현 세관 시스템에 가장 적합한 알고리즘”이라며 “저위험 물품 검사 에 쓰이는 세관원의 불필요한 노동을 줄이고, 복잡한 통관 프로세스를 효율화하는 데 도움이 될 것으로 기대하고 있다”고 설명했다. 바꾸다 그룹은 지난 3월 나이지리아의 틴캔(Tin Can)과 온네(Onne) 항구에 데이트를 시범 도입했다. 사전 테스트 결과, 데이트 도입으로 인해 기존의 전수 조사 통관 방법에 비해 40배 이상 효율적으로 세관 사기를 적발할 수 있음이 확인됐다. 시범운영을 마치면 알고리즘을 개선하고, 기술이전을 통해 WCO 회원국 대상으로 확대 적용해나갈 계획이다. 데이터 사이언스 그룹은 데이트 개발 성과를 오는 8월 데이터 마이닝 및 인공지능 분야의 최고 학술대회인 ACM SIGKDD(The Association for Computing Machinery’s Special Interest Group on Knowledge Discovery and Data Mining) 2020에서 발표할 예정이다. 차미영 CI는 “데이트는 세관원들의 물품 검사 및 적발된 수입자와의 소통을 도와줌으로써 스마트 세관 행정 정착에 큰 기여를 할 것”이라며 “향후 물품의 X선 이미지를 활용하거나, 전이 학습(Transfer learning)을 통해 여러 국가의 통관 데이터를 함께 활용하는 방법까지 추가해 알고리즘의 정확성을 높여나갈 계획”이라고 말했다.
2020.06.01 조회수 13946

34141 대전광역시 유성구 대학로 291 한국과학기술원(KAIST) T.042-350-2114 F.042-350-2210(2220)

Copyright (C) 2020, Korea Advanced Institute of Science and Technology, All Rights Reserved.