-
기억하고 인지하는 과정을 실시간 관찰하다
우리 뇌 속에는 약 860억 개의 신경세포와 신경세포 간의 신호를 주고받아 우리의 인지, 감정, 기억 등과 같은 다양한 뇌 기능을 조절하도록 돕는 600조 개에 달하는 시냅스가 존재한다. 흥미롭게도 노화나 알츠하이머병과 같은 질병 상황에서 시냅스는 감소하는 것으로 알려져, 시냅스에 관한 연구가 주목받고 있지만 아직 시냅스의 구조 변화를 실시간으로 관찰하는 데에는 한계가 있다.
우리 대학 생명과학과 허원도 교수 연구팀이 세계 최초로 시냅스의 형성과 소멸 및 변화를 실시간으로 관찰할 수 있는 기술 개발에 성공했다고 9일 밝혔다.
허원도 교수 연구팀은 형광 단백질(dimerization-dependent fluorescent protein, ddFP)을 시냅스와 결합시켜 신경세포 간의 시냅스 연결 과정을 실시간으로 관찰할 수 있는 기술을 개발했다. 이 기술을 시냅스(Synapse)와 스냅샷 (Snapshot)을 조합한 시냅샷(SynapShot)이라고 이름 지었고 기존에는 구현하기 어려웠던 시냅스 형성과 소멸 그리고 역동적인 변화 과정을 실시간으로 추적하고 관찰하는데 성공했다.
허원도 교수 연구팀은 초록과 빨강 형광을 띠는 시냅샷을 디자인해 두 개의 서로 다른 신경세포와 연결된 시냅스를 쉽게 구별하여 관찰할 수 있었다. 또한, 빛으로 분자의 기능을 조절할 수 있는 광유전학 기술과 융합하여 신경세포의 특정 기능을 빛으로 조절함과 동시에 시냅스의 변화를 관찰하는 데 성공했다.
허원도 교수 연구팀이 개발한 시냅샷은 미국 존스홉킨스 의대 권형배 교수 연구팀과 공동연구를 통해 살아있는 생쥐에게 시각적 구별 훈련, 운동 및 마취 등 여러 상황을 유도하고 각 과정에서 시냅스의 변화를 실시간으로 관찰해 각각의 시냅스가 상당히 빠르고 역동적으로 변화될 수 있음을 보였다. 이는 살아있는 포유류의 시냅스 변화를 세계 최초로 관찰한 것이다.
교신저자 허원도 교수는 “우리 연구팀이 국내외 연구팀과 공동연구를 통해 시냅샷 기술로 과거에는 구현하기 어려웠던 시냅스의 빠르고 역동적인 형성과 변화를 직접 관찰할 수 있는 가능성을 열었으며, 이 기술은 뇌과학 연구분야의 연구방법론에 혁신을 가져올 것으로 예상되며 뇌 과학의 미래를 밝히는 중요한 역할을 할 것으로 기대된다”고 말했다.
생명과학과 손승규(박사과정), 이진수(박사과정), 존스홉킨스 의과대학 정강훈 박사가 공동 제1 저자로 수행한 이번 연구는 저명 국제 학술지 ‘네이처 메쏘드(Nature Methods)’2024년 2월호 인쇄판에 게재될 예정이며, 2024년 1월 8일자로 온라인판에 게재됐다. (논문명: Real-time visualization of structural dynamics of synapses in live cells in vivo). (Impact Factor: 47.99). (DOI: 10.1038/s41592-023-02122-4)
한편, 이번 연구는 KAIST 중견연구자지원사업, KAIST 글로벌 특이점 사업의 지원을 받아 수행됐다.
2024.01.09
조회수 3434
-
구글딥마인드와 공동연구를 통해 인공지능으로 시각을 상상하다
‘노란 포도'나 `보라색 바나나'와 같이 본 적 없는 시각 개념을 이해하고 상상하는 인공지능 능력 구현이 가능해졌다.
우리 대학 전산학부 안성진 교수 연구팀이 구글 딥마인드 및 미국 럿거스 대학교와의 국제 공동 연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 인공지능 새로운 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다.
인간은 `보라색 포도'와 `노란 바나나' 같은 개념을 학습하고, 이를 분리한 뒤 재조합해 `노란 포도'나 `보라색 바나나'와 같이 본 적 없는 개념을 상상하는 능력이 있다. 이런 능력은 체계적 일반화 혹은 조합적 일반화라고 불리며, 범용 인공지능을 구현하는 데 있어 핵심적인 요소로 여겨진다.
체계적 일반화 문제는 1988년 미국의 저명한 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 이 문제를 해결할 수 없다고 주장한 이후, 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아 있다. 이 문제는 언어뿐만 아니라 시각 정보에서도 발생하지만, 지금까지는 주로 언어의 체계적 일반화에만 초점이 맞춰져 있었고, 시각 정보에 관한 연구는 상대적으로 부족했다.
안성진 교수가 이끄는 국제 공동 연구팀은 이러한 공백을 메우고자 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와는 달리 명확한 `단어'나 `토큰'의 구조가 없어, 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다.
연구를 주도한 안성진 교수는 “시각 정보의 체계적 일반화가 범용 인공지능을 달성하기 위해 필수적인 능력이며 이 연구를 통해 인공지능의 추론능력과 상상능력 관련 분야의 발전을 가속할 것으로 기대한다”고 말했다.
또한, 딥마인드의 책임 연구원으로 연구에 참여한 연구원이자 현재 스위스 로잔연방공과대학교(EPFL)의 찰라 걸셔(Caglar Gulcehre) 교수는 “체계적 일반화가 가능해지면 현재보다 훨씬 적은 데이터로 더 높은 성능을 낼 수 있게 될 것이다”라고 전했다.
이번 연구는 12월 10일부터 16일까지 미국 뉴올리언스에서 열리는 제37회 신경정보처리학회(NeurIPS)에서 발표될 예정이다.
관련논문: “Imagine the Unseen World: A Benchmark for Systematic Generalization in Visual World Models”, Yeongbin Kim, Gautam Singh, Junyeong Park, Caglar Gulcehre, Sungjin Ahn, NeurIPS 23
2023.11.30
조회수 4230
-
뉴로모픽 반도체로 통증도 느낀다
최근 인간의 뇌를 모방한 뉴로모픽 반도체 소자 연구가 주목받고 있다. 이에서 더 나아가 최근에는 뇌를 넘어 첨단 센서와 휴머노이드 분야에 적용가능한 감각신경계 모사에 관한 연구가 활발하게 진행되고 있다.
우리 대학 신소재공학과 김경민 교수 연구팀이 새로운 메모리 소자인 멤리스터를 사용하여 통증자극 민감도 조절 기능을 갖는 뉴로모픽 통각수용체 소자를 최초로 구현했다고 15일 밝혔다.
※ 멤리스터(memristor): 메모리(memory)와 저항(resistor)의 합성어로, 전류의 흐름에 따라 저항이 변화하는 전자소자
감각신경계의 핵심적인 역할 중 하나는 유해한 자극을 감지해 위험한 상황을 회피하는 것이다. 특히 통각수용체는 자극이 민감도의 임계치를 넘으면 통증 신호를 발생하여 인체가 자극에서 회피할 수 있도록 한다. 이를 위해 통각수용체의 신호 전달에는 통증 신호를 전달하는 흥분성 신경전달물질(Excitatory Neurotransmitter)과 외부 자극에 대한 임계치를 조절하는 억제성 신경전달물질(Inhibitory Neurotransmitter)이 관여하는 것으로 알려져 있다. 특히 억제성 신경전달물질은 흥분 작용과 역균형을 이뤄 신경의 과도한 활성화를 방지하고, 다양한 외부 자극에 적절하게 반응하기 위한 핵심적인 역할을 가지게 된다. <그림 1> 그동안 이러한 복잡한 감각신경계의 동작을 모사하는 전자 소자를 개발하는 연구가 활발히 진행되었는데, 기존의 연구에서는 흥분성 신경전달물질의 특성은 쉽게 구현할 수 있었으나, 억제성 신경전달물질에 의한 임계치 조절 특성까지 동시에 구현하는데 한계가 있었다.
김경민 교수 연구팀은 이중 전하 저장층 구조를 통해 외부에서의 자극에 대한 임계치를 조절할 수 있는 뉴로모픽 통각수용체 소자를 최초로 개발했다. <그림 2> 두 종류의 서로 다른 전하 저장층은 각각 전도성을 조절하는 흥분성 신경전달물질의 역할과 임계치를 조절하는 억제성 신경전달물질의 역할을 맡아 통각수용체의 필수적인 기능들인 통증 전달 특성(threshold triggering), 통증 완화(Relaxation), 통증 민감화(Sensitization) 등의 특성을 조절할 수 있음을 확인했다. <그림 3> 이는 신경계의 복잡한 기능을 신경계의 동작 원리를 모방하여 단순한 구조의 전자 소자로 구현하는 새로운 방법을 제시한 의의가 있다.
또한, 이 소자는 온도 자극에도 반응하는 온도수용체 특성을 보였으며, 특히 억제성 상태를 제어하여 단일 소자가 고온 범위와 저온 범위를 모두 감지할 수 있는 가변적인 온도수용체 특성을 구현할 수 있었다. <그림 4> 이러한 통각수용체, 온도수용체 소자는 인간을 모방하는 휴머노이드 피부에 적용하여 인간과 같은 방식으로 자극을 감지하는 센서로 활용될 수 있다.
김경민 교수는 "이번 연구는 흥분성 및 억제성 신호 작용의 특성을 단일 소자에 구현해, 간단한 반도체 기술로 복잡한 생물학적 감각신경계의 특성을 모사하는 새로운 방법론을 제시한 것에 큰 의의가 있다ˮ며 "이처럼 임계치를 조절할 수 있는 특성은 감각신경계 모사뿐 아니라 임계 스위칭 특성을 활용하는 보안 소자나 차세대 컴퓨팅 소자에도 활용될 수 있을 것으로 기대된다ˮ고 밝혔다.
한편 이번 연구는 신소재공학과 김근영 석박사통합과정 학생이 제1 저자로 참여했으며, 국제 학술지 `어드밴스드 머티리얼즈(Advanced Materials, Impact Factor: 29.4)'에 10월 21일 字 온라인 게재됐다.
이번 연구는 한국연구재단, 나노종합기술원, KAIST, 그리고 SK 하이닉스의 지원을 받아 수행됐다. (논문명: Threshold Modulative Artificial GABAergic Nociceptor, 논문링크: https://doi.org/10.1002/adma.202304148)
2023.11.15
조회수 4800
-
인공지능 챗봇 이미지 데이터 훈련 비용 최소화하다
최근 다양한 분야에서 인공지능 심층 학습(딥러닝) 기술을 활용한 서비스가 급속히 증가하고 있다. GPT와 같은 거대 언어 모델을 훈련하기 위해서는 수백 대의 GPU와 몇 주 이상의 시간이 필요하다고 알려져 있다. 따라서, 심층신경망 훈련 비용을 최소화하는 방법 개발이 요구되고 있다.
우리 대학 전산학부 이재길 교수 연구팀이 심층신경망 훈련 비용을 최소화할 수 있도록 훈련 데이터의 양을 줄이는 새로운 데이터 선택 기술을 개발했다고 2일 밝혔다.
일반적으로 대용량의 심층 학습용 훈련 데이터는 레이블 오류(예를 들어, 강아지 사진이 `고양이'라고 잘못 표기되어 있음)를 포함한다. 최신 인공지능 방법론인 재(再)레이블링(Re-labeling) 학습법은 훈련 도중 레이블 오류를 스스로 수정하면서 높은 심층신경망 성능을 달성하는데, 레이블 오류를 수정하기 위한 추가적인 과정들로 인해 훈련에 필요한 시간이 더욱 증가한다는 단점이 있다. 한편 막대한 훈련 시간을 줄이려는 방법으로 중복되거나 성능 향상에 도움이 되지 않는 데이터를 제거해 훈련 데이터의 크기를 줄이는 핵심 집합 선별(coreset selection) 방식이 큰 주목을 받고 있다. 그러나 기존 핵심 집합 선별 방식은 훈련 데이터에 레이블 오류가 없다고 가정한 표준 학습법을 위해 개발됐고, 재레이블링 학습법을 위한 핵심 집합 선별 방식에 관한 연구는 부족한 실정이다.
이재길 교수팀이 개발한 기술은 레이블 오류를 스스로 수정하는 최신 재레이블링 학습법을 위해 핵심 집합 선별을 수행하여 심층 학습 훈련 비용을 최소화할 수 있도록 해준다. 따라서, 레이블 오류가 포함된 현실적인 훈련 데이터를 지원하므로 실용성이 매우 높다.
또한 이 교수팀은 특정 데이터의 레이블 오류 수정 정확도가 해당 데이터의 이웃 데이터의 신뢰도와 높은 상관관계가 있음을 발견했다. 즉, 이웃 데이터의 신뢰도가 높으면 레이블 오류 수정 정확도가 커지는 경향이 있다. 이웃 데이터의 신뢰도는 심층신경망의 충분한 훈련 전에도 측정할 수 있으므로, 각 데이터의 레이블 수정 가능 여부를 예측할 수 있게 된다. 연구팀은 이러한 발견을 기반으로 전체 훈련 데이터의 총합 이웃 신뢰도를 최대화하는 데이터 부분 집합을 선별해 레이블 수정 정확도와 일반화 성능을 최대화하는 `재레이블링을 위한 핵심 집합 선별'을 제안했다. 총합 이웃 신뢰도를 최대화하는 부분 집합을 찾는 조합 최적화 문제의 효율적인 해법을 위해 총합 이웃 신뢰도를 가장 증가시키는 데이터를 차례차례 선택하는 탐욕 알고리즘(greedy algorithm)을 도입했다.
연구팀은 이미지 분류 문제에 대해 다양한 실세계의 훈련 데이터를 사용해 방법론을 검증했다. 그 결과, 레이블 오류가 없다는 가정에 따른 표준 학습법에서는 최대 9%, 재레이블링 학습법에서는 최대 21% 최종 예측 정확도가 기존 방법론에 비해 향상되었고, 모든 범위의 데이터 선별 비율에서 일관되게 최고 성능을 달성했다. 또한, 총합 이웃 신뢰도를 최대화한 효율적 탐욕 알고리즘을 통해 기존 방법론에 비해 획기적으로 시간을 줄이고 수백만 장의 이미지를 포함하는 초대용량 훈련 데이터에도 쉽게 확장될 수 있음을 확인했다.
제1 저자인 박동민 박사과정 학생은 "이번 기술은 오류를 포함한 데이터에 대한 최신 인공지능 방법론의 훈련 가속화를 위한 획기적인 방법ˮ 이라면서 "다양한 데이터 상황에서의 강건성이 검증됐기 때문에, 실생활의 기계 학습 문제에 폭넓게 적용될 수 있어 전반적인 심층 학습의 훈련 데이터 준비 비용 절감에 기여할 것ˮ 이라고 밝혔다.
연구팀을 지도한 이재길 교수도 "이 기술이 파이토치(PyTorch) 혹은 텐서플로우(TensorFlow)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있을 것이다ˮ고 말했다.
우리 대학 데이터사이언스대학원에 재학 중인 박동민 박사과정 학생이 제1 저자, 최설아 석사과정, 김도영 박사과정 학생이 제2, 제3 저자로 각각 참여한 이번 연구는 최고권위 국제학술대회 `신경정보처리시스템학회(NeurIPS) 2023'에서 올 12월 발표될 예정이다. (논문명 : Robust Data Pruning under Label Noise via Maximizing Re-labeling Accuracy)
한편, 이 기술은 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 SW컴퓨팅산업원천기술개발사업 SW스타랩 과제로 개발한 연구성과 결과물(2020-0-00862, DB4DL: 딥러닝 지원 고사용성 및 고성능 분산 인메모리 DBMS 개발)이다.
2023.11.02
조회수 3850
-
뇌의 선천적 수량 비교 원리 규명
뇌의 선천적 인지 기능들은 학습이나 훈련 없이 신경망의 구조적 특성으로부터 자발적으로 발생할 수 있는 것인가?
우리 대학 뇌인지과학과 백세범 교수 연구팀이 두뇌에서 발견되는 선천적 수량 비교 능력이 자발적으로 형성되는 원리를 설명했다고 7일 밝혔다.
주어진 사물들의 수량을 비교하는 기능은 동물이나 인간의 생존에 필수적인 능력이다. 동물 그룹 간 다툼, 사냥, 먹이 수집 등 많은 상황에서 주어진 변수들의 수량 비율이나 차이에 따라 동물들의 의사결정 및 행동이 달라져야 하기 때문이다. 학습을 거치지 않은 어린 개체들의 행동 관찰로부터 수량 비교 능력은 두뇌의 선천적 기능이라는 가능성이 제기됐지만 이러한 능력이 학습 없이 발생하는 원리에 대한 설명은 아직 제시되지 않았다.
백세범 교수 연구팀은 두뇌 모사 인공신경망 모델을 활용해, 학습이 전혀 이뤄지지 않은 심층신경망 구조에서 시각적 수량 비율 및 차이 정보의 인지 기능이 자발적으로 발생할 수 있음을 증명했다. 또한 두 수량의 비율과 차이라는 서로 다른 종류의 정보를 비교하는 기능이 하나의 공통적인 발생 원리로부터 파생될 수 있다고 설명했다.
우리 대학 바이오및뇌공학과 이현수 박사과정, NYU 신경과학과 최우철 박사가 공동 제1 저자로 참여한 이번 연구는 국제 학술지 ‘셀(Cell)’의 온라인 자매지 ‘셀 리포츠(Cell Reports)’ 7월 29일 자에 게재됐다. (논문명: Comparison of visual quantities in untrained neural networks)
연구팀은 먼저 전혀 학습을 거치지 않은 신경망에서 두 수량의 비율과 차이에 선택적으로 반응하는 개별 신경세포가 자발적으로 발생하는 것을 발견했다. 초기화된 심층신경망에서 다양한 비율 혹은 차이를 가지는 시각적 수량 정보가 주어졌을 때, 이에 선택적으로 반응하는 신경세포들이 다수 발견되며, 이들로부터 측정된 신경 활동은 실제 동물 실험에서 관측된 신경 활동 특성과 매우 유사함을 확인하였다. 또한 연구팀은 이를 이용하여 지금까지 보고되어 온 동물들의 수량 비교 행동 특성을 상당 부분 재현할 수 있음을 확인했다.
이에 더해, 연구팀은 수량 비교 기능 신경세포 회로 구조의 발생 원리를 계산신경과학적 모델을 통해 설명하고 검증했다. 신경망에서 발견된 비율/차이 선택적 신경세포의 특징적 연결구조를 분석해, 특정 값에 대한 선택성이 신경망 하위 계층에서 자발적으로 발생된 단순 증가, 단순 감소 신경 활동의 결합을 통해 형성될 수 있음을 보였다. 또한 이러한 신경 활동이 증가, 감소할 때 관찰되는 비선형성의 타입에 따라 각각 수량 비율 또는 수량 차이를 인지하는 신경세포로 분화될 수 있음을 연구팀은 확인했다.
이러한 결과들을 통해 연구팀은 학습이 전혀 이뤄지지 않은 두뇌에서 비율/차이 인지와 같은 선천적 수량 비교 기능이 발생하는 원리에 대한 근본적인 이해를 제시했다.
백세범 교수는 “이번 연구는 상당한 정도의 학습 과정이 필요할 것이라 여겨지던 두뇌의 수량 인지 및 비교, 연산 기능이 그 어떤 학습도 이뤄지지 않은 초기 두뇌의 구조에서 자발적으로 발생할 수 있음을 보이는 연구”라며, “발생 초기 신경망의 구조적/물리적 특성으로부터 다양한 선천적 고등 인지 기능이 발생할 수 있음을 시사함으로써 뇌신경과학 연구뿐 아니라 새로운 개념의 인공지능 연구에도 의미있는 방향을 제시할 수 있을 것이라 기대한다”고 언급했다.
한편 이번 연구는 한국연구재단의 이공분야기초연구사업 및 원천기술개발사업, KAIST 특이점교수 사업의 지원을 받아 수행됐다.
2023.08.07
조회수 4185
-
왼쪽 눈이 본 것을 오른쪽 뇌가 알게 하라
인간을 비롯한 대부분 동물의 신체 기관들은 대칭적 구조를 가지고 있다. 이를 통해 몸의 좌우 균형을 맞추고, 움직이고, 반응을 할 수 있게 된다. 동물의 시각이 시작되는 안구 역시 머리의 양쪽에 하나씩 위치하며 한쪽 눈으로 볼 때 보다 더 넓은 영역의 물체를 인식할 수 있게 된다. 사람이나 고양이 같은 경우는 양쪽 눈이 정면을 향하고 있고, 개나 쥐 같은 동물은 눈이 사람보다 측면부를 향해 있고, 많은 물고기의 경우는 두 눈이 완전히 반대쪽을 향하고 있다. 이로 인해 좌우측 눈이 받아들이는 이미지 역시 차이를 보이게 된다. 인간의 경우 좌측과 우측 눈이 인식하는 이미지의 50%에 가까운 영역이 겹치는 반면, 생쥐의 경우는 5% 이하의 영역이 중복이 되며, 물고기는 중복된 영역이 거의 없다. 이들 겹치는 시각 영역 이미지의 위상차를 뇌가 인식해 동물은 물체의 입체감을 느낄 수 있다. 또, 물체가 움직이는 경우에는 좌측 눈과 우측 눈에 감지된 물체의 이미지의 시간차 정보가 뇌에서 처리되어 물체의 이동 경로를 감지하고 예측할 수 있게 된다. 결국, 중복된 시각 영역이 넓을수록 외부 물체의 입체감과 이동을 더 잘 감지할 수 있게 되어, 대부분 포식 동물들이 넓은 중복 영역을 확보하기 위해 안구를 정면에 위치하는 경우가 많다.
이렇게 좌우 안구에서 인식된 이미지를 뇌의 특정 영역에 전달하기 위해 눈에서 나온 시신경은 뇌의 좌우 반구에 모두 연결이 되어 있다. 흥미롭게 좌우 반구로 연결되는 시신경 비율은 좌우 안구 이미지의 중복 비율에 역비례해서, 인간의 경우 50% 시신경이 반대쪽 뇌로 연결되고, 생쥐의 경우 95% 내외, 물고기는 100% 반대쪽으로 연결된다. 시신경이 좌측 또는 우측 중 어느 쪽 뇌로 뻗어 나갈 것인지를 결정하는 과정은 시신경이 눈에서 출발해 시상하부 영역에 도달할 때 시상하부 중간선에 존재하는 경로 결정자(pathway selection cue)에 의해 일어난다고 알려져 있다. 오랜 동안 이러한 동물의 양안 시각계 (binocular visual system)의 핵심인 시상하부 중간선에서 경로 결정에 관련된 메커니즘을 이해하려는 시도가 있어 왔고 일부 경로 결정 인자들이 밝혀진 바도 있다. 하지만, 핵심인자의 부재로 이 과정에 대한 명확한 이해는 부족한 상황이었다.
생명과학과 김진우 교수 연구실에서는 시신경 및 시상하부 중간선에 많이 발현되는 VAX1 유전자에 대한 연구를 수행해 오고 있다. 이 유전자가 결핍된 생쥐와 사람은 시신경이 제대로 성장하지 못하고 시신경이 시상하부에서 교차하지 못하는 발달 이상을 보였다. VAX1이 호메오도메인을 가지는 전사인자의 특성을 가지고 있기 때문에 당연히 시상하부에서 경로 결정자의 유전자 발현을 조절해 시신경 교차(optic chiasm)를 생성할 것이라고 추정하였으나, 김교수 연구팀에서는 VAX1이 시상하부 세포에서 전사인자로 기능하기 보다는 눈의 망막신경절세포에서 뻗어 나온 시신경 축삭(axon)에서 mRNA 번역인자로 작용하여 시신경의 성장을 유도한다는 놀라운 사실을 발견하여 2014년 발표한 바 있다. 하지만, VAX1이 전혀 없는 동물은 두개골 기형 때문에 생존하기 어려워 이러한 VAX1 이상으로 인해 시신경 교차가 없는 동물의 시각 반응 및 행동에 대한 이해는 이루어지지 못하고 있었다.
김 교수 연구실에서 VAX1의 전사인자 기능은 유지한 채 시신경 축삭에 작용하지 못하는 VAX1(AA) 생쥐를 제작하였고, 이 생쥐는 외형적 이상이 전혀 없이 정상적으로 태어나 성장하였다. 다만, VAX1(AA) 생쥐는 모든 시신경이 안구와 같은 쪽 뇌에만 연결되는 시신경 교차 결핍증(agenesis of optic chiasm, AOC)을 나타냈다. 이 생쥐의 시각을 다양한 방법을 통해 검증한 결과, 눈 속의 신경 조직인 망막이 빛을 감지하는 기능은 정상이나 입체 시각이 전혀 없었고, 시력 역시 저하되어 있었다.
흥미로운 점은 VAX1(AA) 생쥐의 눈이 아무런 자극이 없는 상태에서도 지속적으로 상하궤도 운동을 하는 시소안구진탕증(Seesaw Nystagmus)를 보인다는 것이었다. 이러한 시소안구진탕증은 시신경 교차에 이상이 있는 사람과 벨지안쉽도그(Belgian sheepdog)에서도 관찰이 된 바 있어서 시신경 교차 결여가 VAX1(AA) 생쥐의 안구 운동 이상의 원인임을 알 수 있었다.
더욱 흥미로운 점은 VAX1(AA) 생쥐의 시각 운동 반응이 반전되어 있다는 점이었다. 왼쪽 눈에 빛을 주면 오른쪽 동공이 먼저 축소되고, 물체 이동을 감지한 후에는 움직이던 눈이 오히려 정면을 응시하는 등, 시각 정보와 반대되는 안구의 움직임을 보였다. VAX1(AA) 생쥐는 시신경 교차에만 이상이 있고 시각을 처리하는 뇌 부위는 정상적으로 형성이 되어 있기 때문에, 이 결과는 우측 눈에서 오는 신호를 처리해 우측 눈으로 운동 정보를 보내야 할 좌측뇌가 정작 좌측 눈에서 오는 신호를 받아 우측 눈을 자극하는 입력-출력 반전(input-output inversion) 현상 때문으로 해석되었다. 하지만, 아직 VAX1(AA) 생쥐의 좌측 눈에서 들어 온 시각 신호가 어떤 뇌 부위를 안구로 다시 전달되는지에 대한 정보가 거의 전무하기 때문에 이러한 반전된 시각-운동 신경망에 대한 이해는 부족한 상황이다. 이를 해결하기 위해 김교수팀은 시각 자극을 받은 VAX1(AA) 생쥐의 뇌를 자기 공명 영상 분석하는 공동 연구를 시작하였다. 이 연구를 통해 동물의 시각 정보가 어떤 경로로 뇌에서 처리되어 운동 신경을 활성화 할 수 있는지에 대한 이해를 심화할 수 있을 것으로 기대한다.
이번 연구는 국제학술지인 Experimental & Molecular Medicine (https://doi.org/10.1038/s12276-023-00930-4) 2월3일자로 발표됐다. KAIST 생명과학과 김진우 교수 연구팀 민광욱 박사가 제1저자로 연구를 주도하였고, 생명과학과 이승희 교수 연구팀, 바이오및뇌공학과 박영균 교수 연구팀, 연세대학교 이한웅 교수 연구팀, 한국뇌연구원 김남석 박사, 기초과학연구원 이창준 박사 연구팀이 함께 참여하였다. 본 연구는 과학기술정보통신부 중견연구자연구지원사업과 선도연구센터사업, 그리고 KAIST 국제공동연구지원사업의 지원을 받아 수행됐다.
2023.03.02
조회수 5927
-
뇌 속 자명종 신경회로 발견
우리 대학 생명과학과 김대수 교수 연구팀이 한국과학기술연구원(KIST) 김정진 박사팀과 공동연구를 통해 동물이 잠을 자는 동안에도 소리에 반응해 각성하는 원리를 규명했다고 20일 밝혔다.
수면은 뇌의 활동을 정비하고 건강을 유지하는 매우 중요한 생리작용이다. 잠을 자는 동안 감각신경의 작용이 차단되므로 주변의 위험을 감지하는 능력이 감소하게 된다. 그러나 많은 동물은 잠자는 동안에도 포식자의 접근을 감지하고 반응한다. 과학자들은 동물이 깊은 잠과 낮은 잠을 번갈아 자면서 언제 있을지 모를 위험에 대비한다고 생각했다.
김대수 교수 연구팀은 깊은 잠을 자는 동안에도 동물이 소리에 반응하는 신경회로가 있다는 사실을 발견했다. 깨어 있을 때는 청각 시상핵 (Medial geniculate thalamus)이 소리에 반응하지만 깊은 잠 즉 비 램수면 (Non-REM) 동안에는 배내측 시상핵(Mediodorsal thalamus)이 소리에 반응해 뇌를 깨운다는 사실을 밝혔다.
연구 결과 쥐가 깊은 잠에 빠졌을 때 청각 시상핵 신경도 잠을 자고 있었지만 배내측 시상핵 신경은 깨어 있어 소리를 들려주자 곧바로 반응했다. 또한 배내측 시상핵을 억제하면 소리를 들려줘도 쥐가 잠에서 깨어나지 못했으며 배내측 시상핵을 자극하면 소리 없이도 쥐가 수초 이내에 잠에서 깨어나는 것을 관찰할 수 있었다.
이것은 수면상태와 각성상태가 서로 다른 신경회로를 통해 청각신호를 전달 할 수 있다는 최초의 연구로서 국제 학술지 ‘커런트 바이올로지 (Current Biology)’에 2월 7일자로 보고됐으며 (https://www.nature.com/articles/d41586-023-00354-0) 국제학술지 네이처에 하이라이트 되었다. ( https://www.nature.com/articles/d41586-023-00354-0)
김대수 교수는 “이번 연구를 통해 수면 질환 등 다양한 뇌 질환에서 보이는 각성 및 감각장애에 대한 이해를 증진하고 향후 감각을 조절할 수 있는 디지털 헬스케어 개발 등 다양한 분야로 활용이 가능하다”라고 설명했다.
한편 이번 연구는 한국연구재단 중견연구재단 과제로 지원됐다.
2023.02.20
조회수 5556
-
‘라이보’ 로봇, 해변을 거침없이 달리다
우리 대학 기계공학과 황보제민 교수 연구팀이 모래와 같이 변형하는 지형에서도 민첩하고 견고하게 보행할 수 있는 사족 로봇 제어기술을 개발했다고 26일 밝혔다.
황보 교수 연구팀은 모래와 같은 입상 물질로 이루어진 지반에서 로봇 보행체가 받는 힘을 모델링하고, 이를 사족 로봇에 시뮬레이션하는 기술을 개발했다. 또한, 사전 정보 없이도 다양한 지반 종류에 스스로 적응해가며 보행하기에 적합한 인공신경망 구조를 도입해 강화학습에 적용했다. 학습된 신경망 제어기는 해변 모래사장에서의 고속 이동과 에어 매트리스 위에서의 회전을 선보이는 등 변화하는 지형에서의 견고성을 입증해 사족 보행 로봇이 적용될 수 있는 영역을 넓힐 것으로 기대된다.
기계공학과 최수영 박사과정이 제1 저자로 참여한 이번 연구는 국제 학술지 `사이언스 로보틱스(Science Robotics)' 1월 8권 74호에 출판됐다. (논문명 : Learning quadrupedal locomotion on deformable terrain)
강화학습은 임의의 상황에서 여러 행동이 초래하는 결과들의 데이터를 수집하고 이를 사용해 임무를 수행하는 기계를 만드는 학습 방법이다. 이때 필요한 데이터의 양이 많아 실제 환경의 물리 현상을 근사하는 시뮬레이션으로 빠르게 데이터를 모으는 방법이 널리 사용되고 있다.
특히 보행 로봇 분야에서 학습 기반 제어기들은 시뮬레이션에서 수집한 데이터를 통해서 학습된 이후 실제 환경에 적용돼 다양한 지형에서 보행 제어를 성공적으로 수행해 온 바 있다.
다만 학습한 시뮬레이션 환경과 실제 마주친 환경이 다른 경우 학습 기반 제어기의 성능은 급격히 감소하기 때문에, 데이터 수집 단계에서 실제와 유사한 환경을 구현하는 것이 중요하다. 따라서, 변형하는 지형을 극복하는 학습 기반 제어기를 만들기 위해서는 시뮬레이터는 유사한 접촉 경험을 제공해야 한다.
연구팀은 기존 연구에서 밝혀진 입상 매체의 추가 질량 효과를 고려하는 지반 반력 모델을 기반으로 보행체의 운동 역학으로부터 접촉에서 발생하는 힘을 예측하는 접촉 모델을 정의했다.
나아가 시간 단계마다 하나 혹은 여러 개의 접촉에서 발생하는 힘을 풀이함으로써 효율적으로 변형하는 지형을 시뮬레이션했다.
연구팀은 또한 로봇의 센서에서 나오는 시계열 데이터를 분석하는 순환 신경망을 사용함으로써 암시적으로 지반 특성을 예측하는 인공신경망 구조를 도입했다.
학습이 완료된 제어기는 연구팀이 직접 제작한 로봇 `라이보'에 탑재돼 로봇의 발이 완전히 모래에 잠기는 해변 모래사장에서 최대 3.03 m/s의 고속 보행을 선보였으며, 추가 작업 없이 풀밭, 육상 트랙, 단단한 땅에 적용됐을 때도 지반 특성에 적응해 안정하게 주행할 수 있었다.
또한, 에어 매트리스에서 1.54 rad/s(초당 약 90°)의 회전을 안정적으로 수행했으며 갑작스럽게 지형이 부드러워지는 환경도 극복하며 빠른 적응력을 입증했다.
연구팀은 지면을 강체로 간주한 제어기와의 비교를 통해 학습 간 적합한 접촉 경험을 제공하는 것의 중요성을 드러냈으며, 제안한 순환 신경망이 지반 성질에 따라 제어기의 보행 방식을 수정한다는 것을 입증했다.
연구팀이 개발한 시뮬레이션과 학습 방법론은 다양한 보행 로봇이 극복할 수 있는 지형의 범위를 넓힘으로써 로봇이 실제적 임무를 수행하는 데에 이바지할 수 있을 것으로 기대된다.
제1 저자인 최수영 박사과정은 "학습 기반 제어기에 실제의 변형하는 지반과 가까운 접촉 경험을 제공하는 것이 변형하는 지형에 적용하는 데 필수적이라는 것을 보였다ˮ 라며 "제시된 제어기는 지형에 대한 사전 정보 없이 기용될 수 있어 다양한 로봇 보행 연구에 접목될 수 있다ˮ 라고 말했다.
한편 이번 연구는 삼성전자 미래기술육성센터의 지원을 받아 수행됐다.
2023.01.26
조회수 6623
-
세계 최초로 사람처럼 사물의 개념을 스스로 학습하는 장면 인식 기술 개발
우리 대학 전산학부 안성진 교수 연구팀이 미국 럿거스(Rutgers) 대학교와 공동연구를 통해 사람의 라벨링 없이 스스로 영상 속 객체를 식별할 수 있는 인공지능 기술을 개발했다고 1일 밝혔다. 이 모델은 복잡한 영상에서 각 장면의 객체들에 대한 명시적인 라벨링 없이도 객체를 식별하는 최초의 인공지능 모델이다.
기계가 주변 환경을 지능적으로 인지하고 추론하기 위해서는 시각적 장면을 구성하는 객체들과 그들의 관계를 파악하는 능력이 필수적이다. 하지만 이 분야의 연구는 대부분 영상의 각 픽셀에 대응하는 객체의 라벨을 사람이 일일이 표시해야 하는 지도적 학습 방식을 사용했다. 이 같은 수작업은 오류가 발생하기 쉽고 많은 시간과 비용을 요구한다는 단점이 있다.
이에 반해 이번에 연구팀이 개발한 기술은 인간과 유사하게 환경에 대한 관측만으로 객체의 개념을 스스로 자가 학습하는 방식을 취한다. 이렇게 인간의 지도 없이 스스로 객체의 개념을 학습할 수 있는 인공지능은 차세대 인지 기술의 핵심으로 기대돼왔다.
비지도 학습을 이용한 이전 연구들은 단순한 객체 형태와 배경이 명확히 구분될 수 있는 단순한 장면에서만 객체를 식별하는 단점이 있었다. 이와 달리 이번에 안성진 교수 연구팀이 개발한 기술은 복잡한 형태의 많은 객체가 존재하는 사실적인 장면에도 적용될 수 있는 최초의 모델이다.
이 연구는 그림 인공지능 소프트웨어인 DALL-E와 같이 텍스트 입력을 통해 사실적인 이미지를 생성할 수 있는 이미지 생성 연구에서 영감을 얻었다. 연구팀은 텍스트를 입력하는 대신, 모델이 장면에서 객체를 감지하고 그 객체의 표상(representation)으로부터 이미지를 생성하는 방식으로 모델을 학습시켰다. 또한, 모델에 DALL-E와 유사한 트랜스포머 디코더를 사용하는 것이 사실적이고 복잡한 영상을 처리할 수 있게 한 주요 요인이라고 밝혔다.
연구팀은 복잡하고 정제되지 않은 영상뿐만 아니라, 많은 물고기가 있는 수족관과 교통이 혼잡한 도로의 상황을 담은 유튜브 영상과 같이 복잡한 실제 영상에서도 모델의 성능을 측정했다. 그 결과, 제시된 모델이 기존 모델보다 객체를 훨씬 더 정확하게 분할하고 일반화하는 것을 확인할 수 있었다.
연구팀을 이끈 안성진 교수는 "인간과 유사한 자가 학습 방식으로 상황을 인지하고 해석하는 혁신적인 기술ˮ이라며 "시각적 상황인지 능력을 획기적으로 개선해 지능형 로봇 분야, 자율 주행 분야뿐만 아니라 시각적 인공지능 기술 전반에 비용 절감과 성능향상을 가져올 수 있다ˮ고 말했다.
이번 연구는 미국 뉴올리언스에서 지난 11월 28일부터 개최되어 12월 9일까지 진행 예정인 세계 최고 수준의 기계학습(머신러닝) 학회인 제36회 신경정보처리학회(NeurIPS)에서 발표됐다.
2022.12.02
조회수 5967
-
레이블 없이 훈련 가능한 그래프 신경망 모델 기술 개발
최근 다양한 분야 (소셜 네트워크 분석, 추천시스템 등)에서 그래프 데이터 (그림 1) 의 중요성이 대두되고 있으며, 이에 따라 그래프 신경망(Graph Neural Network) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서는 심층 학습 모델을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 소셜 네트워크의 특정 사용자에 `20대'라는 레이블을 부여하는 행위), 이 과정은 일반적으로 수작업으로 진행되므로 노동력과 시간이 소요된다. 따라서 그래프 신경망 모델 훈련 시 데이터가 충분하지 않은 상황을 효과적으로 타개하는 방법의 필요성이 대두되고 있다.
우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 25일 밝혔다.
정점의 레이블이 없는 상황에서 그래프 신경망 모델의 훈련은 데이터 증강을 통해 생성된 정점들의 공통된 특성을 학습하는 과정으로 볼 수 있다. 하지만 이러한 정점의 공통된 특성을 학습하는 과정에서, 기존 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 하지만 그래프 데이터가 정점들 사이의 관계를 나타내는 데이터 구조라는 점을 고려했을 때, 이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다.
박 교수팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해준다.
KAIST 산업및시스템공학과 이남경 석사과정이 제1 저자, 현동민 박사, 이준석 석사과정 학생이 제2, 제3 저자로 참여한 이번 연구는 최고권위 국제학술대회 `정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명: Relational Self-Supervised Learning on Graphs)
기존 연구에서는 정점의 레이블이 없는 상황에서 정점에 대한 표상을 훈련하기 위해 표상 공간 내에서 자기 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 예를 들어서, 소셜 네트워크에 A, B, C 라는 사용자가 존재할 때, A, B와 C가 표상 공간에서 서로 간의 유사도가 모두 작아지도록 모델을 훈련하는 것이다. 이때 박 교수팀이 착안한 점은 그래프 데이터가 정점 간의 관계를 나타내는 데이터이므로 정점 간의 관계를 포착하도록 정점의 표상을 훈련할 필요가 있다는 점이었다.
즉, A, B와 C 서로 간의 유사도가 모두 작아지게 하는 훈련 메커니즘과는 달리, 실제 그래프상에서는 이들이 연관이 있을 수 있다는 점이다. 따라서 A, B와 C 사이의 관계를 긍정/부정의 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련을 하는 것이 아닌, 이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 연구팀은 개발했다(그림 2). 연구팀은 정점 간의 관계를 기반으로 정점의 표상을 훈련함으로써, 기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 모델링했다.
연구팀은 이 학습 방법론을 `관계 보존 학습'이라고 명명했으며, 그래프 데이터 분석의 주요 문제(정점 분류, 간선 예측)에 적용했다(그림 3). 그 결과 최신 연구 방법론과 비교했을 때, 정점 분류 문제에서 최대 3% 예측 정확도를 향상했고, 간선 예측 문제에서 6%의 성능 향상, 다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서 3%의 성능 향상을 보였다.
제1 저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ 이라면서 "그래프 기반의 데이터뿐만이 아닌 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어, 심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다.
연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시하여 학계에 큰 파급효과를 낼 수 있다ˮ라고 말했다.
한편, 이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.
2022.10.25
조회수 6011
-
이성주, 신진우 교수팀, 스스로 새로운 환경 적응하는 인공지능 기술 개발
우리 대학 전기및전자공학부 이성주 교수와 AI대학원 신진우 교수 연구팀이 공동연구를 통해 스스로 환경변화에 적응하는 테스트타임 적응 인공지능 기술을 개발했다고 밝혔다.
해당 연구는 “NOTE: Robust Continual Test-time Adaptation Against Temporal Correlation”라는 제목으로 인공지능 분야 최고권위 국제학술대회 ‘신경정보처리시스템학회(NeurIPS) 2022'에서12월 발표될 예정이다.
이성주 교수와 신진우 교수 공동 연구팀이 스스로 새로운 환경에 적응하는 “테스트타임 적응 (Test-Time Adaptation)” 인공지능 기술을 개발하였다. 연구팀이 제안한 알고리즘은 기존의 최고 성능 알고리즘보다 평균 11% 향상된 정확도를 보였다.
기계학습 모델들의 한계점은 학습했던 데이터와 다른 분포의 데이터에 적용되면 성능이 급격히 하락한다는 것이다. 이를 푸는 여러 방법 중에서 데이터를 미리 수집할 필요없이 모델이 스스로 테스트 데이터를 분석하여 변하는 환경에 적응하고 성능을 향상시키는 기술인 테스트타임 도메인 적응 (Test-Time Adaptation) 방법이 최근 산학계에서 크게 각광을 받고 있었다.
연구팀은 기존의 테스트타임 도메인 적응 기술들이 모두 데이터가 이상적인 균일분포를 따른다는 가정을 한다는 문제점에 착안했다. 실제 데이터는 환경 변화나 시간 변화에 따라 데이터 분포가 변하거나 비균일분포의 데이터에 대해서는 기존 기술을 동작하지 않는다. 하지만 연구팀이 제시한 “NOTE” 기술은 비균일분포의 데이터에서도 기존 최대 성능 알고리즘 보다 평균 11%만큼 향상된 정확도를 보였다.
이성주 교수 연구팀과 신진우 교수 연구팀의 공동연구로, 공태식 박사과정이 제1저자로 연구를 이끌었고, 정종헌 박사과정, 김태원 학사과정, 김예원 석사과정이 공동 저자로 기여하였다.
이성주 교수와 신진우 교수는 ”테스트타임 도메인 적응은 인공지능이 스스로 환경 변화에 적응하여 성능을 향상시키는 기술로, 활용도가 무궁무진하다. 이번에 발표될 NOTE 기술은 실제 데이터 분포에서 성능향상을 보인 최초의 기술이고 자율주행, 인공지능 의료, 모바일 헬스케어 등 다양한 분야에 적용이 가능할 것으로 기대된다.” 라고 밝혔다.
이 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원 (No. NRF-2020R1A2C1004062)과 방위사업청과 국방과학연구소의 지원(UD190031RD)으로 한국과학기술원 미래 국방 인공지능 특화연구센터에서 수행된 연구이다.
2022.10.21
조회수 7393
-
인공지능 심층 학습(딥러닝) 서비스 구축 비용 최소화 가능한 데이터 정제 기술 개발
최근 다양한 분야에서 인공지능 심층 학습(딥러닝) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서 인공지능은 심층신경망을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 고양이 사진에 `고양이'라고 정답을 적어줌), 이 과정은 일반적으로 수작업으로 진행되므로 엄청난 노동력과 시간적 비용이 소요된다. 따라서 훈련 데이터 구축 비용을 최소화하는 방법 개발이 요구되고 있다.
우리 대학 전산학부 이재길 교수 연구팀이 심층 학습 훈련 데이터 구축 비용을 최소화할 수 있는 새로운 데이터 동시 정제 및 선택 기술을 개발했다고 12일 밝혔다.
일반적으로 심층 학습용 훈련 데이터 구축 과정은 수집, 정제, 선택 및 레이블링 단계로 이뤄진다. 수집 단계에서는 웹, 카메라, 센서 등으로부터 대용량의 데이터가 정제되지 않은 채로 수집된다. 따라서 수집된 데이터에는 목표 서비스와 관련이 없어서 주어진 레이블에 해당하지 않는 분포 외(out-of-distribution) 데이터가 포함된다 (예를 들어, 동물 사진을 수집할 때 재규어 `자동차'가 포함됨). 이러한 분포 외 데이터는 데이터 정제 단계에서 정제돼야 한다. 모든 정제된 데이터에 정답지를 만들기 위해서는 막대한 비용이 소모되는데, 이를 최소화하기 위해 심층 학습 성능 향상에 가장 도움이 되는 훈련 데이터를 먼저 선택해 레이블링하는 능동 학습(active learning)이 큰 주목을 받고 있다. 그러나 정제와 레이블링을 별도로 진행하는 것은 데이터 검사 측면에서 중복적인 비용을 초래한다. 또한 아직 정제되지 않고 남아 있는 분포 외 데이터가 레이블링 단계에서 선택된다면 레이블링 노력을 낭비할 수 있다.
이재길 교수팀이 개발한 기술은 훈련 데이터 구축 단계에서 데이터의 정제 및 선택을 동시에 수행해 심층 학습용 훈련 데이터 구축 비용을 최소화할 수 있도록 해준다.
우리 대학 데이터사이언스대학원에 재학 중인 박동민 박사과정 학생이 제1 저자, 신유주 박사과정, 이영준 박사과정 학생이 제2, 제4 저자로 각각 참여한 이번 연구는 최고권위 국제학술대회 `신경정보처리시스템학회(NeurIPS) 2022'에서 올 12월 발표될 예정이다. (논문명 : Meta-Query-Net: Resolving Purity-Informativeness Dilemma in Open-set Active Learning)
데이터의 정제 및 선택을 동시에 고려하기 위해서 구체적으로 가장 분포 외 데이터가 아닐 것 같은 데이터 중에서 가장 심층 학습 성능 향상에 도움이 될 데이터를 선택한다. 즉, 주어진 훈련 데이터 구축 비용 내에서 최고의 효과를 내도록 데이터의 순도(purity) 지표와 정보도(informativeness) 지표의 최적 균형(trade-off)을 찾는다. 순도와 정보도는 일반적으로 서로 상충하므로 최적 균형을 찾는 것이 간단하지 않다. 이 교수팀은 이러한 최적 균형이 정제 전 데이터의 분포 외 데이터 비율과 현재 심층신경망 훈련 정도에 따라 달라진다는 점을 발견했다.
이 교수팀은 이러한 최적 균형을 찾아내기 위해 추가적인 작은 신경망 모델을 도입했다. 연구팀은 추가된 모델을 훈련하기 위해 능동 학습에서 여러 단계에 걸쳐 데이터를 선별하는 과정을 활용했다. 즉, 새롭게 선택돼 레이블링 된 데이터를 순도-정보도 최적 균형을 찾기 위한 훈련 데이터로 활용했고, 레이블이 추가될 때마다 최적 균형을 갱신했다. 이러한 방법은 목표 심층신경망의 성능 향상을 위해 추가적인 상위 레벨의 신경망을 사용하였다는 점에서 메타학습(meta-learning)의 일종이라 볼 수 있다.
연구팀은 이 메타학습 방법론을 `메타 질의 네트워크'라고 이름 붙이고 이미지 분류 문제에 대해 다양한 데이터와 광범위한 분포 외 데이터 비율에 걸쳐 방법론을 검증했다. 그 결과, 기존 최신 방법론과 비교했을 때 최대 20% 향상된 최종 예측 정확도를 향상했고, 모든 범위의 분포 외 데이터 비율에서 일관되게 최고 성능을 보였다. 또한, `메타 질의 네트워크'의 최적 균형 분석을 통해, 분포 외 데이터의 비율이 낮고 현재 심층신경망의 성능이 높을수록 정보도에 높은 가중치를 둬야 함을 연구팀은 밝혀냈다.
제1 저자인 박동민 박사과정 학생은 "이번 기술은 실세계 능동 학습에서의 순도-정보도 딜레마를 발견하고 해결한 획기적인 방법ˮ 이라면서 "다양한 데이터 분포 상황에서의 강건성이 검증됐기 때문에, 실생활의 기계 학습 문제에 폭넓게 적용될 수 있어 전반적인 심층 학습의 훈련 데이터 준비 비용 절감에 기여할 것ˮ 이라고 밝혔다.
연구팀을 지도한 이재길 교수도 "이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있을 것이다ˮ고 말했다.
한편, 이 기술은 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 SW컴퓨팅산업원천기술개발사업 SW스타랩 과제로 개발한 연구성과 결과물(2020-0-00862, DB4DL: 딥러닝 지원 고사용성 및 고성능 분산 인메모리 DBMS 개발)이다.
2022.10.12
조회수 6775