본문 바로가기 대메뉴 바로가기

KAIST

연구뉴스

홈페이지 통합검색

-

%EB%8D%B0%EC%9D%B4%ED%84%B0

와이파이보다 100배 빠른‘라이파이’속도·보안 다 잡았다 라이파이(Li-Fi)는 LED 불빛처럼 눈에 보이는 빛인 가시광선 대역(400~800 THz)을 활용한 무선통신 기술로, 기존 와이파이(Wi-Fi)보다 최대 100배 빠른 속도(최대 224Gbps)를 제공한다. 사용할 수 있는 주파수 할당의 제약이 없고 전파 혼신 문제도 적지만, 누구나 접근이 가능해서 보안에는 상대적으로 취약하다. 한국 연구진이 기존 광통신 소자의 한계를 뛰어넘어 송신 속도와 보안을 동시에 향상시킬 수 있는 라이파이의 새로운 플랫폼을 제시했다. 우리 대학 신소재공학과 조힘찬 교수 연구팀이 국가과학기술연구회(NST, 이사장 김영식) 산하 한국표준과학연구원(KRISS, 원장 이호성) 임경근 박사와 협력해, 차세대 초고속 데이터 통신으로 주목받는 ‘라이파이(Li-Fi)’ 활용을 위한 ‘온-디바이스 암호화 광통신 소자’ 기술을 개발했다고 24일 밝혔다. 조힘찬 교수팀은 친환경 양자점(독성이 적고 지속 가능한 소재)을 이용해 고효율 발광 트라이오드 소자를 만들었다. 연구팀이 개발한 소자는 전기장을 이용해 빛을 발생시키는 장치이다. 특히, ‘투과 전극에 존재하는 아주 작은 구멍(핀홀)’ 영역에 전기장이 집중되고 전극 너머로 투과되는데, 이 소자는 이를 이용하여 두 가지 입력 데이터를 동시에 처리할 수 있다. 이 원리를 이용해 연구팀은 ‘온-디바이스 암호화 광송신 소자’라는 기술을 개발했다. 이 기술의 핵심은 기기 자체에서 정보를 빛으로 바꾸면서 동시에 암호화까지 한다는 점이다. 즉, 복잡한 별도의 장비 없이도 보안이 강화된 데이터 전송이 가능하다. 외부양자효율(EQE)은 전기를 얼마나 효율적으로 빛으로 변환하는지를 나타내는 지표로, 상용화를 위한 기준은 일반적으로 약 20% 수준이다. 이번에 개발된 소자는 17.4%의 EQE를 기록했으며, 휘도(luminance) 또한 스마트폰 OLED 화면의 최대 밝기인 2,000nit를 크게 웃도는 29,000nit로, 10배 이상의 높은 밝기를 구현했다. 또한, 연구팀은 이 소자가 어떻게 정보를 빛으로 바꾸는지를 더 정확히 이해하기 위해, ‘과도 전계 발광 분석’이라는 방법을 사용하여, 아주 짧은 시간(수백 나노초 = 10억 분의 1초 단위) 동안 전압을 순간적으로 인가했을 때, 소자에서 발생하는 발광 특성을 분석했다. 이 분석을 통해 수백 나노초 단위에서 소자 내 전하들의 이동을 분석해 단일 소자 내에서 구현되는 이중채널 광변조의 작동 메커니즘을 규명했다. KAIST 조힘찬 교수는 “이번 연구는 기존의 광통신 소자의 한계를 뛰어넘어 송신 속도를 높이면서도 보안능력을 향상할 수 있는 새로운 통신 플랫폼을 제시했다”라고 언급했다. 이어 “추가 장비 없이도 보안을 강화하면서, 암호화와 송신을 동시에 구현하는 이번 기술은 향후 보안이 중요한 다양한 분야에서 폭넓게 응용될 수 있을 것”이라고 덧붙였다. KAIST 신소재공학과 신승민 박사과정이 제1 저자로 참여하고, 조힘찬 교수, KRISS 임경근 박사가 공동 교신 저자로 참여한 이번 연구는 국제학술지 `어드밴스드 머터리얼즈(Advanced Materials)'에 5월 30일 자 출판됐으며, inside front cover 논문으로 선정됐다. ※ 논문명: High-Efficiency Quantum Dot Permeable electrode Light-Emitting Triodes for Visible-Light Communications and On-Device Data Encryption ※ DOI: https://doi.org/10.1002/adma.202503189 한편, 이번 연구는 한국연구재단, 국가과학기술연구회(NST) 및 한국산업기술진흥원의 지원을 받아 수행됐다.
2025.06.24 조회수 1380
건설재료의 성능 평가를 위한 실험 자동화 시스템 개발 빅데이터와 인공지능 기반의 건설재료 품질관리 혁신 기술 제시 우리 대학 건설및환경공학과 김재홍 교수 연구팀은 시멘트 분산제의 성능을 정밀하게 평가할 수 있는 자동화 실험 시스템을 개발했다. 이 시스템은 기존 수작업 실험의 한계를 극복하고, 데이터 사이언스와 머신러닝 기법을 활용해 시멘트 기반 재료의 품질 관리를 혁신적으로 개선할 수 있는 길을 열었다. 건설재료 품질관리의 도전과제 콘크리트는 전 세계에서 가장 많이 생산되는 공학 재료지만, 시멘트와 골재 같은 원재료가 지역마다 성질이 달라 품질과 성능의 변동성이 크다. 따라서 콘크리트 재료의 성능 시험에는 많은 수의 샘플이 필요하며, 이는 노동 집약적인 작업으로 이어진다. 김재홍 교수는 "건설재료는 다른 공학 재료에 비해 변동성이 매우 크기 때문에, 재료의 성능평가 신뢰성을 높이려면 충분한 양의 데이터가 필요합니다. 이를 위해서는 많은 수의 샘플을 제조하고 테스트해야 하는데, 기존의 수작업 방식으로는 단순히 품질 검증을 위한 작은 수의 샘플을 사용하여 현장에서 불량 레미콘 등의 문제가 종종 발생하고 있습니다"라고 설명했다. 혁신적인 자동화 실험 시스템 연구팀이 개발한 자동화 실험 시스템은 230mL 모르타르 샘플의 레올로지 특성을 정밀하게 측정할 수 있다. 이 시스템은 시료 준비, 재료 혼합, 레올로지 측정 등의 과정을 모두 자동화하여 인력 투입 없이도 정확하고 일관된 데이터를 생산할 수 있다. 연구팀은 이 시스템을 사용해 130개의 모르타르 샘플을 분석하여 시멘트 분산제의 효과를 포괄적으로 특성화했다. 주성분 분석(PCA)을 통해 토크 측정값의 뚜렷한 패턴을 발견했으며, 이를 통해 패턴의 분산을 설명하고 분산제 성능 차이를 효과적으로 포착할 수 있었다. 특히 이 자동화 시스템은 7%의 변동 계수로 우수한 재현성을 달성했으며, 이는 재료의 고유한 변동성으로 간주될 수 있다. 또한 관찰 기반 학습을 통해 시스템의 유용성을 확장하여 유동성과 블리딩 속도를 성공적으로 예측할 수 있었다. 이 내용은 건설공학 분야에서 권위 있는 학술지인 Cement and Concrete Research에 "Automated experimentation for evaluating cement dispersant performance"라는 제목으로 게재되었다. (https://doi.org/10.1016/j.cemconres.2025.107895) 연구 결과 및 향후 계획 연구 결과는 3세대 시멘트 분산제의 우수한 성능을 확인하는 동시에, 분산제 사용량-레올로지 관계에 대한 통합적인 분석을 제시하였다. 이러한 자동화 실험 방식은 시멘트 기반 재료의 더 효율적이고 포괄적인 평가를 위한 프레임워크를 확립했다는 데 의의가 있다. 김재홍 교수는 "이번 연구에서 개발한 자동화 실험 시스템은 단순히 실험 과정을 자동화하는 것을 넘어, 데이터 사이언스와 머신러닝을 통합하여 건설재료의 품질관리 패러다임을 변화시킬 수 있는 잠재력을 가지고 있습니다"라고 강조했다. 한편, 연구팀은 건설재료의 성능 평가를 위한 자동화 실험 시스템 개발에 앞서, 건설재료의 특성에 적합한 머신러닝 알고리즘을 개발하였다. KAIST 건설및환경공학과/데이터사이언스대학원 강인국 박사과정이 제1저자로 참여한 관찰 기반 학습(observation-based learning), 도메인 적응(domain adaptation) 학습 알고리즘 등에 관한 연구는, 건설공학 분야에서 권위 있는 학술지인 Cement & Concrete Composites 등에 게재되었다. (https://doi.org/10.1016/j.cemconcomp.2025.105943, https://doi.org/10.1016/j.conbuildmat.2023.133811). 연구팀은 앞으로 이 자동화 시스템을 확장하여 시멘트 분산제 성능 평가뿐만 아니라 강도 발현, 수화열, 내구성 등 다양한 콘크리트 성능 지표에 대한 자동화 실험을 수행할 계획이다. 또한 해외건설 및 국내건설 현장의 건설재료 변동성으로 인한 시공실패를 사전에 예측하고 방지하기 위한 성능평가 실험 자동화 및 로봇 플랫폼을 확장 구축할 예정이다. 김 교수는 "궁극적으로 우리의 목표는 건설산업에서 전문 테크니션 부족 문제, 기능인력 노령화 문제, 주52시간제 시행 등에 대응하기 위한 건설재료 품질관리 및 성능평가의 완전한 자동화 시스템을 구축하는 것입니다. 이를 통해 데이터 기반의 의사결정이 가능한 스마트 건설 환경을 조성하고자 합니다"라고 밝혔다. 이 연구는 과학기술정보통신부의 재원으로 한국연구재단의 지원을 받아 수행되었다.
2025.04.14 조회수 2646
논문 마이닝부터 합성 조건 추천까지, MOF 연구를 혁신하는 대규모 언어 모델 우리 연구진이 챗GPT를 활용해 금속 유기 골격체(Metal-Organic Frameworks, MOFs) 연구 논문에서 실험 데이터를 자동으로 추출하는 데이터 마이닝 툴(이하 L2M3)을 개발했다. L2M3는 MOF의 합성 조건 및 물성 정보를 체계적으로 수집하며, 분류, 정보 식별 및 데이터 추출 작업에서 각각 98.3%, 97.3%, 95.3%의 높은 정확도를 기록했다. 또한, 추출한 데이터를 기반으로 MOF의 합성 조건을 추천하는 시스템을 개발하여 연구자들의 실험 과정 최적화를 지원하고 있어 화제가 되고 있다. 우리 대학 생명화학공학과 김지한 교수 연구팀이 대규모 언어 모델(이하 LLMs) 급격한 발전에 주목하며, 이를 활용을 통해 금속 유기 골격체 문헌에서 MOF의 합성 및 물성 정보를 대량으로 추출하는 데이터 마이닝 툴(L2M3)를 개발했다고 7일 발표했다. 최근 MOF에 대한 연구들이 활발히 진행되어 MOF 실험 데이터가 축적되고 있다. 이에 따라 MOF 연구의 발전을 위해서는 신뢰할 수 있는 실험 데이터 확보가 필수적이며, 특히 논문에 산재한 합성 조건과 물성 정보를 효과적으로 정리하는 것이 큰 과제로 남아 있다. 기존에도 MOF 관련 데이터를 활용하려는 시도가 있었으나, 대부분 일부 특정 특성에 국한되어 있어 있다는 한계점이 존재했다. 김지한 교수 연구팀이 개발한 L2M3는 LLM을 활용하여 쉽고 효율적인 데이터 마이닝 환경을 구축함으로써, 데이터 마이닝에 익숙하지 않은 연구자들도 손쉽게 사용할 수 있는 강력한 도구로의 잠재력을 갖추고 있다. 기존 데이터 마이닝 방식으로는 다양한 특성에 대한 정확한 정보 추출이 어려웠으나, L2M3는 LLM의 자연어 처리 능력을 활용하여 더 정밀한 데이터 추출이 가능하다. 특히, 분류(98.3%)와 정보 식별(97.3%)에서 높은 정확도를 기록했으며, 과정이 복잡하여 정확도 확보가 어려운 데이터 추출 단계에서도 95.3%라는 뛰어난 성능을 보였다. 뿐만 아니라, L2M3는 추출된 합성 조건 데이터를 대규모 언어 모델로 미세 조정해 합성 조건 추천 시스템을 개발하였다. 연구자가 전구체 정보를 입력하면 최적의 합성 조건을 제안하여 실험 과정에서 발생하는 시행착오를 줄이고, MOF 합성을 더욱 효율적으로 수행할 수 있도록 지원한다. 이러한 접근 방식은 MOF 연구뿐만 아니라 다양한 재료 과학 분야에서도 데이터 마이닝과 인공지능을 활용한 연구 패러다임을 새롭게 정의할 수 있는 가능성을 제시하고 있다. 김지한 교수는 “이번 연구는 인공지능을 활용한 재료 과학 연구의 새로운 기준을 제시하는 중요한 진전을 의미한다. L2M3는 방대한 과학 문헌에서 실험 데이터를 체계적으로 수집하고 분석함으로써, 기존 데이터 부족 문제를 해결하고 보다 신뢰성 높은 데이터 기반 연구를 가능하게 한다. 향후 L2M3의 데이터 처리 성능과 합성 조건 추천 모델이 더욱 정교화된다면, MOF뿐만 아니라 다양한 재료 연구에서도 혁신적인 발견을 가속화할 것으로 기대된다.” 라고 말했다. 생명화학공학과 강영훈, 이원석 박사, 배태언 박사과정이 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 `미국 화학회지(Journal of the American Chemical Society)'에 지난 1월 21일 게재됐다. (논문명: Harnessing Large Language Models to Collect and Analyze Metal–Organic Framework Property Data Set) 한편 이번 연구는 과학기술정보통신부의 탑-티어 연구기관 간 협력 플랫폼 구축 및 공동연구 지원사업, 한국연구재단(NRF)의 나노 및 소재기술개발사업, 그리고 국가슈퍼컴퓨팅센터의 지원을 받아 수행됐다.
2025.02.07 조회수 4114
천천히 걸음 속도 높여도 다 아는 인공지능 기술 개발 최근 건강에 관한 관심이 점차 커지면서 일상생활에서 스마트 워치, 스마트 링 등을 통해 자기 신체 변화를 살펴보는 일이 보편화되었다. 그런데 기존 헬스케어 앱에서는 걷기에서 뛰기로 갑자기 변화를 줄 경우는 잘 측정이 되지만 천천히 속도를 높이는 경우는 측정이 안 되는 현상이 발생했다. 우리 연구진이 완만한 변화에도 동작을 정확하게 파악하는 기술을 개발했다. 우리 대학 전산학부 이재길 교수 연구팀이 다양한 착용 기기 센서 데이터에서 사용자 상태 변화를 정확하게 검출하는 새로운 인공지능 기술을 개발했다고 12일 밝혔다. 보통 헬스케어 앱에서는 센서 데이터를 통해 사용자의 상태 변화를 탐지하여 현재 동작을 정확히 인식하는 기능이 필수이다. 이를 변화점 탐지라 부르며 다양한 인공지능 기술이 변화점 탐지 품질을 향상하기 위해 적용되고 있다. 이재길 교수팀은 사용자의 상태가 급진적으로 변하거나 점진적으로 변하는지에 관계없이 정확하게 잘 동작하는 변화점 탐지 방법론을 개발했다. 연구팀은 각 시점의 센서 데이터를 인공지능 기술을 통해 벡터*로 표현하였을 때, 이러한 벡터가 시간이 지남에 따라 이동하는 방향을 주목하였다. 같은 동작이 유지될 때는 벡터가 이동하는 방향이 급변하는 경향이 크고, 동작이 바뀔 때는 벡터가 직선상으로 이동하는 경향이 크게 나타났다. *벡터: 사용자의 시점별 상태 특성(이동속도, 자세, 움직임 등)을 나타내는 가장 좋은 수학적 개념 연구팀은 제안한 방법론을 ‘리커브(RECURVE)’라고 명명했다. 리커브(RECURVE)는 양궁 경기에 쓰이는 활의 한 종류이며, 활이 휘어 있는 모습이 데이터의 이동 방향 변화 정도(곡률)로 변화점을 탐지하는 본 방법론의 동작 방식을 잘 나타낸다고 보았다. 이 방법은 변화점 탐지의 기준을 거리에서 곡률이라는 새로운 관점으로 바라본 매우 신선한 방법이라는 평가를 받았다. 연구팀은 변화점 탐지 문제에서 다양한 헬스케어 센서 스트림 데이터를 사용하여 방법론의 우수성을 검증하여 기존 방법론에 비해 최대 12.7% 정확도 향상을 달성했다. 연구팀을 지도한 이재길 교수는 "센서 스트림 데이터 변화점 탐지 분야의 새로운 지평을 열 만한 획기적인 방법이며 실용화 및 기술 이전이 이뤄지면 실시간 데이터 분석 연구 및 디지털 헬스케어 산업에 큰 파급효과를 낼 수 있을 것이다ˮ고 말했다. 데이터사이언스대학원을 졸업한 신유주 박사가 제1 저자, 전산학부 박재현 석사과정 학생이 제2 저자로 참여한 이번 연구는 최고권위 국제학술대회 `신경정보처리시스템학회(NeurIPS) 2024'에서 올 12월 발표될 예정이다. (논문명 : Exploiting Representation Curvature for Boundary Detection in Time Series) 한편, 이 기술은 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 SW컴퓨팅산업원천기술개발사업 SW스타랩 과제로 개발한 연구성과 결과물(RS-2020-II200862, DB4DL: 딥러닝 지원 고사용성 및 고성능 분산 인메모리 DBMS 개발)이다.
2024.11.12 조회수 5199
미토콘드리아 DNA 돌연변이를 밝혀내다 우리 몸의 세포는 평생 동안 DNA 돌연변이를 지속적으로 축적하며, 이는 세포 간의 유전적 다양성(모자이시즘) 및 세포 노화를 초래한다. 한국 연구진이 세포소기관 미토콘드리아 DNA의 인체 내 모자이시즘 현상을 최초로 규명했다. 우리 대학 의과학대학원 주영석 교수 연구팀 안지송 박사과정이 미토콘드리아 DNA 돌연변이 연구를 주도해 국제 과학학술지 ‘네이처 지네틱스(Nature Genetics)’ 7월 22일 字 온라인판에 게재했다고 24일 밝혔다. (논문명: Mitochondrial DNA mosaicism in normal human somatic cells). 이번 연구에는 서울대학교 의과대학, 연세대학교 의과대학, 고려대학교 의과대학, 국립암센터, 그리고 KAIST 교원창업기업 이노크라스의 연구자들도 참여했다. 미토콘드리아는 세포 에너지 대사 및 사멸에 관여하는 세포소기관으로, 세포핵과 독립적으로 자체 DNA를 가지고 있으며 돌연변이도 발생할 수 있다. 하지만 이러한 돌연변이를 정밀하게 찾아내는 데 필수적인 단일세포 전장유전체(whole-genome sequencing) 기술의 한계로 그동안 미토콘드리아 DNA 돌연변이 및 모자이시즘에 대한 연구는 미흡했다. 연구팀은 31명의 정상 대장 상피 조직, 섬유아세포, 혈액에서 확보한 총 2,096개 단일세포의 전장 유전체 서열을 생명정보학 기법으로 분석해 세계 최대 규모의 연구를 수행했다. 세포 사이에서는 평균적으로 3개의 유의미한 미토콘드리아 DNA 차이가 존재했으며, 대부분은 노화 과정에서 생성됐으나 약 6%의 차이는 모계로부터 이형상태(헤테로플라스미; heteroplasmy)로 전달됨이 확인됐다. 또한, 암 발생 과정에서 돌연변이 수가 유의미하게 증가했으며, 이들 변이 중 일부는 미토콘드리아 RNA 불안정성에 기여한다는 사실도 확인했다. 관찰된 데이터를 바탕으로 연구팀은 인간의 배아 발생단계부터 노화 및 발암 과정에서의 미토콘드리아 발생 및 진화 과정을 이해할 수 있는 모델을 구축했다. 이번 연구는 사람의 정상 세포에서 발생하는 미토콘드리아 DNA 돌연변이의 형성 메커니즘을 체계적으로 밝혀내, 향후 미토콘드리아 DNA가 노화와 질병 발생에 미치는 영향을 이해하는 데 중요한 초석을 제공할 수 있을 것으로 기대된다. 의과학대학원 주영석 교수는 “전장유전체 빅데이터를 체계적으로 활용함으로써 미지의 영역이었던 생명과학 현상을 규명할 수 있다”며, “암 발생 과정뿐만 아니라 인간의 배아 발생과정 및 노화과정에서 나타나는 미토콘드리아 DNA의 변화를 체계적으로 이해할 수 있는 방법을 처음으로 수립했다” 라고 연구의 중요성을 설명했다. 한편 이번 연구는 한국연구재단 리더연구, 선도연구센터 및 서경배과학재단 신진과학자 연구지원 사업의 지원을 받아 수행됐다.
2024.07.24 조회수 7307
세계 최대 규모 암 데이터베이스 구축하다 디지털 암 정보 축적의 시대에는 데이터 생산을 넘어서, 데이터의 수집 및 관리 방법을 정립하고 거대 규모의 빅 데이터를 운용하는 것이 가장 큰 경쟁력이 될 수 있다. 전략적으로는 정밀 임상 정보와 연계할 수 있는 국내 생산 데이터와 다양성에 대한 이해를 도모할 수 있는 대규모 국제 데이터를 모두 수집해 통합하는 것은 매우 중요한 과제다. 우리 대학 의과학대학원 박종은 교수, 바이오및뇌공학과 최정균 교수 공동 연구팀(제1 저자: 강준호 박사, 이준형 박사)이 세계 최대 규모의 암 조직 단일세포 및 공간전사체* 데이터베이스를 구성하고, 이를 바탕으로 삼성서울병원 이세훈 교수 연구팀과 함께 면역 치료의 예후 예측에 중요한 세포 생태계 타입을 보고했다고 22일 밝혔다. *단일세포 및 공간전사체: 모든 유전자의 발현 양상을 개별 세포 단위에서 혹은 3차원 조직 구조상에서 분석한 데이터 암은 우리 몸 안에서 스스로 진화하는 특성을 가지고 있어 암 조직 내의 세포 생태계를 구성하는 각 세포의 이질성과 이들의 상호작용을 파악하는 것이 가장 중요하다. 최근 발달하고 있는 단일세포 및 공간 전사체는 미세환경을 구성하는 세포들과 그들의 3차원적 배열 및 상호작용을 정량적으로 측정 및 표현한다는 점에서 미세환경의 이질성 개념을 생태계 수준으로 확장해 디지털 정보의 형태로 저장 및 분석할 수 있게 한다. 연구팀은 암세포 생태계 타입들을 전 암종(pan-cancer) 수준에서 규명하기 위해 약 1,000개의 암 환자 조직 샘플, 500여 명의 정상 조직 샘플에 대한 단일세포 전사체 데이터를 30종 이상의 암종에 대해 수집하여 모든 암에 대한 세포 지도가 총망라된 전 암종 단일세포 지도(pan-cancer single-cell atlas)를 구축했다. 내과 전문의가 포함된 연구진이 직접 데이터를 수집하고, 메타데이터 재처리 및 암종 분류를 진행함으로써 암 조직을 구성하는 100여 개의 세포 상태를 규정하고, 이들의 발생빈도를 바탕으로 각 암종별 조직의 상태를 분류했다. 또한 미국의 암 환자 공공 데이터베이스(TCGA) 등의 대규모 코호트 데이터를 활용해 각 세포 상태가 암 환자의 치료 및 예후에 미치는 영향을 분석했다. 특히 여러 세포 상태 간의 상호작용 분석을 통해서 암세포 생태계 네트워크를 구축하였고, 이 중에서 삼차 림프 구조(tertiary lymphoid structure)* 구성요소를 포함하는 인터페론 연관 생태계가 삼성서울병원 이세훈 교수 연구팀의 폐암 코호트를 포함해 면역관문 억제 치료(immune checkpoint inhibitor)**를 받은 여러 암종들에서 면역관문 억제 치료 반응 예측에 효과적임을 확인했다. *삼차 림프 구조: 림프절과 유사하지만 건강한 조직에서는 형성되지 않고, 만성염증, 감염, 암 등이 있는 곳에서 면역 세포들이 조직화되어 형성되는 구조물 **면역관문 억제치료: T세포 혹은 암세포에서 발현되는 PD-1/PD-L1, CTLA-4와 같은 면역관문(immune checkpoint)을 차단하여 암세포와 싸우는 면역 반응을 활성화시키는 치료방법 연구를 주도한 박종은 교수는 “이번 연구를 통해 세계 최대 규모의 암 조직 데이터베이스를 구축하였고, 이를 바탕으로 면역 치료의 예후 예측에 중요한 영향을 줄 것이다. 또한 소수의 환자에게 아주 좋은 치료반응을 보이나 일부의 경우 면역 관련 부작용을 나타내는 면역 관문 억제제의 치료 대상군 선정에 큰 도움을 줄 것으로 기대된다.”고 말했다. 이번 연구 결과는 국제 학술지 ‘네이쳐 커뮤니케이션즈(Nature Communications)’ 지에 5월 14일 자 출판됐으며, KAIST 세포 아틀라스 웹 포탈 https://cellatlas.kaist.ac.kr 을 통해 공개되고 있다. 한편 이번 연구는 한국연구재단의 차세대바이오유망범용기술연구지원사업과 우수신진연구사업, 한국보건산업진흥원 연구중심병원 육성사업, 융합형의사과학자양성사업 및 포스코사이언스펠로우십의 지원을 받아 수행됐다.
2024.05.22 조회수 8204
인과관계 추정 정확도 높인 새로운 방법론 개발 우리 대학 수리과학과 김재경 교수 연구팀이 수학 모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다. 복잡한 계산 과정을 없애 기존보다 빠른 속도로 추론이 가능하면서도, 정확도는 획기적으로 높였다. 매 순간 다양한 데이터가 기록되고 있다. 그중 시간의 흐름을 기준으로 기록된 ‘시계열 데이터’는 일기 예보와 경제 분야뿐만 아니라 의학 분야에서도 가치 있게 쓰인다. 입원 환자의 심전도 측정을 통해 심장 발작의 직접적인 요인을 찾는 것과 같이 인과관계를 추정하는 것이 대표적이다. 최근에는 스마트 워치 등 웨어러블 기기를 통해 일상에서 건강 데이터를 쉽게 수집할 수 있게 되면서, 의학 분야에서 시계열 데이터 분석의 중요성이 더 커지고 있다. 시계열 데이터에서 인과관계를 추정하는 대표적인 방법으로는 2003년 노벨 경제학상을 수상한 클라이브 그레인저 미국 샌디에이고캘리포니아대(UC샌디에이고) 교수가 제시한 ‘그레인저 인과관계 검정(Granger causality test)’이 있다. 이는 미래 경제지표 예측, 질병 요인분석, 지구온난화의 원인 등 수많은 분야에 걸쳐 응용됐다. 그레인저 인과관계 검정을 개선한 정보 이론 기반의 다양한 인과관계 추정 방법이 개발됐지만, 일련의 방법들은 시계열 데이터가 비슷한 주기로 변화하는 동시성을 가지기만 하면, 인과관계가 있다고 잘못 예측하는 경우가 많았다. 또한, 직접적인 인과관계와 간접적인 인과관계를 구별하지 못한다는 한계도 있었다. 이러한 한계를 극복하기 위해 최근 수리 모델을 기반으로 하는 방법론들이 등장했다. 수리 모델로 주어진 시계열 데이터를 잘 맞출 수 있는지 확인하는 방법을 통해 인과관계를 예측한다. 수리 모델이 정확하기만 하면 기존 그레인저 인과관계 검정의 한계인 동시성과 간접적인 영향을 인과관계와 혼동하지 않는다는 장점이 있다. 그러나 정확한 수리 모델을 알기 힘들고, 현재까지 제시된 수리 모델 기반 방법론들은 복잡한 계산이 필요해 추정 시간이 많이 걸린다는 단점이 있다. 이러한 상황에서 연구팀은 기존 방법론들의 한계를 모두 해결한 새로운 방법론 ‘GOBI(General ODE-Based Inference)’를 개발했다. 우선, 연구팀은 시계열 데이터가 일반적인 수학 모델로 표현될 수 있는지 확인하는 수학 이론을 만들었다. 그리고 이 이론을 바탕으로 정확한 수리 모델이나 복잡한 계산 없이도 시계열 데이터로부터 인과관계를 추정하는 방법론을 개발했다. 개발한 방법론을 인과관계 분석에 적용해 본 결과 세포 내 분자들의 상호작용, 생태계 네트워크, 기상 시스템 등 다양한 분야의 데이터에서 기존 방법론에 비해 월등한 성능을 보여줬다. 특히, 동시성 및 간접적인 영향을 가지는 시계열 데이터에서도 인과관계를 성공적으로 추론했다. 연구진은 GOBI를 통해서 여러 오염 물질 중 이산화질소와 호흡기로 유입되는 부유 미립자(직경 10㎛ 이하의 입자)가 심혈관계 질환에 영향을 미친다는 것을 확인할 수 있었다. 김재경 교수는 “수학과 통계를 결합하여 정확하면서도 다양한 시스템에 유연하게 적용할 수 있는 새로운 인과관계 추정 방법론을 개발했다”며 “사회 및 자연과학 분야에 걸쳐 두루 사용되는 인과관계 추정 연구에 새로운 패러다임을 제시할 것으로 예상된다”고 말했다. 연구결과는 7월 24일 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 17.694)’ 온라인판에 실렸으며, 우리 대학 박세호 학사과정(제1저자)과 하석민 학사과정(제2저자)이 참여했다.
2023.07.26 조회수 9212
취침시간 지리/문화적 영향에 따라 더 늦어져 수면은 건강과 웰빙, 생산성에 큰 영향을 미치지만, 현대인이 얼마나 오래 그리고 잘 수면을 취하는지에 대해 정확히 보고되지 않았다. 수면의 양과 질은 개인의 선택일까, 아니면 문화와 지리와 같은 사회적 요인에 얼마나 영향을 받을까? 우리 대학 전산학부 차미영 교수가 이끄는 IBS(원장 노도영) 연구팀과 영국의 노키아 벨 연구소(Nokia Bell Labs)는 공동 연구를 통해 현대인의 ‘수면’이 어떤 사회적 및 개인적 요인에 영향을 받는다고 6일 밝혔다. 연구팀은 스마트 워치가 상용화되며 데이터의 대량 수집이 가능해진 기회에 주목했다. 노키아에서 개발한 스마트 워치를 착용한 미국, 캐나다, 스페인, 영국, 핀란드, 한국, 일본을 포함 11개국의 30,082명으로부터 4년간 수집한 5,200만 건의 데이터를 분석해 나라별 디지털 로그 기반 수면 패턴을 분석했다. 먼저 연구팀은 나라별 취침 시간, 기상 시간, 총 수면시간이 어떤지를 살폈다. 스마트워치 데이터에 기록된 취침 시간은 기존 설문지 기반 조사에 보고된 결과 대비 나라마다 수십 분에서 한 시간까지도 늦었다. 전 세계 평균 취침 시간은 자정(00:01)이고 기상 시간은 오전 7시 42분이었다. 이러한 차이는 설문조사가 가지는 편향과 함께 스마트 워치의 모션 센서가 뒤척임 없이 수면을 시작하는 순간을 정밀히 기록하는 데서 기인한다. 기상 시간은 나라별 비슷하지만 취침 시간은 지리적 문화적 영향을 상당히 받았다. 특히 국민 소득(GDP)이 높을수록 취침 시간이 늦어졌으며, 문화적으로 개인주의보다는 집단주의 지수가 높을수록 취침 시간이 늦었다. 조사된 나라 중 일본은 총 수면시간이 평균 7시간 미만으로 가장 적었으며 핀란드는 평균 수면시간이 8시간으로 가장 길었다. (그림 1) 연구팀은 이와 더불어 그동안 임상 연구에서 사용된 다양한 수면의 요소들을 정량화하여 수면 효율성(설명: 취침 중 깨지 않고 연속으로 자는 시간의 비율)과 같은 질적 요인을 분석했다. 빅데이터를 사용해 성향 점수 매칭 기법(propensity score matching methods, PSM)으로, 개인마다 문화적 요인을 고정한 상태에서 운동량을 늘어나면 수면이 어떻게 변하는지에 대한 가상 테스트를 진행했다. 그 결과 걸음 수가 늘수록 취침 시 더 빨리 잠들고 밤에 덜 깨는 긍정적 효과를 확인했다. 운동량은 수면의 질을 개선하지만, 총 수면시간을 늘리지는 않았다. 흥미롭게도 이러한 운동의 긍정적 효과는 국가별로 다르며, 특히 미국과 핀란드에서 효과가 강하게 나타난 반면 일본에서는 운동의 효과가 미미했다. 강원대학교 박성규 교수, 우리 대학 차미영 교수, 노키아 연구소의 퀘르시아 박사가 주저자로 참여한 이번 연구 결과는 국제 학술지 네이처 출판 그룹의 ‘사이언티픽 리포트(Scientific Reports)’에 게재됐다. (논문명: Social dimensions impact individual sleep quantity and quality, 사회적 차원이 개인의 수면 양과 질에 미치는 영향) 퀘르시아 박사는 “수면의 양과 질에 사회적 영향이 절반이나 차지했다. 고소득 국가에서 업무 스케줄이 과도하고 근무시간이 길어지며 취침 시간이 늦어지고, 집단주의가 강한 스페인과 일본은 사회적 요구에 부응하기 위해 취침 시간이 지연될 수 있다”고 연구 결과를 해석했다. 차미영 교수는 “수면은 웰빙, 비만, 치매 등과도 연관이 있다고 알려져 중요하다. 고령화 사회에서 국민의 건강 증진을 위해 적절한 수면의 양을 보장하고 수면의 질을 높이기 위해 개인의 노력은 물론 사회적 지원이 함께해야 한다”고 말했다. 연구팀은 이번 연구에서 개발한 수면의 지표를 쉽게 계산하는 코드를 무료로 공개해 첨단 수면 산업 발달에 기여하며, 다양한 생체 신호를 포함하는 수면에 대한 벤치마크 데이터도 추후 공개할 예정이다.
2023.07.06 조회수 6641
고성능 조립형 SSD 시스템반도체 최초 개발 최근 인공지능을 훈련하기 위해 더 많은 데이터가 필요해지면서 그 중요성은 더욱 증가하고 있으며, 이에 데이터 센터 및 클라우드 서비스를 위한 주요 저장장치인 고성능 SSD(Solid State Drive, 반도체 기억소자를 사용하는 저장장치) 제품의 필요성이 높아지고 있다. 하지만, 고성능 SSD 제품일수록 SSD 내부의 구성요소들이 서로의 성능에 크게 영향을 미치는 상호-결합형(tightly-coupled) 구조의 한계에 부딪혀 성능을 극대화하기 어려웠다. 우리 대학 전기및전자공학부 김동준 교수 연구팀이 고성능 조립형 SSD 시스템 개발을 통해 차세대 SSD의 읽기/쓰기 성능을 비약적으로 높일 뿐 아니라 SSD 수명연장에도 적용 가능한 SSD 시스템 반도체 구조를 세계 최초로 개발했다고 15일 밝혔다. 김동준 교수 연구팀은 기존 SSD 설계가 갖는 상호-결합형 구조의 한계를 밝히고, CPU, GPU 등의 비메모리 시스템 반도체 설계에서 주로 활용되는 칩 내부에서 패킷-기반 데이터를 자유롭게 전송하는 온-칩 네트워크 기술을 바탕으로 SSD 내부에 플래시 메모리 전용 온-칩 네트워크를 구성함으로써 성능을 극대화하는 상호-분리형(de-coupled) 구조를 제안했으며, 이를 통해 SSD의 프론트-엔드 설계와 백-엔드 설계의 상호 의존도를 줄여 독립적으로 설계하고 조립 가능한 ‘조립형 SSD’를 개발했다. ※온-칩 네트워크(on-chip network): CPU/GPU등의 시스템 반도체 설계에 쓰이는 칩 내부의 요소에 대한 패킷-기반 연결구조를 말한다. 온-칩 네트워크는 고성능 시스템 반도체를 위한 필수적인 설계 요소중 하나로서 반도체칩의 규모가 증가할수록 더욱 중요해지는 특징이 있다. 김동준 교수팀이 개발한 조립형 SSD 시스템 구조는 내부 구성요소 중 SSD 컨트롤러 내부, 플래시 메모리 인터페이스를 기점으로 CPU에 가까운 부분을 프론트-엔드(front-end), 플래시 메모리에 가까운 부분을 백-엔드(back-end)로 구분하고, 백-엔드의 플래시 컨트롤러 사이 간 데이터 이동이 가능한 플래시 메모리 전용 온-칩 네트워크를 새롭게 구성해, 성능 감소를 최소화하는 상호-분리형 구조를 제안했다. SSD를 구동하는 핵심 요소인 플래시 변환 계층의 일부 기능을 하드웨어로 가속하여 플래시 메모리가 갖는 한계를 능동적으로 극복할 수 있는 계기를 마련하였고 상호-분리형 구조는 플래시 변환 계층이 특정 플래시 메모리의 특성에 국한되지 않고, 프론트-엔드 설계와 백-엔드 설계를 독립적으로 수행하는 설계의 용이성을 가지는 점이 ‘조립형’ SSD 구조의 장점이라고 밝혔다. 이를 통해, 기존 시스템 대비 응답시간을 31배 줄일 수 있었고 SSD 불량 블록 관리기법에도 적용해 약 23%의 SSD 수명을 연장할 수 있다고 연구팀 관계자는 설명했다. 전기및전자공학부 김지호 박사과정이 제1 저자, 전기및전자공학부 정명수 교수가 공동 저자로 참여한 이번 연구는 미국 플로리다주 올랜도에서 열리는 컴퓨터 구조 분야 최우수 국제 학술대회인 `제50회 국제 컴퓨터 구조 심포지엄(50th IEEE/ACM International Symposium on Computer Architecture, ISCA 2023)'에서 6월 19일 발표될 예정이다. (논문명: Decoupled SSD: Rethinking SSD Architecture through Network-based Flash Controllers). 연구를 주도한 김동준 교수는 “이번 연구는 기존의 SSD가 가지는 구조적 한계를 규명했다는 점과 CPU와 같은 시스템 메모리 반도체 중심의 온-칩 네트워크 기술을 적용해 하드웨어가 능동적으로 필요한 일을 수행할 수 있다는 점에서 의의가 있으며 차세대 고성능 SSD 시장에 기여할 것으로 보인다”며, “상호-분리형 구조는 수명연장을 위해서도 능동적으로 동작하는 SSD 구조로써 그 가치가 성능에만 국한되지 않아 다양한 쓰임새를 가진다며”연구의 의의를 설명했다. 이번 연구는 컴퓨터 시스템 저장장치 분야의 저명한 연구자인 KAIST 정명수 교수와 컴퓨터 구조 및 인터커넥션 네트워크(Interconnection Network) 분야의 권위자인 김동준 교수, 두 세계적인 연구자의 융합연구를 통해 이루어낸 연구라는 의미가 있다고 관계자는 설명했다. 한편 이번 연구는 한국연구재단, 삼성전자, 반도체설계교육센터(IDEC), 정보통신기획평가원 차세대지능형반도체기술개발사업의 지원을 받아 수행됐다.
2023.06.15 조회수 8068
111배 빠른 검색엔진용 CXL 3.0 기반 AI반도체 세계 최초 개발 최근 각광받고 있는 이미지 검색, 데이터베이스, 추천 시스템, 광고 등의 서비스들은 마이크로소프트, 메타, 알리바바 등의 글로벌 IT 기업들에서 활발히 제공되고 있다. 하지만 실제 서비스에서 사용되는 데이터 셋은 크기가 매우 커, 많은 양의 메모리를 요구하여 기존 시스템에서는 추가할 수 있는 메모리 용량에 제한이 있어 이러한 요구사항을 만족할 수 없었다. 우리 대학 전기및전자공학부 정명수 교수 연구팀(컴퓨터 아키텍처 및 메모리 시스템 연구실)에서 대용량으로 메모리 확장이 가능한 컴퓨트 익스프레스 링크 3.0 기술(Compute eXpress Link, 이하 CXL)을 활용해 검색 엔진을 위한 AI 반도체를 세계 최초로 개발했다고 25일 밝혔다. 최근 검색 서비스에서 사용되는 알고리즘은 근사 근접 이웃 탐색(Approximate Nearest Neighbor Search, ANNS)으로 어떤 데이터든지 특징 벡터로 표현할 수 있다. 특징 벡터란 데이터가 가지는 특징들 각각을 숫자로 표현해 나열한 것으로, 이들 사이의 거리를 통해 우리는 데이터 간의 유사도를 구할 수 있다. 하지만 벡터 데이터 용량이 매우 커서 이를 압축해 메모리에 적재하는 압축 방식과 메모리보다 큰 용량과 느린 속도를 가지는 저장 장치를 사용하는 스토리지 방식(마이크로소프트에서 사용 중)이 사용되어 왔다. 하지만 이들 각각은 낮은 정확도와 성능을 가지는 문제가 있었다. 이에 정명수 교수 연구팀은 메모리 확장의 제한이라는 근본적인 문제를 해결하기 위해 CXL이라는 기술에 주목했다. CXL은 CPU-장치 간 연결을 위한 프로토콜로, 가속기 및 메모리 확장기의 고속 연결을 제공한다. 또한 CXL 스위치를 통해 여러 대의 메모리 확장기를 하나의 포트에 연결할 수 있는 확장성을 제공한다. 하지만 CXL을 통한 메모리 확장은 로컬 메모리와 비교해 메모리 접근 시간이 증가하는 단점을 가지고 있다. 데이터를 책으로 비유하자면 기존 시스템은 집에 해당하는 CPU 크기의 제한으로 서재(메모리 용량)를 무한정 늘릴 수 없어, 보관할 수 있는 책 개수에 제한이 있는 것이다. 이에 압축 방식은 책의 내용을 압축하여 더 많은 책을 보관하는 방법이고, 스토리지 방식은 필요한 책들을 거리가 먼 도서관에서 구해오는 것과 비슷하다. CXL을 통한 메모리 확장은 집 옆에 창고를 지어 책을 보관하는 것으로 이해될 수 있다. 연구진이 개발한 AI 반도체(CXL-ANNS)는 CXL 스위치와 CXL 메모리 확장기를 사용해 근사 근접 이웃 탐색에서 필요한 모든 데이터를 메모리에 적재할 수 있어 정확도를 높이고 성능 감소를 없앴다. 또한 근사 근접 이웃 탐색의 특징을 활용해 데이터 근처 처리 기법과 지역성을 활용한 데이터 배치 기법으로 CXL-ANNS의 성능을 한 단계 향상했다. 이는 마치 창고 스스로가 필요한 책들의 내용을 요약하고 정리해 전달하고, 자주 보는 책들은 서재에 배치해 집과 창고를 오가는 시간을 줄이는 것과 유사하다. 연구진은 CXL-ANNS의 프로토타입을 자체 제작해 실효성을 확인하고, CXL-ANNS 성능을 기존 연구들과 비교했다. 마이크로소프트, 메타, 얀덱스 등의 글로벌 IT 기업에서 공개한 검색 데이터 셋을 사용한 근사 근접 이웃 탐색의 성능 비교에서 CXL-ANNS는 기존 연구들 대비 평균 111배 성능 향상이 있었다. 특히, 마이크로소프트의 상용화된 서비스에서 사용되는 방식과 비교하였을 때 92배의 성능 향상을 보여줬다. 정명수 교수는 "이번에 개발한 CXL-ANNS는 기존 검색 엔진의 문제였던 메모리 용량 제한 문제를 해결하고, CXL 기반의 메모리 확장이 실제 적용될 때 발생하는 메모리 접근 시간 지연 문제를 해결했다ˮ며, “제안하는 CXL 기반 메모리 확장과 데이터 근처 처리 가속의 패러다임은 검색 엔진뿐만 아니라 빅 데이터가 필요한 고성능 컴퓨팅, 유전자 탐색, 영상 처리 등의 다양한 분야에도 적용할 수 있다ˮ라고 말했다. 이번 연구는 미국 보스턴에서 오는 7월에 열릴 시스템 분야 최우수 학술대회인 유즈닉스 연례 회의 `USENIX Annual Technical Conference, 2023'에 ‘CXL-ANNS’이라는 이름으로 발표된 예정이다. (논문명: CXL-ANNS: Software-Hardware Collaborative Memory Disaggregation and Computation for Billion-Scale Approximate Nearest Neighbor Search) 한편 해당 연구는 파네시아(http://panmnesia.com)의 지원을 받아 진행됐다.
2023.05.25 조회수 9129
암세포만 공략하는 스마트 면역세포 시스템 개발 우리 대학 바이오및뇌공학과 최정균 교수와 의과학대학원 박종은 교수 공동연구팀이 인공지능과 빅데이터 분석을 기반으로 스마트 면역세포를 통한 암 치료의 핵심 기술을 개발했다고 밝혔다. 이 기술은 키메라 항원 수용체(Chimeric antigen receptor, CAR)가 논리회로를 통해 작동하게 함으로써 정확하게 암세포만 공략할 수 있도록 하는 차세대 면역항암 치료법으로 기대가 모아진다. 이번 연구는 분당차병원 안희정 교수와 가톨릭의대 이혜옥 교수가 공동연구로 참여했다. 최정균 교수 연구팀은 수백만개의 세포에 대한 유전자 발현 데이터베이스를 구축하고 이를 이용해 종양세포와 정상세포 간의 유전자 발현 양상 차이를 논리회로 기반으로 찾아낼 수 있는 딥러닝 알고리즘을 개발하고 검증하는 데 성공했다. 이 방법론으로 찾아진 논리회로를 장착한 CAR 면역세포는 마치 컴퓨터처럼 암과 정상 세포를 구별하여 작동함으로써 부작용없이 암세포만 정확하게 공략하는 것이 가능하다. 바이오및뇌공학과 권준하 박사, 의과학대학원 강준호 박사과정 학생이 공동 제1 저자로 참여한 이번 연구는 국제 학술지 '네이처 바이오테크놀로지(Nature Biotechnology)'에 지난 2월 16일 출판됐다. (논문명: Single-cell mapping of combinatorial target antigens for CAR switches using logic gates) 최근의 암 연구에서 가장 많은 시도와 진전이 있었던 분야는 바로 면역항암치료이다. 암환자가 갖고 있는 면역체계를 활용하여 암을 극복하는 이 치료 분야에는 몇 가지 방법이 있는데, 면역관문억제제 및 암백신과 더불어 세포치료 또한 해당된다. 특히, 키메라 항원 수용체를 장착한 CAR-T 혹은 CAR-NK라고 하는 면역세포들은 암항원을 인식하여 암세포를 직접 파괴할 수 있다. CAR 세포치료는 현재 혈액암에서의 성공을 시작으로 고형암으로 그 적용 범위를 넓히고자 하는 중인데, 혈액암과 달리 고형암에서는 부작용을 최소화하면서 효과적인 암 살상 능력을 보유하는 CAR 세포 개발에 어려움이 있었다. 이에 따라 최근에는 한 단계 진보된 CAR 엔지니어링 기술, 즉 AND, OR, NOT 과 같은 컴퓨터 연산 논리회로를 활용해 효과적으로 암세포를 공략할 수 있는 스마트 면역세포 개발이 활발히 진행되고 있다. 이러한 시점에서, 연구진은 세포 단위에서 정확히 암세포들에서만 발현하는 유전자들을 발굴하기 위해 대규모 암 및 정상 단일세포 데이터베이스를 구축했다. 이어서 연구진은 암세포들과 정상세포들을 가장 잘 구별할 수 있는 유전자 조합을 검색하는 인공지능 알고리즘을 개발했다. 특히 이 알고리즘은, 모든 유전자 조합에 대한 세포 단위 시뮬레이션을 통해 암세포만을 특이적으로 공략할 수 있는 논리회로를 찾아내는데 사용되었다. 이 방법론으로 찾아진 논리회로를 장착한 CAR 면역세포는 마치 컴퓨터처럼 암과 정상 세포를 구별하여 작동함으로써 부작용은 최소화하면서도 항암치료의 효과는 극대화시킬 수 있을 것으로 기대된다. 제1 저자인 권준하 박사는 "이번 연구는 이전에 시도된 적이 없는 방법론을 제시했는데, 특히 주목할 점은 수백만개의 개별 암세포 및 정상세포들에 대한 시뮬레이션을 통해 최적의 CAR 세포용 회로들을 찾아낸 과정이다ˮ라며 "인공지능과 컴퓨터 논리회로를 면역세포 엔지니어링에 적용하는 획기적인 기술로서 혈액암에서 성공적으로 사용되고 있는 CAR 세포치료가 고형암으로 확대되는데 중요한 역할을 할 것으로 기대된다"고 설명했다.ﾠ 이번 연구는 한국연구재단 원천기술개발사업-차세대응용오믹스사업의 지원을 받아 수행됐다.
2023.03.02 조회수 14743
레이블 없이 훈련 가능한 그래프 신경망 모델 기술 개발 최근 다양한 분야 (소셜 네트워크 분석, 추천시스템 등)에서 그래프 데이터 (그림 1) 의 중요성이 대두되고 있으며, 이에 따라 그래프 신경망(Graph Neural Network) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서는 심층 학습 모델을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 소셜 네트워크의 특정 사용자에 `20대'라는 레이블을 부여하는 행위), 이 과정은 일반적으로 수작업으로 진행되므로 노동력과 시간이 소요된다. 따라서 그래프 신경망 모델 훈련 시 데이터가 충분하지 않은 상황을 효과적으로 타개하는 방법의 필요성이 대두되고 있다. 우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 25일 밝혔다. 정점의 레이블이 없는 상황에서 그래프 신경망 모델의 훈련은 데이터 증강을 통해 생성된 정점들의 공통된 특성을 학습하는 과정으로 볼 수 있다. 하지만 이러한 정점의 공통된 특성을 학습하는 과정에서, 기존 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 하지만 그래프 데이터가 정점들 사이의 관계를 나타내는 데이터 구조라는 점을 고려했을 때, 이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다. 박 교수팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해준다. KAIST 산업및시스템공학과 이남경 석사과정이 제1 저자, 현동민 박사, 이준석 석사과정 학생이 제2, 제3 저자로 참여한 이번 연구는 최고권위 국제학술대회 `정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명: Relational Self-Supervised Learning on Graphs) 기존 연구에서는 정점의 레이블이 없는 상황에서 정점에 대한 표상을 훈련하기 위해 표상 공간 내에서 자기 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 예를 들어서, 소셜 네트워크에 A, B, C 라는 사용자가 존재할 때, A, B와 C가 표상 공간에서 서로 간의 유사도가 모두 작아지도록 모델을 훈련하는 것이다. 이때 박 교수팀이 착안한 점은 그래프 데이터가 정점 간의 관계를 나타내는 데이터이므로 정점 간의 관계를 포착하도록 정점의 표상을 훈련할 필요가 있다는 점이었다. 즉, A, B와 C 서로 간의 유사도가 모두 작아지게 하는 훈련 메커니즘과는 달리, 실제 그래프상에서는 이들이 연관이 있을 수 있다는 점이다. 따라서 A, B와 C 사이의 관계를 긍정/부정의 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련을 하는 것이 아닌, 이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 연구팀은 개발했다(그림 2). 연구팀은 정점 간의 관계를 기반으로 정점의 표상을 훈련함으로써, 기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 모델링했다. 연구팀은 이 학습 방법론을 `관계 보존 학습'이라고 명명했으며, 그래프 데이터 분석의 주요 문제(정점 분류, 간선 예측)에 적용했다(그림 3). 그 결과 최신 연구 방법론과 비교했을 때, 정점 분류 문제에서 최대 3% 예측 정확도를 향상했고, 간선 예측 문제에서 6%의 성능 향상, 다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서 3%의 성능 향상을 보였다. 제1 저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ 이라면서 "그래프 기반의 데이터뿐만이 아닌 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어, 심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다. 연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시하여 학계에 큰 파급효과를 낼 수 있다ˮ라고 말했다. 한편, 이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.
2022.10.25 조회수 8635

34141 대전광역시 유성구 대학로 291 한국과학기술원(KAIST) T.042-350-2114 F.042-350-2210(2220)

Copyright (C) 2020, Korea Advanced Institute of Science and Technology, All Rights Reserved.