
< 사진 1. (왼쪽부터) KAIST 송민규 박사과정, 김재한 박사과정, 손수엘 교수 (우측상단) 신승원 교수, 나승호 책임연구원 >
구글 Gemini 등 대부분의 주요 상용 거대언어모델(LLM)은 효율성을 높이기 위해 여러 개의 ‘작은 AI 모델(전문가 AI)’를 상황에 따라 선택해 사용하는 전문가 혼합(Mixture-of-Experts, MoE) 구조를 활용하고 있다. 그러나 이 구조가 오히려 새로운 보안 위협이 될 수 있다는 사실이 KAIST 연구진에 의해 세계 최초로 밝혀졌다.
우리 대학 전기및전자공학부 신승원 교수와 전산학부 손수엘 교수 공동연구팀이 전문가 혼합 구조를 악용해 거대언어모델의 안전성을 심각하게 훼손할 수 있는 공격 기법을 세계 최초로 규명하고, 해당 연구로 정보보안 분야 최고 권위 국제 학회인 ACSAC 2025에서 최우수논문상(Distinguished Paper Award)을 수상했다고 26일 밝혔다.
ACSAC(Annual Computer Security Applications Conference)는 정보보안 분야에서 가장 영향력 있는 국제 학술대회 중 하나로, 올해 전체 논문 가운데 단 2편만이 최우수논문으로 선정됐다. 국내 연구진이 인공지능 보안 분야에서 이 같은 성과를 거둔 것은 매우 이례적이다.
연구팀은 이번 연구에서 전문가 혼합 구조의 근본적인 보안 취약성을 체계적으로 분석했다. 특히 공격자가 상용 거대언어모델의 내부 구조에 직접 접근하지 않더라도, 악의적으로 조작된 ‘전문가 모델’ 하나만 오픈소스로 유통될 경우, 이를 활용한 전체 거대언어모델이 위험한 응답을 생성하도록 유도될 수 있음을 입증했다.

< 그림 1. 연구팀이 제안한 공격 기술 개념도 >
쉽게 말해, 정상적인 AI 전문가들 사이에 단 하나의 ‘악성 전문가’만 섞여 있어도, 특정 상황에서 그 전문가가 반복적으로 선택되며 전체 AI의 안전성이 무너질 수 있다는 것이다. 이 과정에서도 모델의 성능 저하는 거의 나타나지 않아, 문제를 사전에 발견하기 어렵다는 점이 특히 위험한 요소로 지적됐다.
실험 결과, 연구팀이 제안한 공격 기법은 유해 응답 발생률을 기존 0%에서 최대 80%까지 증가시킬 수 있었으며, 다수의 전문가 중 단 하나만 감염돼도 전체 모델의 안전성이 크게 저하됨을 확인했다.
이번 연구는 전 세계적으로 확산되고 있는 오픈소스 기반 거대언어모델 개발 환경에서 발생할 수 있는 새로운 보안 위협을 최초로 제시했다는 점에서 큰 의미를 갖는다. 동시에, 앞으로 AI 모델 개발 과정에서 성능뿐 아니라 ‘전문가 모델의 출처와 안전성 검증’이 필수적임을 시사한다.
신승원·손수엘 교수는 “효율성을 위해 빠르게 확산 중인 전문가 혼합 구조가 새로운 보안 위협이 될 수 있음을 이번 연구를 통해 실증적으로 확인했다”며, “이번 수상은 인공지능 보안의 중요성을 국제적으로 인정받은 의미 있는 성과”라고 말했다.
이번 연구에는 전기및전자공학부 김재한·송민규 박사과정, 나승호 박사 (현 삼성전자), 전기및전자공학부 신승원 교수, 전산학부 손수엘 교수가 참여했으며, 연구 결과는 2025년 12월 12일 미국 하와이에서 열린 ACSAC에서 발표됐다.

< 그림 2. 최우수논문상 상장 사진 >
※ 논문명: MoEvil: Poisoning Experts to Compromise the Safety of Mixture-of-Experts LLMs, 논문 파일: https://jaehanwork.github.io/files/moevil.pdf, GitHub(기술 오픈소스): https://github.com/jaehanwork/MoEvil
한편 이 연구는 과학기술정보통신부의 한국인터넷진흥원(KISA) 및 정보통신기획평가원(IITP)의 지원을 받았다.
“슬럼(Slum, 빈곤지역)이 어디에 있는지조차 모르는 도시들” 한국 연구진이 위성사진만으로 슬럼 지역을 스스로 찾아내는 인공지능(AI)을 개발했다. 사람이 미리 위치를 표시해 주지 않아도 새로운 도시에서 자동으로 적응해 정확도를 높이는 기술로, 데이터가 부족한 개발도상국의 도시정책 수립과 공공 자원 배분 방식을 근본적으로 바꿀 수 있을 것으로 기대된다. 우리 대학은 전산학부 차미영 교수와 기술경영학부 김지희 교수 공동 연구팀이 전남대학교(총장 이근배) 지리학과 양재석 교수와 함께한 학제 간 융합 연구를 통해 위성사진 기반 범용 슬럼 탐지 AI 기술을 개발했다고 6일 밝혔다. 이번 연구는 세계 최고 권위의 인공지능 학술대회 ‘국제인공지능학회(AAAI) 2026’에서 ‘사회적 임팩트 AI(AI for Social Impact)’ 부문 최우수논문상(Best Paper Award)을 수상했다. 해당 부문에 제출된 6
2026-03-06삼성전자가 신진 연구자를 발굴하고 육성하기 위해 진행한 삼성휴먼테크논문대상에서 대상을 수상한 우리대학 강대현 학생을 비롯해, 우리 대학 학생 14명이 수상하는 쾌거를 이루었다. 11일 서울 서초구 삼성전자 서초사옥에서 시상식이 열린 제32회 삼성휴먼테크논문대상 삼성휴먼테크논문대상은 국내에서 유일하게 대학 및 대학원생뿐 아니라 고교생까지 참여할 수 있는 논문 경진 대회다. 대학 부문에서는 우리대학 전기및전자공학부 강대현 석박사 통합과정생(지도교수 조병진)이 기존 낸드플래시 한계를 보완할 수 있는 새로운 소재를 제안한 연구로 대상을 수상했다. 강대현 학생은 ‘플래시 메모리 터널링층 내 적용된 붕소 옥시나이트라이드(BON) 소재의 밴드갭 엔지니어링 연구’로 수상했다. 낸드플래시 메모리는 전자를 저장층에 보관하며 데이터를 저장하는데, 이때 전자가 드나드는 출입문이 터널링층이다. 그는 “BON은 비대칭적으로 설계된 출입문”이라고 설명했다
2026-02-20우리 대학 박기현·이찬규·황정섭 학생이 '2025 대한민국 인재상'을 수상했다. 이들은 24일 오후 정부세종컨벤션센터에서 열린 ‘2025 대한민국 인재상 시상식’에서 대학생·청년일반 분과 4명, 고등학생 분과 2명으로 나뉘어 전국 최종 100인에 포함됐다. 대한민국 인재상은 창의성과 도전정신을 갖추고 사회 발전에 기여한 인재를 발굴·격려하기 위해 2008년부터 시행 중인 전국 단위 시상 제도다. 대학생·청년일반 분과 수상자 박기현 신소재공학과 대학원생은 탄소 중립 사회를 앞당길 신소재 기반 촉매 개발 등 활발한 연구활동을 바탕으로 특허를 출원하고 국제 SCI 저널에 다수 논문을 게재하며 전문성과 실용성을 갖춘 차세대 인재로서 두드러진 성취를 이루고 있다. 전산학부 대학원 이찬규 학생은은 뇌과학과 인공지능 등 관심 분야 지식을 대형 산불의 예방·진화 등 사회적 문제 해결에 창의
2025-12-26우리 대학은 전산학부 한형석 동문(박사 졸업)과 윤인수 동문(학사 졸업, 현 전기및전자공학부 부교수)이 미국 국방고등연구계획국(DARPA)이 주관한 세계 최대 AI 보안 기술 경진대회 ‘AI 사이버 챌린지(AIxCC)’에서 최종 우승한 ‘팀 애틀란타’의 우승상금 중 1억 5천만 원을 모교 KAIST에 기부했다고 23일 밝혔다. AIxCC 결선은 올해 8월 미국 라스베이거스에서 개최됐으며, 삼성리서치와 KAIST·포스텍·조지아공대 연구진으로 구성된 ‘팀 애틀란타’가 최종 1위를 차지했다. AIxCC는 총상금 2,950만 달러(약 410억 원)가 걸린 세계 최대 규모의 AI 보안 경진대회로, 지난 2년 동안 전 세계 보안 기업과 연구팀이 AI 기반 보안 기술을 겨루며 최고의 기술력을 선보여 왔다. 이번 대회에는 총 91개 팀이 등록했고, 이 중 31개 팀이 예선에 참가했으며 7개 팀이 본선에
2025-11-25우리 대학은 과학기술정보통신부가 주관하는‘AI 특화 파운데이션 모델 개발 사업’의 ‘루닛 컨소시움’ 주요 참여기관으로 선정되어, 의과학·바이오 분야 AI 파운데이션 모델 개발에 본격 착수했다고 14일 밝혔다. 이번 사업을 통해 KAIST는 바이오·의료 데이터 전주기를 아우르는‘의과학 특화 AI 파운데이션 모델’을 개발하며, AI 기반 생명과학 혁신 생태계 조성을 주도할 계획이다. ‘루닛 컨소시움’에는 루닛을 중심으로 트릴리온랩스, 카카오헬스케어, 아이젠사이언스, SK바이오팜, 리벨리온 등 7개 기업과, KAIST, 서울대, NYU, 국민건강보험공단 일산병원, 용인세브란스병원 등 9개 의료기관 및 연구기관이 함께 참여한다. 본 컨소시엄은 최신 B200 GPU 256장을 지원받아, 의료 데이터를 처음부터 끝까지 연결해 분석하는 AI 시스템인‘증거사슬(Chai
2025-11-14