
< KAIST 한인수 교수 >
AI 성능을 좌우해온 ‘메모리 병목’이 뚫렸다. 우리 대학이 참여한 국제 공동연구팀이 최대 6배까지 메모리를 줄이면서도 성능은 유지하는 차세대 알고리즘을 공개하며, AI 산업은 물론 반도체 수요 구조까지 바꿀 기술적 전환점을 제시했다. 고용량 중심에서 고효율 중심으로 전환되면서, AI는 더 저렴해지고 빠르게 확산되는 동시에 반도체 수요 역시 질적으로 고도화될 전망이다.
우리 대전기및전자공학부 한인수 교수가 참여한 구글 리서치(Google Research), 딥마인드(DeepMind), 뉴욕대(New York University) 공동 연구팀이 인공지능(AI) 모델의 고질적인 한계로 꼽혀온 메모리 과부하 문제를 해결할 차세대 양자화 알고리즘 ‘터보퀀트(TurboQuant)’를 공개했다고 27일 밝혔다.
AI 모델은 입력 데이터를 벡터 형태로 바꾼 뒤, 벡터 간 유사도를 계산해 작동한다. 이 과정에서 고정밀(high-precision) 데이터를 사용하기 때문에 막대한 메모리 자원이 필요한 점이 주요 한계로 지적돼 왔다.
터보퀀트는 이러한 고정밀 데이터를 더 적은 비트로 압축해 표현하는 ‘양자화(quantization)’ 기술을 활용한다. 쉽게 말해, 소수점 데이터를 정수로 근사하는 방식으로, 핵심 정보는 유지하면서도 저장 용량과 연산 부담을 크게 줄이는 기술이다.
이번 연구에서 터보퀀트는 AI 모델 내부 정보를 효율적으로 압축해 정확도 저하를 거의 없이 최대 6배까지 메모리를 절감하는 데 성공했다. 특히 AI 추론 과정에서 가장 큰 장애물로 꼽히는 메모리 병목 문제를 효과적으로 해소한 점이 핵심 성과다.
터보퀀트의 핵심은 두 단계로 나누어진 양자화 구조다. 먼저 1단계에서는 입력 데이터를 무작위로 회전(Random Rotation)시킨 뒤 각 요소를 개별적으로 양자화한다. 이 과정은 데이터 내 극단값(outlier)을 줄여 압축 효율을 높이는 역할을 한다. 해당 방식은 한인수 교수가 참여한 기존 연구 ‘폴라퀀트(PolarQuant)’에서도 활용된 바 있다.
이어 2단계에서는 1단계에서 발생한 오차(residual)를 다시 한 번 양자화한다. 이때 적용되는 QJL(Quantized Johnson-Lindenstrauss) 기법은 데이터를 {-1, 1} 값만으로 표현하는 초경량(1비트) 방식으로, 정보 손실을 최소화하면서도 연산 효율을 극대화할 수 있다.
이러한 기술적 발전은 반도체 메모리 시장에도 중장기적인 활력을 불어넣을 것으로 기대된다. 단기적으로는 동일한 AI 모델을 구동하는 데 필요한 메모리 용량이 줄어들어 수요 성장이 둔화되는 것처럼 보일 수 있으나, 전문가들은 오히려 이를 'AI 대중화의 기폭제'로 보고 있다. 낮아진 메모리 문턱은 스마트폰이나 가전 등 온디바이스 AI 기기부터 대규모 데이터센터에 이르기까지 AI 적용 범위를 비약적으로 넓힐 수 있고, 결국 AI 서비스가 일상으로 확산되어 훨씬 더 큰 규모의 서비스에서 새로운 메모리 수요가 창출되는 ‘수요의 질적 고도화’와 ‘양적 팽창’이 동시에 일어날 것으로 기대한다.
특히 터보퀀트의 핵심 기술인 QJL과 폴라퀀트 연구에 KAIST 한인수 교수가 공동 연구자로 참여함으로써, 국내 연구진이 글로벌 빅테크의 핵심 AI 알고리즘 개발에 직접 기여했다는 점에서 의미가 크다.
한인수 교수는 “AI 모델의 성능이 커질수록 메모리 사용량이 급격히 증가하는 것이 가장 큰 한계로 지적되어 왔다”며, “이번 연구는 이러한 병목을 효과적으로 줄이면서도 정확도를 유지할 수 있는 새로운 방향을 제시했다”고 설명했다.
이어 “앞으로 대규모 AI 모델을 보다 효율적으로 운영할 수 있는 핵심 기반 기술로 활용될 것으로 기대한다”고 덧붙였다.
한편, 폴라퀀트 연구는 5월에 개최하는 AI와 통계(머신러닝 이론 포함)를 다루는 국제 최상위 학회인 AISTATS (Artificial Intelligence and Statistics) 2026에서 발표될 예정이며, 한국연구재단의 “기초연구실” 사업 지원 (No. RS-2024-00406715)을 받아 수행되었다.
‘전력 먹는 하마'로 불리는 AI 데이터센터의 냉각 전력을 10분의 1 수준으로 줄일 수 있는 기술이 나왔다. 우리 대학 연구진은 반도체 칩 내부에 머리카락보다 가는 물길을 새겨 넣는 초고효율 액체 냉각 기술을 개발해 AI 반도체의 최대 난제로 꼽히는 발열 문제 해결 가능성을 제시했다. 우리 대학은 기계공학과 김성진 교수팀과 AX학과 이익진 교수팀이 공동연구를 통해 기존 매니폴드 마이크로채널(MMC, Manifold MicroChannel) 냉각 기술의 한계를 극복하고, 반도체 칩 내부에 매니폴드(manifold·냉각수를 여러 경로로 나누어 공급·회수하는 구조)와 마이크로채널(microchannel·머리카락보다 가는 미세 물길)을 결합한 초고효율 액체 냉각 기술을 개발했다고 16일 밝혔다. AI 반도체의 성능이 높아질수록 칩에서 발생하는 열량도 빠르게 증가하고 있다. 그러나 기존 공랭 방식만으로는 차세대 AI 반도체에서 발생하는
2026-06-16“사람처럼 판단하는 로봇, 생각보다 빨리 온다.” 로봇이 인간의 의도를 이해하고 스스로 올바른 행동을 선택하는 시대를 앞당길 핵심 기술이 국내에서 나왔다. KAIST 연구진이 단 몇 개의 영상만으로 AI가 인간의 판단 기준을 스스로 학습하는 기술을 개발하며 피지컬 AI 상용화의 핵심 난제를 해결했다. 우리 대학은 전기및전자공학부 유창동 교수 연구팀이 수천~수만 건의 인간 평가 데이터 대신 단 몇 개의 선호 영상만으로도 AI가 인간의 의도와 판단 기준을 학습할 수 있는 새로운 기술인 ‘VOTP(Video-based Optimal TransPort Preference)’를 세계 최초로 개발했다고 10일 밝혔다. 연구팀의 논문은 오는 7월 서울 코엑스에서 개최되는 세계 최고 권위의 AI학회인 ICML(International Conference on Machine Learning) 2026에 채택됐으며, 전체 제출 논문(23,918편
2026-06-10우리 대학은 메타버스대학원이 오는 6월 10일부터 12일까지 서울 코엑스에서 열리는 ‘가상융합산업대전(KMF: Korea Metaverse Festival) 2026’에 참가해 현실 공간을 인식·이해하고 사람과 사물의 위치·움직임·상황을 분석해 상호작용할 수 있도록 하는 ‘차세대 공간 AI(Spatial AI)’와 XR(확장현실) 분야 핵심 연구 성과를 공개한다고 5일 밝혔다. 이번 성과는 과학기술정보통신부와 정보통신기획평가원(IITP)이 미래 핵심 산업 대응을 위해 추진해 온 정보통신방송혁신인재양성사업‘가상융합대학원 사업’의 대표적 성과로 평가된다. KAIST 메타버스대학원은 올해 열린 세계 최고 권위의 가상현실(VR) 학술대회인 ‘IEEE VR 2026’에서 세계 대학·연구기관 가운데 두 번째로 많은 12편의 구두 논문을 발표하며 글로벌
2026-06-04우리 대학은 1일 오전 10시 KAIST 학술문화관(E9) 5층 정근모컨퍼런스홀에서 ‘KAIST AI대학 비전선포식’을 개최했다. 이번 행사는 AI 시대를 선도할 핵심 인재 양성과 교육·연구 혁신, 산업 협력, 책임 있는 AI 생태계 구축을 위한 비전과 추진 방향을 대내외에 공유하기 위해 마련됐다. KAIST AI대학은 인공지능을 단순한 활용 도구가 아닌 과학기술, 산업, 교육, 사회 전반의 변화를 이끄는 새로운 지식 생산의 기반으로 보고 있다. 이에 따라 AI 핵심 기술을 선도할 연구 인재와 다양한 분야에서 AI를 창의적으로 활용할 융합 인재를 함께 양성하고, 모델·알고리즘·시스템·인프라·도메인 융합은 물론 미래 사회 설계와 책임 있는 AI까지 포괄하는 교육·연구 체계를 구축해 나갈 계획이다. 비전선포식은 이광형 KAIST 총장의 환영사로 시작됐다. 이어 배경훈 부총리 겸 과학
2026-06-01챗GPT와 같은 거대언어모델(LLM·Large Language Model) 서비스를 운영하려면 수만 대 규모의 서버 인프라가 필요하다. 하지만 새로운 AI 반도체나 시스템 구조를 검증할 때마다 실제 장비를 구축하는 데에는 막대한 비용과 시간이 소요된다. 우리 대학 연구진은 실제 대규모 AI 서버를 구축하기 전에 컴퓨터 안에서 성능과 효율을 미리 검증할 수 있는 ‘가상 실험장’을 개발했다. 우리 대학은 전산학부 박종세 교수 연구팀이 개발한 거대언어모델(LLM) 서비스 인프라 시뮬레이터(simulator·가상 실험 소프트웨어) 연구가 컴퓨터 시스템 성능 분석 분야의 세계적 권위 학회인 ‘ISPASS 2026(IEEE International Symposium on Performance Analysis of Systems and Software)’에서 최우수 논문상을 수상했다고 29일 밝혔다. 연구팀이 개발한 &l
2026-05-29