
< (왼쪽부터) 전산학부 김민수 교수, 이명화 박사과정, 안선호 석사과정 >
기업 내외의 상황에 따라 끊임없이 새롭게 결정해야 하는 기업 의사결정 문제는 지난 수십 년간 기업들이 전문적인 데이터 분석팀과 고가의 상용 데이터베이스 솔루션들을 통해 해결해 왔는데, 우리 연구진이 최초로 거대언어모델을 이용하여 풀어내어 화제다.
우리 대학 전산학부 김민수 교수 연구팀이 의사결정 문제, 기업 데이터베이스, 비즈니스 규칙 집합 세 가지가 주어졌을 때 거대언어모델을 이용해 의사결정에 필요한 정보를 데이터베이스로부터 찾고, 비즈니스 규칙에 부합하는 최적의 의사결정을 도출할 수 있는 기술(일명 계획 RAG, PlanRAG)을 개발했다고 19일 밝혔다.
거대언어모델은 매우 방대한 데이터를 학습했기 때문에 학습에 사용된 바 없는 데이터를 바탕으로 답변할 때나 오래전 데이터를 바탕으로 답변하는 등 문제점들이 지적되었다. 이런 문제들을 해결하기 위해 거대언어모델이 학습된 내용만으로 답변하는 것 대신, 데이터베이스를 검색해 답변을 생성하는 검색 증강 생성(Retrieval-Augmented Generation; 이하 RAG) 기술이 최근 각광받고 있다.
그러나, 사용자의 질문이 복잡할 경우 다양한 검색 결과를 바탕으로 추가 정보를 다시 검색하여 적절한 답변을 생성할 때까지 반복하는 반복적 RAG(IterativeRAG)라는 기술이 개발됐으며, 이는 현재까지 개발된 가장 최신의 기술이다.
연구팀은 기업 의사결정 문제가 GPT-3.5 터보에서 반복적 RAG 기술을 사용하더라도 정답률이 10% 미만에 이르는 고난도 문제임을 보이고, 이를 해결하기 위해 반복적 RAG 기술을 한층 더 발전시킨 계획 RAG(PlanRAG)라는 기술을 개발했다.

< 그림 1. Europa Universalis IV에 기반하여 제작된 의사결정 질의응답 벤치마크의 문제 상황과, PlanRAG 기반 LLM이 세 단계의 의사결정 과정에 따라 문제를 해결하는 예시(영문에서 번역된 내용). 이 문제는 국가간의 무역 경쟁이 있는 대항해시대를 배경으로 하며, LLM은 국가의 이익을 최대로 하기 위한 무역 거점(붉은 점으로 표시됨)을 결정하여야 한다. 예시에서는 LLM이 BAH 라는 국가의 이익을 최대로 하기 위해서 국제 무역에 관한 데이터베이스와 규칙을 확인하고, Doab 무역 거점에 상인을 배치하는 의사결정을 한다. 종래의 RAG 기술들은 단계 1을 수행하지 않는다. >
계획 RAG(PlanRAG)는 기존의 RAG 기술들과 다르게 주어진 의사결정 문제, 데이터베이스, 비즈니스 규칙을 바탕으로 어떤 데이터 분석이 필요한지에 대한 거시적 차원의 계획(plan)을 먼저 생성한 후, 그 계획에 따라 반복적 RAG를 이용해 미시적 차원의 분석을 수행한다.
이는 마치 기업의 의사결정권자가 어떤 데이터 분석이 필요한지 계획을 세우면, 그 계획에 따라 데이터 분석팀이 데이터베이스 솔루션들을 이용해 분석하는 형태와 유사하며, 다만 이러한 과정을 모두 사람이 아닌 거대언어모델이 수행하는 것이 커다란 차이점이다. 계획 RAG 기술은 계획에 따른 데이터 분석 결과로 적절한 답변을 도출하지 못하면, 다시 계획을 수립하고 데이터 분석을 수행하는 과정을 반복한다.
김민수 교수는 “지금까지 거대언어모델 기반으로 의사결정 문제를 푼 연구가 없었던 관계로, 기업 의사결정 성능을 평가할 수 있는 의사결정 질의응답(DQA) 벤치마크를 새롭게 만들었다. 그리고 해당 벤치마크에서 GPT-4.0을 사용할 때 종래의 반복적 RAG에 비해 계획 RAG가 의사결정 정답률을 최대 32.5% 개선함을 보였다. 이를 통해 기업들이 복잡한 비즈니스 상황에서 최적의 의사결정을 사람이 아닌 거대언어모델을 이용하여 내리는데 적용되기를 기대한다”고 말했다.
이번 연구에는 김 교수의 제자인 이명화 박사과정과 안선호 석사과정이 공동 제1 저자로, 김 교수가 교신 저자로 참여했으며, 연구 결과는 자연어처리 분야 최고 학회(top conference)인 ‘NAACL’ 에 지난 6월 17일 발표됐다. (논문 제목: PlanRAG: A Plan-then-Retrieval Augmented Generation for Generative Large Language Models as Decision Makers)
한편, 이번 연구는 과기정통부 IITP SW스타랩 및 ITRC 사업, 한국연구재단 선도연구센터인 암흑데이터 극한 활용 연구센터의 지원을 받아 수행됐다.
“지난달 취임한 장관이 누구냐”는 질문에 챗GPT가 1년 전 인물을 답한다면 어떨까. 최신 정보를 제대로 반영하지 못하는 AI의 한계를 보여주는 사례다. 우리 대학 연구진이 변화하는 현실 정보를 자동으로 반영하면서도, 겉으로는 맞아 보이는 ‘시간 오류’까지 잡아내는 새로운 평가 기술을 개발했다. AI 신뢰성을 획기적으로 높일 수 있을 것으로 기대된다. 우리 대학은 전기및전자공학부 황의종 교수 연구팀이 마이크로소프트연구소(Microsoft Research)와 공동연구를 통해, 시간 데이터베이스 기술을 활용해 거대언어모델(LLM)의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 14일 밝혔다. 인공지능이 사용자의 신뢰를 얻기 위해서는 시시각각 변화하는 현실 정보를 정확히 이해하는 능력이 필수적이다. 그러나 기존 평가 방식은 정답 일치 여부만을 확인하거나 복잡한 시간 관계를 충분히 반영하지 못해, 실제 환경에서
2026-04-14우리가 쓰는 플라스틱 제품 대부분은 녹인 플라스틱을 틀에 넣어 같은 제품을 대량으로 찍어내는‘사출성형’공정으로 만든다. 하지만 조건이 조금만 달라도 불량이 생겨, 그동안은 숙련자의 감에 의존해 왔다. 이제 우리 대학 연구진이 고숙련자 은퇴와 외국인 인력 증가로 제조 지식이 단절될 수 있다는 우려에 대해 AI로 공정을 스스로 최적화하고 지식을 전수하는 해법을 내놨다. 우리 대학은 기계공학과 유승화 교수 연구팀(기계공학과·이노코어 PRISM-AI 센터)이 사출 공정을 스스로 최적화하는 생성형 AI 기술과, 현장 지식을 누구나 활용할 수 있는 LLM 기반 지식 전이 시스템을 세계 최초로 개발하고, 그 성과를 세계 최고 수준의 국제학술지에 연속 게재했다고 22일 밝혔다. 첫 번째 성과는 환경 변화나 품질 조건에 따라 자동으로 최적 공정 조건을 추론하는 생성형 AI 기반 공정추론 기술이다. 기존에는 온도나 습도, 원하는 품질 수준이 바뀔 때마다 숙련자
2025-12-22우리 대학 기술가치창출원이 28일 서울 코엑스에서‘2025 KAIST 테크페어’를 개최한다고 24일 밝혔다. 이번 행사는 중소·중견기업의 글로벌 경쟁력 강화와 기술사업화 촉진을 목표로, KAIST가 보유한 첨단 연구성과를 산업계와 직접 연결하는 장이 될 전망이다. 올해 테크페어는 ‘딥테크 기반의 혁신, 산업 현장으로’를 주제로, 인공지능(AI), 바이오·의약, 첨단소재, 로봇, VR 인터페이스 등 미래 핵심 기술 분야가 총망라된다. 참여 기업들은 KAIST 연구진과의 만남을 통해 기술이전, 투자, 1:1 상담 등 실질적인 협력 기회를 모색할 수 있다. ■ KAIST 대표 산학협력프로그램 ILP 소개 및 기술이전 설명회 행사는 KAIST 대표 산학협력 프로그램인 ‘ILP(Industry Liaison Program)’ 소개로 시작된다. ILP는 기업과 KAIST가 장기적인 파트
2025-10-24KAIST Global Entrepreneurship Summer School(GESS) 우승팀이 지난 7월 21일부터 23일까지 테크데브 아카데미(Techdev Academy) 주최로 스탠포드 대학 패컬티 클럽에서 열린 기업가정신 올림피아드(Entrepreneurship Olympiad) 대학생 트랙에 참가해 Honorable Mention(우수상)을 수상하며 다시 한 번 글로벌 무대에서의 역량을 입증했다. 이번 대회에 참가한 KAIST 대표팀 유레코(eaureco)는 박지원(반도체및시스템공학과), 시 리 사라(줄리아) 아오(건설및환경공학과), 루나 세바스찬 위자야(건설및환경공학과), 장서연(Impact MBA), 이사벨 알렉산드라 코르네호 리마(BTM/Global Digital Innovation) 등 다양한 전공과 국적의 KAIST 학부생 및 대학원생으로 구성된 팀이다. GESS 프로그램은 KAIST 학생들이 실리콘밸리에서 글로벌 창업가 정신과 혁신적 문제 해결 역량
2025-07-29생성형 AI 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 이에 따른 AI 생성글 탐지 기술도 개발되었는데 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼, 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠다. 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발해서 화제다. 우리 대학 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다. 최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다. OpenAI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이며, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능할 정도다.
2025-06-24