< (왼쪽부터) 생명화학공학과 김지한 교수, 강영훈 박사과정 >
우리 대학 연구진이 챗GPT를 활용해 큰 다공성, 높은 표면적, 그리고 뛰어난 조절 가능성으로 많은 화학 응용 분야에서 사용되는 금속 유기 골격체의 특성을 예측하고 새로운 재료를 자동으로 생성하는 챗봇 시스템(이하 챗MOF)을 개발했다. 챗MOF는 검색 및 예측 작업에서 각각 96.9% 및 95.7%의 높은 성공률을 보여 화제다.
생명화학공학과 김지한 교수 연구팀이 인공지능(AI)의 급격한 발전에 주목하며, 대규모 언어 모델(이하 LLMs) 활용을 통해 금속 유기 골격체(Metal-Organic Frameworks, MOFs)의 특성을 예측하고 새로운 재료를 자동으로 생성하는 챗봇 시스템(ChatMOF)을 개발했다고 26일 발표했다.
최근 인공지능(AI)의 발전에는 큰 도약이 있었지만 재료 과학에서의 LLM의 잠재력을 완전히 실현하기에는 여전히 물질의 복잡성과 재료별 특화된 훈련 데이터의 부족이라는 한계점이 존재했다.
김지한 교수 연구팀이 개발한 챗MOF는 재료 분야에서 전통적인 머신러닝 모델과 LLM을 결합한 혁신적인 접근 방식으로 계산 및 머신러닝 도구에 대한 초보자들과의 격차를 상당히 줄일 수 있는 잠재력을 가지고 있다.
또한 이 독특한 시스템은 인공지능의 변혁적인 능력과 재료 과학의 복잡한 측면들을 연결하며, 다양한 작업에서 뛰어난 성능을 보여준다. 챗MOF는 검색 및 예측 작업에서 각각 96.9% 및 95.7%의 높은 성공률을 보고한다. 한편, 더 복잡한 구조 생성 작업은 그 복잡함에도 불구하고 주목할 만한 87.5%의 정확도를 달성한다. 이러한 유망한 결과는 챗MOF가 가장 요구가 많은 작업을 관리하는 데도 효과적임을 강조한다.
< 그림 1. 대규모 언어 모델을 이용한 금속-유기 골격체의 예측 및 역설계 챗봇 시스템 예시. 사용자가 MOF의 속성에 대해 텍스트 질문을 하면 ChatMOF에서 적절한 답변을 제공함. 사용자가 새로운 MOF를 생성하고자 하는 경우, ChatMOF는 조건을 만족하는 새로운 MOF를 생성할 수 있음. >
김지한 교수는 “연구팀이 개발한 기술은 재료 과학 분야에서 인공지능의 더 높은 자율성을 달성하기 위한 중요한 진전을 나타낸다. 기술이 발전함에 따라, 모델 용량과 온라인 플랫폼에서의 데이터 공유에 대한 체계적인 개선을 통해 챗MOF의 성능을 더욱 최적화할 수 있으며, 이는 금속 유기 골격체 연구 분야에서 놀라운 진전을 촉진할 수 있다.”라고 말했다.
< 그림 2. 대규모 언어 모델을 이용한 금속-유기 골격체의 예측 및 역설계 챗봇 시스템 개요. ChatMOF는 에이전트, 도구, 평가자의 세 가지 핵심 구성 요소로 이루어져 있음. 에이전트는 사용자로부터 질문을 받으면 계획을 수립하고 적합한 도구를 선택함. 그 후 도구는 제안된 계획에 따라 출력을 생성하고 평가자는 이 결과를 최종 응답으로 만듦. >
생명화학공학과 강영훈 박사과정이 제1 저자로 참여한 이번 연구 결과는 국제 학술지 `네이처 커뮤니케이션즈(Nature communications)'에 지난 6월 3일 게재됐다. (논문명: ChatMOF: An Artificial Intelligence System for Predicting and Generating Metal-Organic Frameworks Using Large Language Models)
한편 이번 연구는 과학기술정보통신부의 지원으로 국가 소재 연구 데이터 사업단, 그리고 한국연구재단 (NRF) 중견 연구자 지원 사업의 지원을 받아 수행됐다.
우리 대학 연구진이 고가의 데이터센터급 GPU나 고속 네트워크 없이도 AI 모델을 효율적으로 학습할 수 있는 기술을 개발했다. 이 기술을 통해 자원이 제한된 기업이나 연구자들이 AI 연구를 보다 효과적으로 수행할 수 있을 것으로 기대된다. 우리 대학 전기및전자공학부 한동수 교수 연구팀이 일반 소비자용 GPU를 활용해, 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔다. 기존에는 AI 모델을 학습하기 위해 개당 수천만 원에 달하는 고성능 서버용 GPU(엔비디아 H100) 여러 대와 이들을 연결하기 위한 400Gbps급 고속 네트워크를 가진 고가 인프라가 필요했다. 하지만 소수의 거대 IT 기업을 제외한 대부분의 기업과 연구자들은 비용 문제로 이러한 고가의 인프라를 도입하기 어려웠다. 한동수 교수 연구팀은 이러한 문제를 해결하기 위해 '스텔라트레인(StellaTrain)'이라는 분산 학습 프레임워크를
2024-09-19최근 소셜 미디어, 전자 상거래 플랫폼 등에서 소비자의 만족도를 높이는 다양한 추천서비스를 제공하고 있다. 그 중에서도 상품의 제목 및 설명과 같은 텍스트를 주입하여 상품 추천을 제공하는 대형언어모델(Large Language Model, LLM) 기반 기술이 각광을 받고 있다. 한국 연구진이 이런 대형언어모델 기반 추천 기술의 기존 한계를 극복하고 빠르고 최상의 추천을 해주는 시스템을 개발하여 화제다. 우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering) 기반 추천 모델이 학습한 사용자의 선호에 대한 정보를 추출하고 이를 상품의 텍스트와 함께 대형언어모델에 주입해 상품 추천의 높은 정확도를 달성할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다. 이번 연구는 기존 연구에 비해 학습 속도에서 253% 향상, 추론 속도에서 171% 향상, 상품 추천에서 평균 12%의
2024-07-17과학기술정보통신부·정보통신기획평가원이 주관하는 PIM인공지능반도체 핵심기술개발사업의 지원을 받고있는 우리 대학 PIM반도체설계연구센터가 AI 반도체 전문인력 양성을 위해 전국 AI 및 반도체 관련 학과 학부생과 대학원생을 대상으로 SK하이닉스와 삼성전자의 PIM* 기반 이론 및 실습 교육을 진행했다. 강의는 6월 20일(목)부터 6월 21일(금)까지 SK하이닉스 교육, 7월 4일(목)부터 7월 5일(금)까지 삼성전자 교육을 각각 KAIST PIM반도체설계연구센터에서 진행했다. *PIM(Processing-In-Memory): 메모리 반도체에 연산 기능을 추가하여 AI와 빅데이터 처리 분야에서 데이터 처리 속도를 높이면서도 사용 전력을 줄이는 반도체 설계 기술 이번 교육은 SK하이닉스의 AiM*과 삼성전자의 HBM-PIM*을 활용하여 수강생들이 직접 실습할 수 있는 기회를 제공했다. 전국 25개 대학교에서 300명이 넘는 학생들이 접수하여 높은 관심을 받았다
2024-07-11멀티모달 대형 언어모델이란 텍스트뿐만 아니라 이미지 데이터 유형까지 처리할 수 있는 초대형 언어모델을 말한다. 해외 대형 기업의 풍부한 컴퓨팅 자원의 지원으로부터 인간의 뇌에 있는 신경망의 개수와 유사한 수준초대형모델들이 만들어지고 있으나 학계에서는 이런 개발이 쉽지 않았다. KAIST 연구진이 오픈AI의 GPT-4V와 구글의 제미나이-프로(Gemini-Pro)를 뛰어넘는 멀티모달 대형언어모델을 개발하여 화제다. 우리 대학 전기및전자공학부 노용만 교수 연구팀이 오픈AI(OpenAI)의 GPT-4V 등 기업에서 비공개하고 있는 상업 모델인 초대형 언어모델의 시각 성능을 뛰어넘는 공개형 멀티모달 대형 언어모델을 개발해 출시했다고 20일 밝혔다. 노용만 교수 연구팀은 단순히 모델의 크기를 키우거나 고품질의 시각적 지시 조정 데이터셋을 만들지 않고 멀티모달 대형언어모델의 시각 성능을 획기적으로 높인 콜라보(CoLLaVO), 모아이(MoAI) 2가지 기술을 연속적으로 개발했다고 밝
2024-06-20기업 내외의 상황에 따라 끊임없이 새롭게 결정해야 하는 기업 의사결정 문제는 지난 수십 년간 기업들이 전문적인 데이터 분석팀과 고가의 상용 데이터베이스 솔루션들을 통해 해결해 왔는데, 우리 연구진이 최초로 거대언어모델을 이용하여 풀어내어 화제다. 우리 대학 전산학부 김민수 교수 연구팀이 의사결정 문제, 기업 데이터베이스, 비즈니스 규칙 집합 세 가지가 주어졌을 때 거대언어모델을 이용해 의사결정에 필요한 정보를 데이터베이스로부터 찾고, 비즈니스 규칙에 부합하는 최적의 의사결정을 도출할 수 있는 기술(일명 계획 RAG, PlanRAG)을 개발했다고 19일 밝혔다. 거대언어모델은 매우 방대한 데이터를 학습했기 때문에 학습에 사용된 바 없는 데이터를 바탕으로 답변할 때나 오래전 데이터를 바탕으로 답변하는 등 문제점들이 지적되었다. 이런 문제들을 해결하기 위해 거대언어모델이 학습된 내용만으로 답변하는 것 대신, 데이터베이스를 검색해 답변을 생성하는 검색 증강 생성(Retrieval
2024-06-19