‘알파폴드 한계’ 넘었다…약물 작동까지 예측한다
우리 몸의 단백질은 스위치처럼 작동한다. 약물이 단백질에 결합하면 결합 부위 구조가 변하고, 그 변화가 단백질 전체로 전달돼 기능이 켜지거나 꺼진다. 구글 딥마인드의 알파폴드3는 약물-단백질 결합 여부와 결합 부위의 3차원 구조를 예측하는 데 성공했지만, 약물이 결합한 뒤 단백질 내부에서 어떻게 신호를 전달하고 단백질 전체 구조를 바꿔서 실제로 단백질의 기능을 활성화하거나 억제하는지까지는 예측하지 못했다. 우리 대학 연구진이 약물이 ‘붙는지’가 아니라 ‘실제로 작동하는지’까지 예측하는 AI를 개발했다.
우리 대학은 바이오및뇌공학과 이관수 교수 연구팀이 대표적인 신약 표적인 G-단백질 결합 수용체(GPCR)에 대해, 후보 물질이 단순히 결합하는지를 넘어 실제로 단백질을 활성화하는지까지 예측하는 인공지능 모델 ‘GPCRact(지피씨알액트)’를 개발했다고 8일 밝혔다.
GPCR(G-Protein Coupled Receptor)은 세포 표면에 있는‘신호 수신기’역할을 한다. 호르몬이나 신경전달물질, 약물이 세포 밖에서 신호를 보내면 이를 받아 세포 안으로 전달하는 문(게이트) 역할을 한다. 인체에는 약 800여 종의 GPCR이 존재하며, 현재 시판 약물의 약 30~40%가 이를 표적으로 한다. 심장 박동, 혈압 조절, 통증 감지, 면역 반응, 감정 조절 등 다양한 생리 기능에 관여하는 핵심 단백질이다.
하지만 약물이 GPCR에 결합했다고 해서 항상 원하는 기능이 작동하는 것은 아니다. 결합 이후 단백질 내부에서 일어나는 구조 변화와 신호 전달 과정이 실제 작용 여부를 결정한다. 이를 ‘알로스테릭 신호 전파’라고 한다.
연구팀은 약물 작용 과정을 ① 약물-표적 결합 단계 ② 단백질 내부 신호 전파 단계로 나누어 AI가 단계적으로 학습하도록 설계했다. 단백질의 3차원 구조를 원자 수준 그래프로 표현하고, 중요한 신호 전파 경로를 학습할 수 있도록‘어텐션 메커니즘’을 적용했다. 이를 통해 AI가 약물 결합 신호와 함께 단백질 내부 신호 전파 경로를 파악하여 단백질의 활성을 예측하도록 했다.
그 결과, 기존 모델이 어려워했던 복잡한 구조의 단백질에서도 약물 활성 예측 성능을 크게 향상시켰다. 이번 모델은 단순히 ‘활성’ 또는 ‘비활성’결과만 제시하지 않는다. 예측의 근거가 되는 단백질 내부 핵심 신호 경로를 제시해, 이른바 ‘블랙박스 AI’의 한계를 극복했다.
이는 연구자가 결과를 해석하고 검증할 수 있게 해 신약 개발의 신뢰성과 효율성을 동시에 높일 수 있는 중요한 진전이다. 앞으로 GPCR을 표적으로 하는 다양한 질병에서, 약물의 결합 여부뿐 아니라 실제 활성 여부까지 예측하는 정밀 신약 개발 AI 플랫폼으로 활용될 전망이다.
이관수 교수는 “알로스테릭 구조 변화는 약물이 단백질의 한 부분에 결합했을 때 그 영향이 내부로 전달돼 다른 부위의 기능까지 바뀌는 현상”이라며 “이 작동 원리를 딥러닝에 반영한 것이 이번 연구의 핵심”이라고 밝혔다. 이어 “앞으로 다양한 단백질로 확장하고, 세포와 인체 반응까지 예측하는 기술로 발전시키겠다”고 말했다.
손효진 박사과정생이 제1 저자로 참여한 이번 논문은 생물정보학 분야 최고 권위의 국제 학술지인 `브리핑스 인 바이오인포매틱스(Briefings in Bioinformatics, JCR 상위 2.2%)'에 1월 15일자 게재됐다.
※ 논문명 : GPCRact: a hierarchical framework for predicting ligand-induced GPCR activity via allosteric communication modeling, DOI: https://doi.org/10.1093/bib/bbaf719
※ 저자 정보 : 손효진 (KAIST, 제1 저자), 이관수 (KAIST, 교신저자)
이 연구는 개인기초연구(과학기술정보통신부, 한국연구재단, RS-2025-24533057)의 지원으로 수행됐다.
챗GPT 등 대형 AI모델 학습 최적화 시뮬레이션 개발
최근 챗GPT, 딥시크(DeepSeek) 등 초거대 인공지능(AI) 모델이 다양한 분야에서 활용되며 주목받고 있다. 이러한 대형 언어 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습되는데, GPT-4의 경우 모델을 학습하는 데 소모되는 비용은 약 1,400억 원에 육박하는 것으로 추산된다. 한국 연구진이 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 최적의 병렬화 구성을 도출하도록 돕는 기술을 개발했다.
우리 대학 전기및전자공학부 유민수 교수 연구팀은 삼성전자 삼성종합기술원과 공동연구를 통해, 대규모 분산 시스템에서 대형 언어 모델(LLM)의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(이하 vTrain)를 개발했다고 13일 밝혔다.
대형 언어 모델 학습 효율을 높이려면 최적의 분산 학습 전략을 찾는 것이 필수적이다. 그러나 가능한 전략의 경우의 수가 방대할 뿐 아니라 실제 환경에서 각 전략의 성능을 테스트하는 데는 막대한 비용과 시간이 들어간다.
이에 따라 현재 대형 언어 모델을 학습하는 기업들은 일부 경험적으로 검증된 소수의 전략만을 사용하고 있다. 이는 GPU 활용의 비효율성과 불필요한 비용 증가를 초래하지만, 대규모 시스템을 위한 시뮬레이션 기술이 부족해 기업들이 문제를 효과적으로 해결하지 못하고 있는 상황이다.
이에 유민수 교수 연구팀은 vTrain을 개발해 대형 언어 모델의 학습 시간을 정확히 예측하고, 다양한 분산 병렬화 전략을 빠르게 탐색할 수 있도록 했다.
연구팀은 실제 다중 GPU 환경에서 다양한 대형 언어 모델 학습 시간 실측값과 vTrain의 예측값을 비교한 결과, 단일 노드에서 평균 절대 오차(MAPE) 8.37%, 다중 노드에서 14.73%의 정확도로 학습 시간을 예측할 수 있음을 검증했다.
연구팀은 삼성전자 삼성종합기술원와 공동연구를 진행하여 vTrain 프레임워크와 1,500개 이상의 실제 학습 시간 측정 데이터를 오픈소스로 공개(https://github.com/VIA-Research/vTrain)하여 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 했다.
유민수 교수는 “vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색하였으며 오픈소스를 공개하였다. 이를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것이다”라고 말했다.
이 연구 결과는 방제현 박사과정이 제1 저자로 참여하였고 컴퓨터 아키텍처 분야의 최우수 학술대회 중 하나인 미국 전기전자공학회(IEEE)·전산공학회(ACM) 공동 마이크로아키텍처 국제 학술대회(MICRO)에서 지난 11월 발표됐다. (논문제목: vTrain: A Simulation Framework for Evaluating Cost-Effective and Compute-Optimal Large Language Model Training, https://doi.org/10.1109/MICRO61859.2024.00021)
이번 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단, 정보통신기획평가원, 그리고 삼성전자의 지원을 받아 수행되었으며, 과학기술정보통신부 및 정보통신기획평가원의 SW컴퓨팅산업원천기술개발(SW스타랩) 사업으로 연구개발한 결과물이다.