본문 바로가기
대메뉴 바로가기
KAIST
연구뉴스
유틸열기
홈페이지 통합검색
-
검색
메뉴 열기
%ED%8C%8C%EB%84%A4%EC%8B%9C%EC%95%84
최신순
조회순
엔비디아를 긴장시킬 고용량·고성능 GPU 개발
최근 대규모 AI 서비스 제공 최전선에 있는 빅테크들은 더 좋은 성능을 사용자들에게 제공하기 위해 경쟁적으로 모델 및 데이터의 크기를 증가시키는 추세이며, 최신 대규모 언어모델은 학습을 위해 수에서 수십 테라바이트(TB, 10^12 바이트)의 메모리를 요구한다. 국내 연구진이 현재 AI 가속기 시장을 독점하고 있는 엔비디아(NVIDIA)에 맞설 수 있는 차세대 인터페이스 기술이 활성화된 고용량·고성능 AI 가속기를 개발했다. 우리 대학 전기및전자공학부 정명수 교수 연구팀(컴퓨터 아키텍처 및 메모리 시스템 연구실)이 차세대 인터페이스 기술인 CXL(Compute Express Link)이 활성화된 고용량 GPU 장치의 메모리 읽기/쓰기 성능을 최적화하는 기술을 개발했다고 8일 밝혔다. 최신 GPU의 내부 메모리 용량은 수십 기가바이트(GB, 10^9 바이트)에 불과해 단일 GPU만으로는 모델을 추론·학습하는 것이 불가능하다. 대규모 AI 모델이 요구하는 메모리 용량을 제공하기 위해 업계에서는 일반적으로 GPU 여러 대를 연결하는 방식을 채택하지만, 이 방법은 최신 GPU의 높은 가격으로 인해 총소유비용(TCO·Total Cost of Ownership)을 과도하게 높이는 문제를 일으킨다. 이에 차세대 연결 기술인 CXL(Compute Express Link)을 활용해 대용량 메모리를 GPU 장치에 직접 연결하는‘CXL-GPU*’구조 기술이 다양한 산업계에서 활발히 검토되고 있다. 하지만 CXL-GPU의 고용량 특징만으로는 실제 AI 서비스에 활용되기 어렵다. 대규모 AI 서비스는 빠른 추론·학습 성능을 요구하기 때문에, GPU에 직접적으로 연결된 메모리 확장 장치로의 메모리 읽기/성능이 기존 GPU의 로컬 메모리에 준하는 성능이 보장될 때 비로소 실제 서비스에 활용될 수 있다. *CXL-GPU: CXL을 통해 연결된 메모리 확장 장치들의 메모리 공간을 GPU 메모리 공간에 통합시킴으로써 고용량을 지원한다. 통합된 메모리 공간 관리에 필요한 동작들은 CXL 컨트롤러가 자동으로 처리해주므로, GPU는 기존에 로컬 메모리에 접근하던 방식과 동일한 방식으로 확장된 메모리 공간에 접근할 수 있다. 기존 메모리 용량을 늘리기 위해 고가의 GPU를 추가 구매하던 방식과 달리, CXL-GPU는 GPU에 메모리 자원만 선택적으로 추가할 수 있어 시스템 구축 비용을 획기적으로 절감할 수 있다. 우리 연구진은 CXL-GPU 장치의 메모리 읽기/쓰기 성능이 저하되는 원인을 분석해 이를 개선하는 기술을 개발했다. 메모리 확장 장치가 메모리 쓰기 타이밍을 스스로 결정할 수 있는 기술을 개발하여 GPU 장치가 메모리 확장 장치에 메모리 쓰기를 요청하면서 동시에 GPU 로컬 메모리에도 쓰기를 수행하도록 설계했다. 즉, 메모리 확장 장치가 내부 작업을 수행 상태에 따라 작업을 하도록 하여, GPU는 메모리 쓰기 작업의 완료 여부가 확인될 때까지 기다릴 필요가 없어 쓰기 성능 저하 문제를 해결할 수 있도록 했다. 또한 연구진은 메모리 확장 장치가 사전에 메모리 읽기를 수행할 수 있도록 GPU 장치 측에서 미리 힌트를 주는 기술을 개발했다. 이 기술을 활용하면 메모리 확장 장치가 메모리 읽기를 더 빨리 시작하게 되어, GPU 장치가 실제 데이터를 필요로 할 때는 캐시(작지만 빠른 임시 데이터 저장공간)에서 데이터를 읽어 더욱 빠른 메모리 읽기 성능을 달성할 수 있다. 이번 연구는 반도체 팹리스 스타트업인 파네시아(Panmnesia)*의 초고속 CXL 컨트롤러와 CXL-GPU 프로토타입을 활용해 진행됐다. 연구팀은 파네시아의 CXL-GPU 프로토타입을 활용한 기술 실효성 검증을 통해 기존 GPU 메모리 확장 기술보다 2.36배 빠르게 AI 서비스를 실행할 수 있음을 확인했다. 해당 연구는 오는 7월 산타클라라 USENIX 연합 학회와 핫스토리지의 연구 발표장에서 결과를 선보인다. *파네시아는 업계 최초로 CXL 메모리 관리 동작에 소요되는 왕복 지연시간을 두 자리 나노초(nanosecond, 10^9분의 1초) 이하로 줄인 순수 국내기술의 자체 CXL 컨트롤러를 보유하고 있다. 이는 전세계 최신 CXL 컨트롤러등 대비 3배 이상 빠른 속도다. 파네시아는 고속 CXL 컨트롤러를 활용해 여러 개의 메모리 확장 장치를 GPU에 바로 연결함으로써 단일 GPU가 테라바이트 수준의 대규모 메모리 공간을 형성할 수 있도록 했다. 전기및전자공학부 정명수 교수는 “CXL-GPU의 시장 개화 시기를 가속해 대규모 AI 서비스를 운영하는 빅테크 기업의 메모리 확장 비용을 획기적으로 낮추는 데 기여할 수 있을 것”이라 말했다.
2024.07.08
조회수 2834
정명수 교수 연구팀, 美 CES 2024에서 혁신상 수상작 CXL 탑재 AI 가속기 선보여
시스템에 무한대에 가까운 용량의 메모리 자원을 제공하여 대규모 AI 기반 서비스를 고속 처리하는 기술, ‘CXL 탑재 AI 가속기’가 개발되었다. 우리 대학 전기및전자공학부 정명수 교수 연구팀이 세계 최대 규모의 IT 박람회‘CES 2024’에서‘CXL 탑재 AI 가속기(CXL-Enabled AI Accelerator)’를 선보였다. 해당 제품으로 연구팀은 CES 2024 혁신상을 수상하였으며, ARM, 휴렛페커드(HPE), 어드밴스드 머터리얼스(Advanced Materials), 메타등 글로벌 대기업들로부터 단독 미팅을 제안받아 지속적으로 협업을 논의할 예정이다. ‘CXL 탑재 AI 가속기’는 컴퓨트익스프레스링크(Computer Express Link, CXL) 기술을 통해 시스템에 무한대에 가까운 용량의 빠른 메모리 자원을 제공하여, 대규모 AI 기반 서비스를 고속으로 처리할 수 있다. 대표적인 AI 기반 서비스인 이미지 검색을 이용한 평가에서, 연구팀은 CXL 기술이 적용된 가속 시스템이 기존의 SSD 기반 가속시스템 대비 101배 빠른 성능을 보였다고 밝혔다. 수상작의 핵심인 CXL은 데이터처리 가속기, 메모리 확장장치, 프로세서, 스위치 등 다양한 시스템 장치를 고속으로 연결하는 기술이다. 이 기술은 여러 가속기 및 메모리 확장장치의 내부 메모리를 시스템에 연결하여 AI 서비스에 확장가능한 메모리 자원을 제공할 수 있다. 덕분에 AI 서비스는 처리할 수 있는 데이터의 양을 대폭 증가시킬 수 있으며, 이릍 통해 정확도와 품질을 향상시킬 수 있다. 이는 기존 AI 가속기가 제한된 메모리 용량으로 인해, 대용량의 데이터 관리에 느린 저장장치를 사용해야하던 것과 대비된다. 추가적으로, 연구팀은 AI 가속기 내부를 이미지 검색에 특화된 하드웨어 모듈로 구성하여 시스템의 성능을 더욱 높였다. AI 기반 서비스의 정확도 및 품질은 경쟁적인 AI 업계에서 기업의 생존과 직결되는 만큼, 연구팀의 기술은 산업계 파급효과가 클 것으로 예상된다. 정명수 교수 연구팀은 이번 연구개발의 결과물을 지난주 미국 라스베가스에서 열린 CES 2024에서 전시하였다. 가속기는 기술의 우수성을 인정받아 CES 주관기관으로부터 CES 혁신상을 수상하였으며, IEEE Spectrum, Storage Newsletter, Blocks and Files, Design and Reuse, TechRadar, 등의 해외 언론, 조선일보, 조선비즈, 한국경제, 서울경제, 파이낸셜뉴스, ZDnet 등의 국내 유수 언론을 포함한 20개 이상의 언론사가 부스에 방문하고, 출품 소식을 전하였다. 특히 한국경제에서는 연구팀의 기술을 ‘AI 도입 비용 문제의 해결책’으로써 대중들에게 소개하였다. 연구팀의 권미령 박사는 EETimes Gary Hilson 기자와의 단독 인터뷰에서 “최신 CXL 표준을 지원하는 연구팀의 하드웨어/소프트웨어를 활용하면 데이터센터 수준의 고효율 메모리 확장을 실현할 수 있다”며 연구팀의 기술을 소개하기도 했다. 뿐만 아니라, 연구팀의 기술은 이번 CES에서 다양한 글로벌 대기업들로부터 집중적으로 관심을 받았다. 세계 최대 IP 기업 ARM으로부터 초청받아 프라이빗 미팅을 진행하였으며, 글로벌 클라우드/데이터센터 기업 HPE 본사로부터 단독 대규모 미팅 제의를 받아 이달 말 협업을 논의할 예정이다. 현지 부스를 통해서 연구팀은 마이크로소프트, 애플, 인텔, 케이던스 등 다양한 글로벌 대기업의 고위 임원들과 국내 귀빈등에게 CXL 선도기술을 소개한 것으로 알려졌다. 정명수 교수 연구팀은 이전에도 세계 최초로 CXL CPU, CXL 스위치, CXL 메모리 확장장치를 모두 포함한 CXL 기반의 전체 시스템을 발표하여 AMD, 메타 등 산업계로부터 러브콜을 받은 바 있다. 본 성과는 우리 대학 전기및전자공학부 정명수 교수 연구실 학생들과 파네시아가 공동연구를 진행한 결과이다. 파네시아는 카이스트 교원창업기업이자 세계 최초로 CXL 3.0 IP(반도체 설계기술)를 개발하는 등 CXL 기술을 선도하고 있는 반도체 팹리스 스타트업이다. 카이스트 스타트업인 파네시아는 오는 19일 대전에서 개최되는 CXL 테크데이 행사를 통해서 CES에 소개된 CXL이외에도 다양한 최신 CXL 기술들을 여러 학부생들과 공유할 예정이다 (관련소개 뉴스 링크: https://news.nate.com/view/20231229n21475?mid=n0105).
2024.01.17
조회수 3672
<<
첫번째페이지
<
이전 페이지
1
>
다음 페이지
>>
마지막 페이지 1