본문 바로가기 대메뉴 바로가기

KAIST

연구뉴스

홈페이지 통합검색

-

%EC%A0%84%EA%B8%B0%EB%B0%8F%EC%A0%84%EC%9E%90%EA%B3%B5%ED%95%99

24시간 말하는 AI비서 가능성 여는 '스피치SSM' 개발 최근 음성 언어 모델(Spoken Language Model, SLM)은 텍스트 없이 인간의 음성을 학습해 음성의 언어적, 비언어적 정보를 이해 및 생성하는 기술로 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 각광받고 있다. 하지만 기존 모델은 장시간 콘텐츠 생성이 요구되는 팟캐스트, 오디오북, 음성비서 등에서 한계가 두드러졌는데, 우리 연구진이 이런 한계를 뛰어넘어, 시간 제약 없이 일관되고 자연스러운 음성 생성을 실현한 ‘스피치SSM’을 개발하는데 성공했다. 우리 대학 전기및전자공학부 노용만 교수 연구팀의 박세진 연구원(박사과정)이 장시간 음성 생성이 가능한 음성 언어 모델 ‘스피치SSM(SpeechSSM)’을 개발했다고 3일 밝혔다. 이번 연구는 국제 최고 권위 머신러닝 학회인 ICML(International Conference on Machine Learning) 2025에 전체 제출된 논문 중 약 1%만이 선정되는 구두 논문 발표에 확정돼 뛰어난 연구 역량을 입증할 뿐만 아니라 우리 대학의 인공지능 연구 능력이 세계 최고 수준임을 다시 한번 보여주는 계기가 될 전망이다. 음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리함으로써, 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질의 음성을 빠르게 생성할 수 있다는 점이 큰 강점이다. 그러나 기존 모델은 음성을 아주 세밀하게 잘게 쪼개서 아주 자세한 정보까지 담는 경우, ‘음성 토큰 해상도’가 높아지고 사용하는 메모리 소비도 증가하는 문제로 인해 장시간 음성의 의미적, 화자적 일관성을 유지하기 어려웠다. 연구팀은 이러한 문제를 해결하기 위해 하이브리드 상태공간 모델(Hybrid State-Space Model)을 사용한 음성 언어 모델인‘스피치SSM’를 개발해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있게 설계했다. 이 모델은 최근 정보에 집중하는 ‘어텐션 레이어(attention layer)’와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는 ‘순환 레이어(recurrent layer)’를 교차 배치한 ‘하이브리드 구조’를 통해 긴 시간 동안 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다. 또한, 메모리 사용량과 연산량이 입력 길이에 따라 급격히 증가하지 않아, 장시간의 음성을 안정적이고 효율적으로 학습하고 생성할 수 있다. 스피치SSM은 음성 데이터를 짧은 고정된 단위(윈도우)로 나눠 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들 수 있어 무한한 길이의 음성 시퀀스(unbounded speech sequence)를 효과적으로 처리할 수 있게 했다. 또한 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 ‘비자기회귀(Non-Autoregressive)’방식의 오디오 합성 모델(SoundStorm)을 사용해, 고품질의 음성을 빠르게 생성할 수 있게 했다. 기존은 10초 정도 짧은 음성 모델을 평가했지만, 연구팀은 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 ‘LibriSpeech-Long'을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다. 기존 음성 모델 평가 지표인 말이 문법적으로 맞는지 정도만 알려주는 PPL(Perplexity)에 비해, 연구팀은 시간이 지나면서도 내용이 잘 이어지는지 보는 'SC-L(semantic coherence over time)', 자연스럽게 들리는 정도를 시간 따라 보는 'N-MOS-T(naturalness mean opinion score over time)' 등 새로운 평가 지표들을 제안해 보다 효과적이고 정밀하게 평가했다. 새로운 평가를 통해 스피치SSM 음성 언어 모델로 생성된 음성은 긴 시간 생성에도 불구하고 초기 프롬프트에서 언급된 특정 인물이 지속적으로 등장하며, 맥락적으로 일관된 새로운 인물과 사건들이 자연스럽게 전개되는 모습을 확인했다. 이는 기존 모델들이 장시간 생성 시 쉽게 주제를 잃고 반복되는 현상을 보였던 것과 크게 대조적이다. 박세진 박사과정생은 “기존 음성 언어 모델은 장시간 생성에 한계가 있어, 실제 인간이 사용하도록 장시간 음성 생성이 가능한 음성 언어 모델을 개발하는 것이 목표였다”며 “이번 연구 성과를 통해 긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답할 수 있어, 다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”라고 밝혔다. 이 연구는 제1 저자인 우리 대학 박세진 박사과정 학생이 구글 딥마인드(Google DeepMind)와 협력해, ICML(국제 머신러닝 학회) 2025에서 7월 16일 구두 발표로 소개될 예정이다. ※ 논문제목: Long-Form Speech Generation with Spoken Language Models ※ DOI: 10.48550/arXiv.2412.18603 한편, 박세진 박사과정생은 비전, 음성, 언어를 통합하는 연구를 수행하며 CVPR(컴퓨터 비전 분야 최고 학회) 2024 하이라이트 논문 발표, 2024년 ACL(자연어 처리 분야 최고 학회)에서 우수논문상(Outstanding Paper Award) 수상 등을 통해 우수한 연구 역량을 입증한 바 있다. [데모 페이지 링크] https://google.github.io/tacotron/publications/speechssm/
2025.07.03 조회수 593
배터리 없이 이산화탄소 실시간 모니터링 성공 기후 변화와 지구온난화를 막기 위해서는 이산화탄소(CO2)가 ‘얼마나’ 배출되고 있는지를 정확히 파악하는 것이 핵심이다. 이를 가능하게 하는 것이 바로 이산화탄소 모니터링 기술이다. 최근 한국 연구진이 외부 전력 없이도 이산화탄소 농도를 실시간 측정하고 무선으로 전송할 수 있는 시스템을 개발해 환경 모니터링 기술의 새로운 가능성을 열었다. 우리 대학 전기및전자공학부 권경하 교수 연구팀이 중앙대학교 류한준 교수팀과 공동연구를 통해, 주변의 미세 진동 에너지를 수확해 이산화탄소 농도를 주기적으로 측정할 수 있는 자가발전형 무선 모니터링 시스템을 개발했다고 9일 밝혔다. 지구온난화의 주요 원인인 이산화탄소 배출은 산업계의 지속가능성 평가 지표로 자리 잡고 있으며, 유럽연합(EU)은 이미 공장 배출량 규제를 도입한 상태다. 이러한 규제 흐름에 따라, 효율적이고 지속 가능한 이산화탄소 모니터링 시스템은 환경 관리와 산업 공정 제어에 필수적인 요소로 주목받고 있다. 그러나 기존 이산화탄소 모니터링 시스템은 대부분 배터리나 유선 전원에 의존하기 때문에 설치와 유지보수에 제약이 따른다. 연구팀은 이 문제를 해결하기 위해, 외부 전력 없이 작동 가능한 자가발전 무선 이산화탄소 모니터링 시스템을 개발했다. 이번 시스템의 핵심은 산업 장비나 배관에서 발생하는 진동(20~4000㎛ 진폭, 0-300 Hz 주파수 범위)을 전기로 바꾸는 ‘관성 구동(Inertia-driven) 마찰전기 나노발전기(Triboelectric Nanogenerator, TENG)’이다. 이를 통해 배터리 없이도 이산화탄소 농도를 주기적으로 측정하고 무선으로 전송할 수 있다. 연구팀은 4단 적층 구조의 관성 구동 마찰전기 나노발전기(TENG)에 탄성 스프링을 결합해 미세 진동을 증폭시키고 공진 현상을 유도, 13Hz, 0.56g의 가속도 조건에서 0.5㎽의 전력을 안정적으로 생산하는 데 성공했다. 생산된 전력은 이산화탄소 센서와 저전력 블루투스 통신 시스템을 구동하는 데 사용됐다. 권경하 교수는 “효율적인 환경 모니터링을 위해서는 전원 제약 없이 지속적으로 작동 가능한 시스템이 필수”라며, “이번 연구에서는 관성 구동 마찰전기 나노발전기(TENG)로부터 생성된 에너지를 바탕으로 주기적으로 이산화탄소 농도를 측정하고 무선으로 전송할 수 있는 자가발전 시스템을 구현했다”고 설명했다. 이어 “이 기술은 향후 다양한 센서를 통합한 자가발전형 환경 모니터링 플랫폼의 기반 기술로 활용될 수 있을 것”이라고 덧붙였다. 이번 연구 결과는 우리 대학 석사과정 장규림 학생과 중앙대 석사과정 다니엘 마나예 티루네(Daniel Manaye Tiruneh) 학생이 공동 제 1저자로 국제 저명 학술지 `나노 에너지(Nano Energy) (IF 16.8)'에 6월 1일자로 게재됐다. ※논문명 : Highly compact inertia-driven triboelectric nanogenerator for self-powered wireless CO2 monitoring via fine-vibration harvesting, ※DOI: https://doi.org/10.1016/j.nanoen.2025.110872 이번 연구는 사우디 아람코-KAIST CO2 관리 센터의 지원을 받아 수행됐다.
2025.06.09 조회수 1771
온도에 반응해 말랑·딱딱 변하는 전자잉크 나왔다 스마트폰 같은 딱딱한 전자기기는 안정적인 성능을 제공하지만 착용시 불편함을 주는 반면, 얇고 유연한 웨어러블 기기는 착용감은 뛰어나지만 부드러운 특성 때문에 정밀한 조작에 한계가 있다. 국내 연구진이 온도에 따라 딱딱함과 부드러움을 자유자재로 전환할 수 있는‘액체금속 전자잉크’를 개발해, 가변강성을 갖춘 전자기기의 새로운 패러다임을 열고 있다. 우리 대학 전기및전자공학부 정재웅 교수 연구팀이 서울대 박성준 교수 연구팀, 우리 대학 신소재공학과 스티브 박 교수 연구팀과 공동연구를 통해, 상온에서 마이크로 스케일(머리카락보다 얇은 구조)의 미세 선폭 회로 인쇄가 가능하고 온도에 따라 딱딱함과 부드러움을 자유자재로 조절할 수 있는 액체금속 전자잉크를 개발했다고 4일 밝혔다. 연구팀이 개발한 전자잉크는 정밀한 인쇄가 가능한 물성과 우수한 전기전도성을 동시에 갖추고 있으며, 딱딱함과 부드러움을 자유자재로 조절할 수 있는 전자소자를 상온에서 정밀 제작할 수 있는 획기적인 기술이다. 이 전자잉크는 상용 인쇄회로 기판(PCB) 수준의 복잡한 고해상도 다층 회로 인쇄가 가능하며, 완성된 전자기기는 온도에 반응해 딱딱한 형태를 유연하게 변화시킬 수 있다. 연구팀은 기존 전자기기의 고정된 형태의 한계를 극복하기 위해 체온 근처(29.8 ℃)에서 녹는 액체금속 갈륨에 주목했다. 갈륨은 고체 상태에서는 매우 단단하지만 녹으면 부드러운 액체가 돼 큰 폭의 강성 변화가 가능하다. 하지만 기존 갈륨은 물방울처럼 뭉치려는 성질(높은 표면장력)과 액체 상태에서의 불안정성 때문에 정밀한 회로 제작이 어려웠고, 제조 과정에서 원치 않는 상변화가 일어나는 문제가 있었다. 이러한 갈륨의 한계를 극복하기 위해 산성도(pH) 제어 기반 액체금속 전자 잉크 프린팅 기술을 개발했다. 먼저, 마이크로 크기의 갈륨 입자를 디메틸 설폭사이드(Dimethyl Sulfoxide, 이하 DMSO)라는 중성 용매에 친수성 폴리우레탄 고분자와 함께 섞어 전자 잉크를 제작했다. 이때 DMSO 용매의 중성 상태 덕분에 갈륨 입자들이 고분자 매트릭스에 골고루 분산된 안정적인 고점성 잉크가 형성되며, 이를 통해 상온에서 고해상도 회로 인쇄가 가능해진다. 그리고 인쇄 후에는 가열 과정에서 DMSO 용매가 분해되면서 산성 물질을 생성하고, 이 산성 환경에서 갈륨 입자들 표면의 산화막이 제거돼 입자들이 물리적으로 연결되면서 전기가 통하고 강성을 조절할 수 있는 회로가 형성된다. 연구팀은 이러한 2단계 공정을 통해 상온에서는 안정적인 인쇄가 가능하면서도 완성 후에는 우수한 전기전도성과 가변강성 특성을 갖는 전자소자를 구현할 수 있었다. 개발된 전자잉크는 머리카락 굵기의 절반 (약 50μm)인 미세 선폭으로 정밀한 회로를 인쇄할 수 있으며, 우수한 전기전도도(2.27×10⁶ S/m)와 함께 1,465배나 되는 강성 조절 비율을 제공한다. 이는 플라스틱처럼 딱딱한 상태에서 고무처럼 말랑한 상태까지 자유자재로 변할 수 있음을 뜻한다. 또한 스크린 프린팅, 딥 코팅 등 기존 인쇄 방법들과 호환돼 고해상 대면적 회로 제작은 물론 복잡한 3차원 형태의 다양한 전자기기 제작을 가능하게 한다. 연구팀은 이 기술을 활용해 평상시에는 딱딱한 휴대용 전자기기로 사용하다가 몸에 착용하면 부드러운 웨어러블 헬스케어 기기로 변환되는 가변형 다목적 기기를 개발했다. 뿐만 아니라, 수술 시에는 딱딱한 상태로 정밀한 조작과 뇌 삽입이 가능하지만 뇌 조직 내에서는 부드럽게 변해 조직 내 염증반응을 최소화하는 뇌 탐침을 구현함으로써 이식용 소자로서의 활용 가능성도 입증했다. 정재웅 교수는 “전자 잉크 용매의 산성도 조절을 통해 갈륨 입자들을 전기·기계적 연결하는 독창적 기술로 액체금속 프린팅의 고질적인 문제를 해결하고 상온에서 초정밀 고해상 회로 제작을 가능하게 한 것이 이번 연구의 핵심”이라며 “하나의 기기가 상황에 따라 딱딱한 상태와 부드러운 상태로 자유자재로 변환될 수 있어 다목적 전자기기, 의료 기술, 로봇 분야 등에서 다양한 응용이 가능할 것”이라고 말했다. 전기및전자공학부 이시목 박사과정 학생과 부산대 이건희 교수가 공동 제1 저자로 참여한 이번 연구는 국제 학술지 ‘사이언스 어드밴시스(Science Advances)’에 5월 30일 字에 게재됐다. (논문명 : Phase-Change Metal Ink with pH-Controlled Chemical Sintering for Versatile and Scalable Fabrication of Variable Stiffness Electronics, DOI/10.1126/sciadv.adv4921) 한편 이번 연구는 과학기술정보통신부에서 추진하는 한국연구재단 중견연구지원사업, 기초연구실지원사업, 보스턴-코리아 공동연구 프로젝트, BK21 FOUR 사업의 지원을 받아 수행됐다.
2025.06.04 조회수 1821
금융 필수 보안 소프트웨어가 해킹 악용 가능성 밝혀 우리나라는 금융 보안 소프트웨어 설치를 의무화한 유일한 국가다. 이것이 오히려 보안 위협에 취약할 수도 있다는 우려가 국내 연구진에 의해 밝혀졌다. KAIST 연구진은 안전한 금융 환경을 위한 현재 복잡하고 위험한 보안 프로그램을 강제로 설치하는 방식 대신, 웹사이트와 인터넷 브라우저에서 원래 설정한 안전한 규칙과 웹 표준을 따르는 ‘근본적 전환’이 필요하다고 설명했다. 우리 대학 전기및전자공학부 김용대·윤인수 교수 공동 연구팀이 고려대 김승주 교수팀, 성균관대 김형식 교수팀, 보안 전문기업 티오리(Theori) 소속 연구진이 공동연구를 통해, 한국 금융보안 소프트웨어의 구조적 취약점을 체계적으로 분석한 연구 결과에 대해 2일 밝혔다. 연구진은 북한의 사이버 공격 사례에서 왜 한국의 보안 소프트웨어가 주요 표적이 되는지에 주목했다. 분석 결과, 해당 소프트웨어들이 설계상의 구조적 결함과 구현상 취약점을 동시에 내포하고 있음이 드러났다. 특히 문제는, 한국에서는 금융 및 공공서비스 이용 시 이러한 보안 프로그램의 설치를 의무화하고 있다는 점이다. 이는 전 세계적으로도 유례가 없는 정책이다. 연구팀은 국내 주요 금융기관과 공공기관에서 사용 중인 7종의 주요 보안 프로그램(Korea Security Applications, 이하 ‘KSA 프로그램’)을 분석해 총 19건의 심각한 보안 취약점을 발견했다. 주요 취약점은 ▲키보드 입력 탈취 ▲중간자 공격(MITM) ▲공인인증서 유출 ▲원격 코드 실행(RCE) ▲사용자 식별 및 추적 이다. 일부 취약점은 연구진의 제보로 패치됐으나, 전체 보안 생태계를 관통하는 근본적 설계 취약점은 여전히 해결되지 않은 상태다. 연구진은 "이러한 보안 소프트웨어는 사용자의 안전을 위한 도구가 되어야 함에도 오히려 공격의 통로로 악용될 수 있다”며, 보안의 근본적 패러다임 전환이 필요하다고 강조했다. 연구팀은 국내 금융보안 소프트웨어들이 웹 브라우저의 보안 구조를 우회해 민감한 시스템 기능을 수행하도록 설계됐다고 지적했다. 브라우저는 원칙적으로 외부 웹사이트가 시스템 내부 파일 등 민감 정보에 접근하지 못하도록 제한하지만, KSA는 키보드 보안, 방화벽, 인증서 저장으로 구성된 이른바 ‘보안 3종 세트’를 유지하기 위해 루프백 통신, 외부 프로그램 호출, 비표준 API 활용 등 브라우저 외부 채널을 통해 이러한 제한을 우회하는 방식을 사용하고 있다. 이러한 방식은 2015년까지는 보안 플러그인 ActiveX를 통해 이뤄졌지만, 보안 취약성과 기술적 한계로 ActiveX 지원이 중단되면서 근본적인 개선이 이뤄질 것으로 기대됐다. 그러나 실제로는 실행파일(.exe)을 활용한 유사한 구조로 대체되면서, 기존의 문제를 반복하는 방식으로 이어졌다. 이로 인해 브라우저 보안 경계를 우회하고, 민감 정보에 직접 접근하는 보안 리스크가 여전히 지속되고 있다. 이러한 설계는 ▲동일 출처 정책(Same-Origin Policy, SOP)* ▲샌드박스** ▲권한 격리*** 등 최신 웹 보안 메커니즘과 정면으로 충돌한다. 연구팀은 실제로 이러한 구조가 새로운 공격 경로로 악용될 수 있음을 실증적으로 확인했다. *Same-Origin Policy(SOP, 동일 출처 정책): 웹 보안의 핵심 개념 중 하나로, 서로 다른 출처(origin)의 웹 페이지나 스크립트 간에 데이터에 접근하지 못하도록 제한하는 보안 정책 **샌드박스(Sandbox): 보안과 안정성을 위해 시스템 내에서 실행되는 코드나 프로그램의 활동을 제한된 환경 안에 가두는 기술 ***권한 격리(Privilege Separation): 시스템 보안을 강화하기 위해, 프로그램이나 프로세스를 여러 부분으로 나누고 각각에 최소한의 권한만 부여하는 보안 설계 방식 연구팀이 전국 400명을 대상으로 실시한 온라인 설문조사 결과, 97.4%가 금융서비스 이용을 위해 KSA를 설치한 경험이 있었으며, 이 중 59.3%는 ‘무엇을 하는 프로그램인지 모른다’고 응답했다. 실제 사용자 PC 48대를 분석한 결과, 1인당 평균 9개의 KSA가 설치돼 있었고 다수는 2022년 이전 버전이었다. 일부는 2019년 버전까지 사용되고 있었다. 김용대 교수는 “문제는 단순한 버그가 아니라, ‘웹은 위험하므로 보호해야 한다’는 브라우저의 보안 철학과 정면으로 충돌하는 구조”라며 “이처럼 구조적으로 안전하지 않은 시스템은 작은 실수도 치명적인 보안 사고로 이어질 수 있다”고 강조했다. 이어 “이제는 비표준 보안 소프트웨어들을 강제로 설치시키는 방식이 아니라, 웹 표준과 브라우저 보안 모델을 따르는 방향으로 전환해야 한다”며, “그렇지 않으면 KSA는 향후에도 국가 차원의 보안 위협의 중심이 될 것”이라고 덧붙였다. 우리 대학 김용대·윤인수 교수, 고려대 김승주 교수, 성균관대 김형식 교수가 연구를 주도했으며, 제1 저자인 윤태식 연구원<(주)티오리/KAIST>을 비롯해 정수환<(주)엔키화이트햇/KAIST>, 이용화<(주)티오리> 연구원이 참여했다. 세계 최고 권위의 보안 학회 중 하나인 ‘유즈닉스 시큐리티 2025(USENIX Security 2025)’에 채택됐다고 2일 밝혔다. ※ 논문명: Too Much of a Good Thing: (In-)Security of Mandatory Security Software for Financial Services in South Korea ※ 논문원문: https://syssec.kaist.ac.kr/pub/2025/Too_Much_Good.pdf 이번 연구는 정보통신기획평가원(IITP)의 RS-2024-00400302, RS-2024-00438686, RS-2022-II221199 과제의 지원을 받아 수행됐다. 데모 동영상 1) https://drive.google.com/file/d/1MAK-fLQ5VEsNtCu0ARpyWuflf1I2yLbv/view?usp=sharing 설명: 피해자가 해킹 사이트에 접속하게 되면 해킹 사이트는 설치된 키보드 보안 프로그램과 통신하여 피해자가 입력하는 키보드 입력을 가로채어 자신에게 전송하도록 설정할 수 있음. 이로 인해 피해자가 입력하는 키보드 입력들이 비밀번호 입력까지도 해커에게 전송됨. 일반적으로 웹 페이지에서 다른 프로그램이나 다른 사이트에 입력하는 키보드 입력을 가로채는 것이 불가능하지만 KSA를 이용해 키보드 입력을 가로챌 수 있음. 데모 동영상 2) https://drive.google.com/file/d/17xrxXuwejYvxbOSHDNLTr9G_vKWI0Lbm/view?usp=sharing 설명: 피해자가 해킹 사이트에 접속하게 되면 해킹 사이트는 KSA와 통신하여 피해자의 PC에 악성 파일을 다운로드 시킬 수 있고, 해당 파일을 이용해 민감한 저장소에 악성 프로그램을 설치할 수 있음. 설치된 악성 프로그램은 피해자가 PC를 재부팅하면 실행되며 해커가 원하는 코드를 임의로 실행할 수 있음. 데모 동영상에서는 단순히 해커가 원하는 코드를 실행할 수 있음을 보이기 위해 계산기 프로그램을 실행하였지만 실제 상황에서는 백도어 등을 해커가 피해자 PC에 설치할 수 있음. 일반적으로 웹페이지에서 시스템에서 동작하는 코드를 실행하는 것은 불가능하지만 KSA의 취약성을 이용해 시스템에서 동작하는 코드를 실행하여 악성 행위를 할 수 있음.
2025.06.02 조회수 4520
음악 창작 돕는 작곡 AI 동료 ‘어뮤즈’ 공개 음악 창작자가 초기 아이디어를 생각하거나 창작 중간 막힐 때, 이를 같이 해결해 주고 다양한 음악적 방향 탐색에 실질적인 도움을 주는 동료가 있다면 얼마나 좋을까? KAIST 연구진이 이런 음악 창작을 돕는 동료 작가와 같은 AI 기술을 개발했다. KAIST(총장 이광형)는 전기및전자공학부 이성주 교수 연구팀이 AI 기반 음악 창작 지원 시스템 어뮤즈(Amuse)를 개발하였다. 이 연구 결과는 4월 26일부터 5월 1일까지 일본 요코하마에서 열린 인간-컴퓨터 상호작용 분야 세계 최고 권위의 국제학술대회인 CHI(ACM Conference on Human Factors in Computing Systems)에서 전체 논문 중 상위 1%에게만 수여되는 최우수 논문상(Best Paper Award)을 수상했다고 7일 밝혔다. 이성주 교수 연구팀이 개발한 어뮤즈(Amuse) 시스템은 텍스트, 이미지, 오디오와 같은 다양한 형식의 영감을 입력하면 이를 화성 구조(코드 진행)로 변환해 작곡을 지원해 주는 AI 기반 시스템이다. 예를 들어, 사용자가 ‘따뜻한 여름 해변의 기억’과 같은 문구나 이미지, 사운드 클립을 입력하면, 어뮤즈는 해당 영감에 어울리는 코드 진행을 자동으로 생성해 제안한다. 기존의 생성 AI와 달리, 어뮤즈는 사용자의 창작 흐름을 존중하고, AI의 제안을 유연하게 통합·수정할 수 있는 상호작용 방식을 통해 창의적 탐색을 자연스럽게 유도한다는 점에서 차별성을 갖는다. 어뮤즈 시스템의 핵심 기술은 대형 언어 모델의 이용해 사용자의 영감으로 프롬프트에 입력한 글자 따라 이에 어울리는 음악 코드를 생성하고, 실제 음악 데이터를 학습한 AI 모델이 부자연스럽거나 어색한 결과는 걸러내는(리젝션 샘플링) 과정을 거쳐 결합한 두 가지 방법을 자연스럽게 이어 재현하는 하이브리드 생성 방식이다. 연구팀은 실제 뮤지션들을 대상으로 한 사용자 연구를 수행하여, 어뮤즈가 단순한 음악 생성 AI가 아닌, 사람과 AI가 협업하는 창작 동반자(Co-Creative AI)로서의 가능성이 높다는 평가를 받았다. KAIST 전기 및 전자공학부 박사과정 김예원, 이성주 교수, 카네기 멜런 대학의 크리스 도너휴(Chris Donahue) 교수가 참여한 해당 논문은 학계 및 산업계 모두의 창의적 AI 시스템 설계의 가능성을 보여주었다. ※ 논문명 : Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations DOI : https://doi.org/10.1145/3706598.3713818 ※ 연구 데모 영상: https://youtu.be/udilkRSnftI?si=FNXccC9EjxHOCrm1 ※ 연구 홈페이지: https://nmsl.kaist.ac.kr/projects/amuse/ 이성주 교수는 “ 최근 생성형 AI 기술은 저작권이 있는 콘텐츠를 그대로 모방하여 창작자의 저작권을 침해하거나, 창작자의 의도와는 무관하게 일방향으로 결과물을 생성한다는 점에서 우려를 낳고 있다. 이에 연구팀은 이러한 흐름에 문제 의식을 가지고, 창작자가 실제로 필요로 하는 것이 무엇인지에 주목하며 창작자 중심의 AI 시스템 설계에 주안점을 두었다.”라고 말했다. 이어 ”어뮤즈는 창작자의 주도권을 유지한 채, 인공지능과의 협업 가능성을 탐색하는 시도로, 향후 음악 창작 도구와 생성형 AI 시스템의 개발에 있어 보다 창작자 친화적인 방향을 제시하는 출발점이 될 것으로 기대된다.“라고 설명했다. 이 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행되었다.(RS-2024-00337007)
2025.05.07 조회수 3530
외계행성 감지 중적외선 광검출기 혁신, 환경·의료 개척 미국 항공우주국(NASA)의 제임스웹 우주망원경(JWST)은 중적외선 스펙트럼을 활용해 외계 행성 대기의 수증기, 이산화황 등 분자 성분을 정밀하게 분석하고 있다. 이처럼 각 분자가 ‘지문’처럼 고유한 패턴을 나타내는 중적외선 분석의 핵심은, 아주 약한 빛의 세기까지 정밀하게 측정할 수 있는 고감도 광검출기 기술이다. 최근 KAIST 연구진이 중적외선 스펙트럼의 넓은 영역을 감지할 수 있는 혁신적 광검출기 기술을 개발하며 주목을 받고 있다. 우리 대학 전기및전자공학부 김상현 교수팀이 상온에서 안정적으로 동작하는 중적외선 광검출기 기술을 개발하고, 이를 통해 초소형 광학 센서 상용화에 새로운 전환점을 마련했다고 27일 밝혔다. 이번에 개발된 광검출기는 기존 실리콘(Silicon) 기반 CMOS 공정을 활용해 저비용 대량 생산이 가능하며, 상온에서 안정적으로 동작하는 것이 특징이다. 특히 연구팀은 이 광검출기를 적용한 초소형·초박형 광학 센서를 이용해 이산화탄소(CO2) 가스를 실시간으로 검출하는 데 성공, 환경 모니터링 및 유해가스 분석 등 다양한 응용 가능성을 입증했다. 기존 중적외선 광검출기는 상온에서의 높은 열적 잡음(Thermal noise)으로 인해 일반적으로 냉각 시스템이 요구된다. 이러한 냉각 시스템은 장비의 크기와 비용을 증가시켜, 센서의 소형화 및 휴대용 기기 응용을 어렵게 만든다. 또한, 기존 중적외선 광검출기는 실리콘 기반 CMOS 공정과 호환되지 않아 대량생산이 어렵고 상용화가 제한됐다. 이에 연구팀은 실리콘과 같은 주기율표 4족 원소인 저마늄(Germanium) 반도체를 기반으로 한 광학 플랫폼을 활용해, 넓은 대역의 중적외선 검출 성능을 확보하면서도 동시에 상온에서 안정적으로 동작할 수 있는 새로운 형태의 도파로형(waveguide-integrated) 광검출기를 개발했다. ‘도파로’란 빛을 특정한 경로로 손실 없이 효과적으로 유도하는 구조물을 의미한다. 온-칩(on-chip) 상에서 다양한 기능의 광학 회로를 구현하기 위해서는 도파로형 광검출기를 포함해 도파로를 기반으로 하는 광학 소자의 개발이 필수적으로 요구된다. 이번 기술은 기존에 광검출기 동작에 일반적으로 활용되는 밴드갭 흡수 원리와는 다르게 볼로미터 효과(Bolometric effect)*를 활용해 중적외선 스펙트럼 영역 전체를 대응할 수 있기 때문에 다양한 종류의 분자들의 실시간 센싱에 범용적으로 활용될 수 있다. *볼로미터 효과(Bolometric effect): 빛을 흡수하면 온도가 올라가고, 그 온도 변화에 따라 전기적인 신호가 달라지는 원리 연구팀이 개발한 상온 동작 및 CMOS 공정 호환 중적외선 도파로형 광검출기는 기존 중적외선 센서 기술이 가진 냉각 필요성, 대량 생산의 어려움, 높은 비용 문제를 해결하는 혁신적인 기술로 평가된다. 이를 통해 환경 모니터링, 의료 진단, 산업 공정 관리, 국방 및 보안, 스마트 디바이스 등 다양한 응용 분야에 적용 가능하며, 차세대 중적외선 센서 기술의 핵심적인 돌파구를 제공할 것으로 기대된다. 김상현 교수는 “이번 연구는 기존 중적외선 광검출기 기술의 한계를 극복한 새로운 접근 방식이며, 향후 다양한 응용 분야에서 실용화될 가능성이 매우 크다”고 밝혔다. 또한, “특히 CMOS 공정과 호환되는 센서 기술로, 저비용 대량생산이 가능해 차세대 환경 모니터링 시스템, 스마트 제조 현장 등에서 적극 활용될 것”이라고 덧붙였다. 이번 연구 결과는 심준섭 박사(現 하버드대학교 박사후 연구원)가 제1 저자로 참여해 국제 저명 학술지인 ‘빛, 과학과 응용(Light: Science & Applications, JCR 2.9%, IF=20.6)’에 2025년 3월 19일 자 발표됐다. (논문제목: Room-temperature waveguide-integrated photodetector using bolometric effect for mid-infrared spectroscopy applications, https://doi.org/10.1038/s41377-025-01803-3) 한편, 해당 연구는 한국연구재단의 지원을 받아 진행됐다.
2025.03.27 조회수 3211
챗GPT 등 대형 AI모델 학습 최적화 시뮬레이션 개발 최근 챗GPT, 딥시크(DeepSeek) 등 초거대 인공지능(AI) 모델이 다양한 분야에서 활용되며 주목받고 있다. 이러한 대형 언어 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습되는데, GPT-4의 경우 모델을 학습하는 데 소모되는 비용은 약 1,400억 원에 육박하는 것으로 추산된다. 한국 연구진이 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 최적의 병렬화 구성을 도출하도록 돕는 기술을 개발했다. 우리 대학 전기및전자공학부 유민수 교수 연구팀은 삼성전자 삼성종합기술원과 공동연구를 통해, 대규모 분산 시스템에서 대형 언어 모델(LLM)의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(이하 vTrain)를 개발했다고 13일 밝혔다. 대형 언어 모델 학습 효율을 높이려면 최적의 분산 학습 전략을 찾는 것이 필수적이다. 그러나 가능한 전략의 경우의 수가 방대할 뿐 아니라 실제 환경에서 각 전략의 성능을 테스트하는 데는 막대한 비용과 시간이 들어간다. 이에 따라 현재 대형 언어 모델을 학습하는 기업들은 일부 경험적으로 검증된 소수의 전략만을 사용하고 있다. 이는 GPU 활용의 비효율성과 불필요한 비용 증가를 초래하지만, 대규모 시스템을 위한 시뮬레이션 기술이 부족해 기업들이 문제를 효과적으로 해결하지 못하고 있는 상황이다. 이에 유민수 교수 연구팀은 vTrain을 개발해 대형 언어 모델의 학습 시간을 정확히 예측하고, 다양한 분산 병렬화 전략을 빠르게 탐색할 수 있도록 했다. 연구팀은 실제 다중 GPU 환경에서 다양한 대형 언어 모델 학습 시간 실측값과 vTrain의 예측값을 비교한 결과, 단일 노드에서 평균 절대 오차(MAPE) 8.37%, 다중 노드에서 14.73%의 정확도로 학습 시간을 예측할 수 있음을 검증했다. 연구팀은 삼성전자 삼성종합기술원와 공동연구를 진행하여 vTrain 프레임워크와 1,500개 이상의 실제 학습 시간 측정 데이터를 오픈소스로 공개(https://github.com/VIA-Research/vTrain)하여 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 했다. 유민수 교수는 “vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색하였으며 오픈소스를 공개하였다. 이를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것이다”라고 말했다. 이 연구 결과는 방제현 박사과정이 제1 저자로 참여하였고 컴퓨터 아키텍처 분야의 최우수 학술대회 중 하나인 미국 전기전자공학회(IEEE)·전산공학회(ACM) 공동 마이크로아키텍처 국제 학술대회(MICRO)에서 지난 11월 발표됐다. (논문제목: vTrain: A Simulation Framework for Evaluating Cost-Effective and Compute-Optimal Large Language Model Training, https://doi.org/10.1109/MICRO61859.2024.00021) 이번 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단, 정보통신기획평가원, 그리고 삼성전자의 지원을 받아 수행되었으며, 과학기술정보통신부 및 정보통신기획평가원의 SW컴퓨팅산업원천기술개발(SW스타랩) 사업으로 연구개발한 결과물이다.
2025.03.13 조회수 3421
비오는 날 터치 걱정 끝! KAIST, 인간 촉각 수준 감지 최근 개발된 로봇들은 계란을 섬세하게 집는 수준에 이르렀는데, 이같은 결과는 손 끝에 집적된 압력 센서가 촉각 정보를 제공했기 때문이다. 그러나, 이러한 세계 최고 수준의 로봇들조차도 물 속, 굽힘, 전자기 간섭과 같은 복잡한 외부 간섭 요소들이 존재하는 환경에서 압력을 정확히 감지하는 것은 아직 어렵다. 우리 연구진이 물기가 묻은 스마트폰 화면과 같은 환경에서도 외부 간섭 없이 안정적으로 작동하며, 인간의 촉각 수준에 근접한 압력 센서를 개발하는 데 성공했다. 우리 대학 전기및전자공학부 윤준보 교수 연구팀이 비가 오거나 샤워 후 스마트폰 화면에 물이 묻으면, 터치가 엉뚱하게 인식되는 '고스트 터치'와 같은 외부 간섭의 영향을 받지 않으면서도 높은 해상도로 압력을 감지할 수 있는 압력 센서를 개발했다고 10일 밝혔다. 흔히 터치 시스템으로 사용되고 있는 정전용량 방식 압력 센서는 구조가 간단하고 내구성이 뛰어나 스마트폰, 웨어러블 기기, 로봇 등의 휴먼-머신 인터페이스(Human-Machine Interface) 기술에 널리 활용되고 있다. 그러나 물방울이나 전자기 간섭, 굴곡으로 인한 굽힘 등 외부 간섭 요소에 의해 오작동이 발생하는 치명적인 문제가 있었다. 연구팀은 이와 같은 문제를 해결하기 위해 우선 정전용량 방식 압력 센서에서 발생하는 간섭의 원인을 정확히 파악하고자 했다. 그 결과, 센서 가장자리에서 발생하는 ‘프린지 필드(Fringe Field)'가 외부 간섭에 극도로 취약한 것을 확인했다. 이를 근본적으로 해결하기 위해서는 문제의 원인인 프린지 필드를 억제해야 한다는 결론에 이르렀다. 따라서, 연구팀은 이론적 접근을 통해 프린지 필드에 영향을 미치는 구조적 변수들에 대해 집중적으로 탐구했고 전극 간격을 수백 나노미터(nm) 수준으로 좁힐 경우 센서에서 발생하는 프린지 필드를 수 퍼센트 이하로 억제할 수 있음을 확인했다고 밝혔다. 연구팀은 독자적인 마이크로/나노 구조 공정 기술을 활용해 앞서 설계한 900나노미터(nm) 수준의 전극 간격을 갖는 나노 갭 압력 센서를 개발했다. 개발된 센서는 압력을 가하는 물질에 관계없이 압력만을 신뢰적으로 감지했으며 굽힘이나 전자기 간섭에도 감지 성능에 영향이 없는 것을 검증했다. 또한, 연구팀은 개발한 센서의 특성을 활용해 인공 촉각 시스템을 구현했다. 인간의 피부에는 메르켈 원반(Merkel's disc)라는 압력 수용기가 있어 압력을 감지하는데, 이를 모사하기 위해서는 외부 간섭에는 반응하지 않고 오직 압력에만 반응하는 압력 센서 기술이 필요했지만 기존 기술들로는 이러한 조건을 만족시키기가 어려웠다. 윤준보 교수 연구팀이 개발한 센서는 이러한 제약을 모두 극복했으며, 밀도 또한 메르켈 원반 수준에 도달해 무선으로 정밀한 압력 감지가 가능한 인공 촉각 시스템을 구현하는 데 성공했다. 더 나아가, 다양한 전자기기로의 응용 가능성을 확인하기 위해 포스 터치 패드 시스템 역시 개발해 압력의 크기와 분포를 간섭 없이 높은 해상도로 얻을 수 있음을 검증했다고 밝혔다. 윤준보 교수는 “이번 나노 갭 압력 센서는 비 오는 날이나 땀이 나는 상황에서도 기존 압력 센서처럼 오작동하지 않고 안정적으로 동작한다. 많은 사람들이 일상에서 겪어온 불편을 해소할 수 있을 것으로 기대한다.”라고 말했다. 전기및전자공학부 양재순 박사, 정명근 박사과정 그리고 성균관대 반도체융합공학과 유재영 조교수(KAIST 박사 졸업)가 제1 저자로 수행한 이번 연구는 저명 국제 학술지 `네이처 커뮤니케이션즈 (Nature Communications)'에 2025년 2월 27일 출판됐다. (논문 제목: Interference-Free Nanogap Pressure Sensor Array with High Spatial Resolution for Wireless Human-Machine Interfaces Applications, https://doi.org/10.1038/s41467-025-57232-8) 한편, 이번 연구는 한국연구재단의 중견연구지원사업과 선도연구센터지원사업의 지원을 받아 수행됐다.
2025.03.10 조회수 3795
챗GPT를 이용한 개인정보 악용 가능성 규명 최근 인공지능 기술의 발전으로 챗GPT와 같은 대형 언어 모델(이하 LLM)은 단순한 챗봇을 넘어 자율적인 에이전트로 발전하고 있다. 구글(Google)은 최근 인공지능 기술을 무기나 감시에 활용하지 않겠다는 기존의 약속을 철회해 인공지능 악용 가능성에 대한 논란이 불거진 점을 상기시키며, 연구진이 LLM 에이전트가 개인정보 수집 및 피싱 공격 등에 활용될 수 있음을 입증했다. 우리 대학 전기및전자공학부 신승원 교수, 김재철 AI 대학원 이기민 교수 공동연구팀이 실제 환경에서 LLM이 사이버 공격에 악용될 가능성을 실험적으로 규명했다고 25일 밝혔다. 현재 OpenAI, 구글 AI 등과 같은 상용 LLM 서비스는 LLM이 사이버 공격에 사용되는 것을 막기 위한 방어 기법을 자체적으로 탑재하고 있다. 그러나 연구팀의 실험 결과, 이러한 방어 기법이 존재함에도 불구하고 쉽게 우회해 악의적인 사이버 공격을 수행할 수 있음이 확인됐다. 기존의 공격자들이 시간과 노력이 많이 필요한 공격을 수행했던 것과는 달리, LLM 에이전트는 이를 평균 5~20초 내에 30~60원(2~4센트) 수준의 비용으로 개인정보 탈취 등이 자동으로 가능하다는 점에서 새로운 위협 요소로 부각되고 있다. 연구 결과에 따르면, LLM 에이전트는 목표 대상의 개인정보를 최대 95.9%의 정확도로 수집할 수 있었다. 또한, 저명한 교수를 사칭한 허위 게시글 생성 실험에서는 최대 93.9%의 게시글이 진짜로 인식됐다. 뿐만 아니라, 피해자의 이메일 주소만을 이용해 피해자에게 최적화된 정교한 피싱 이메일을 생성할 수 있었으며, 실험 참가자들이 이러한 피싱 이메일 내의 링크를 클릭할 확률이 46.67%까지 증가하는 것으로 나타났다. 이는 인공지능 기반 자동화 공격의 심각성을 시사한다. 제1 저자인 김한나 연구원은 "LLM에게 주어지는 능력이 많아질수록 사이버 공격의 위협이 기하급수적으로 커진다는 것이 확인됐다”며, "LLM 에이전트의 능력을 고려한 확장 가능한 보안 장치가 필요하다”고 말했다. 신승원 교수는 “이번 연구는 정보 보안 및 AI 정책 개선에 중요한 기초 자료로 활용될 것으로 기대되며, 연구팀은 LLM 서비스 제공업체 및 연구기관과 협력하여 보안 대책을 논의할 계획이다”라고 밝혔다. 전기및전자공학부 김한나 박사과정이 제1 저자로 참여한 이번 연구는 컴퓨터 보안 분야의 최고 학회 중 하나인 국제 학술대회 USENIX Security Symposium 2025에 게재될 예정이다. (논문명: "When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs") DOI: 10.48550/arXiv.2410.14569 한편 이번 연구는 정보통신기획평가원, 과학기술정보통신부 및 광주광역시의 지원을 받아 수행됐다.
2025.02.24 조회수 3859
최대 11배 빨라진 PIM 반도체 네트워크 개발 최근 인공지능, 빅데이터, 생명과학 등 연구에 사용되는 메모리 대역폭이 차지하는 비중이 높아, 메모리 내부에 연산장치를 배치하는 프로세싱-인-메모리(Processing-in-Memory, 이하 PIM) 반도체에 대한 연구개발이 활발히 진행되고 있다. 국제 공동 연구진이 기존의 PIM 반도체가 내부장치를 활용하면서도 통신을 할때 반드시 PIM 반도체 외부로 연결되는 CPU를 통해야한다는 문제점으로 발생한 병목현상을 해결했다. 우리 대학 전기및전자공학부 김동준 교수 연구팀이 미국 노스이스턴 대학(Northeastern Univ.), 보스턴 대학(Boston Univ.)와 스페인 무르시아 대학(Universidad de Murcia)의 저명 연구진과‘PIM 반도체 간 집합 통신에 특화된 인터커넥션 네트워크 아키텍처’를 통한 공동연구로 PIM 반도체의 통신 성능을 비약적으로 향상하는 기법을 개발했다고 19일 밝혔다. 김동준 교수 연구팀은 기존 PIM 반도체가 갖는 메모리 내부 연산 장치 간 통신 구조의 한계를 밝히고, 기존에 메모리 내부에 존재하는 데이터 이동을 위한 버스 구조를 최대한 활용하면서 각 연산장치를 직접적으로 상호 연결하는 *인터커넥션 네트워크 구조를 적용함으로써 PIM 반도체의 통신 성능을 극대화하는 기법을 제안했다. ※ 인터커넥션 네트워크(interconnection network): 다중 연산 장치를 포함하는 대규모 시스템 설계에 쓰이는 연산 장치 간 연결 구조를 말한다. 인터커넥션 네트워크는 다중 연산 장치를 포함하는 시스템 설계의 필수 요소 중 하나로써 시스템 규모가 커질수록 더욱 중요해지는 특징이 있다. 이를 통해 PIM 반도체를 위한 연산 과정에서 통신 처리를 위한 CPU의 개입을 최소화해 PIM 반도체 시스템의 전체적인 성능과 활용성을 높인 PIM 반도체에 특화된 인터커넥션 네트워크 구조를 개발했다. 메모리 공정은 복잡한 로직의 추가가 어렵다는 문제점이 있는데 김동준 교수팀이 개발한 네트워크 구조는 PIM에서 비용 효율적인 인터커넥트를 구현했다. 이 구조는 병렬 컴퓨팅과 기계학습 분야에서 널리 활용되는 집합 통신(Collective communication) 패턴에 특화돼 있으며, 각 연산장치의 통신량과 데이터 이동 경로를 미리 파악할 수 있다는 집합 통신의 결정성(determinism) 특징을 활용해 기존 네트워크에서 비용을 발생시키는 주요 구성 요소들을 최소화시켰다. 기존 PIM 반도체들이 통신하기 위해서는 CPU를 거쳐야만 하기 때문에 상당한 성능 손실이 있었다. 하지만, 연구팀은 PIM 특화 인터커넥션 네트워크를 적용하면 기존 시스템 대비 어플리케이션 성능을 최대 11배 향상했다고 밝혔다. 그 이유는 PIM 반도체의 내부 메모리 대역폭 활용률을 극대화하고 PIM 메모리 시스템의 규모가 커짐에 따라 통신 성능의 확장성이 함께 증가했기 때문이다. 최근 미국 전기전자공학회(IEEE) 컴퓨터 아키텍쳐 분야에서는 한국 최초로 2025 IEEE 펠로우(석학회원)로 선임되었고 이 연구를 주도한 김동준 교수는 “데이터 이동(data movement)을 줄이는 것은 PIM을 포함한 모든 시스템 반도체에서 핵심적인 요소이며, PIM은 컴퓨팅 시스템의 성능과 효율성을 향상할 수 있지만 PIM 연산장치 간 데이터 이동으로 인해 성능 확장성이 제약될 수 있어 응용 분야가 제한적이고, PIM 인터커넥트가 이에 대한 해법이 될 수 있다”고 연구의 의의를 설명했다. 전기및전자공학부 손효준 박사과정이 제1 저자로 참여한 이번 연구는 미국 네바다주 라스베이거스에서 열리는 컴퓨터 구조 분야 최우수 국제 학술대회인 ‘2025 IEEE International Symposium on High Performance Computer Architecture, HPCA 2025’에서 올 3월에 발표될 예정이다. (논문명: PIMnet: A Domain-Specific Network for Efficient Collective Communication in Scalable PIM) 한편 이번 연구는 한국연구재단, 삼성전자, 정보통신기획평가원 차세대지능형반도체기술개발사업의 지원을 받아 수행됐다.
2025.02.19 조회수 3697
수면 무호흡증 실시간 진단 센서 개발 이산화탄소는 주요 호흡 대사 산물로서, 날숨 내 이산화탄소 농도의 지속적인 모니터링은 호흡·순환기계 질병을 조기 발견 및 진단하는 데 중요한 지표가 될 뿐만 아니라, 개인 운동 상태 모니터링 등에 폭넓게 사용될 수 있다. 우리 연구진이 마스크 내부에 부착하여 이산화탄소 농도를 정확히 측정하는데 성공했다. 우리 대학 전기및전자공학부 유승협 교수 연구팀이 실시간으로 안정적인 호흡 모니터링이 가능한 저전력 고속 웨어러블 이산화탄소 센서를 개발했다고 10일 밝혔다. 기존 비침습적 이산화탄소 센서는 부피가 크고 소비전력이 높다는 한계가 있었다. 특히 형광 분자를 이용한 광화학적 이산화탄소 센서는 소형화 및 경량화가 가능하다는 장점에도 불구하고, 염료 분자의 광 열화 현상으로 인해 장시간 안정적 사용이 어려워 웨어러블 헬스케어 센서로 사용되는 데 제약이 있었다. 광화학적 이산화탄소 센서는 형광 분자에서 방출되는 형광의 세기가 이산화탄소 농도에 따라 감소하는 점을 이용하며, 형광 빛의 변화를 효과적으로 검출하는 것이 중요하다. 이를 위해 연구팀은 LED와 이를 감싸는 유기 포토다이오드로 이루어진 저전력 이산화탄소 센서를 개발했다. 높은 수광 효율을 바탕으로 형광 분자에 조사되는 여기 광량이 최소화된 센서는 수 mW 수준을 소비하는 기존 센서에 비해 수십 배 낮은 171μW의 소자 소비전력을 달성했다. 연구팀은 또한 이산화탄소 센서에 사용되는 형광 분자의 광 열화 경로를 규명해 광화학적 센서에서 사용 시간에 따라 오차가 증가하는 원인을 밝히고, 오차 발생을 억제하기 위한 광학적 설계 방법을 제시했다. 이를 기반으로, 연구팀은 기존 광화학적 센서의 고질적 문제였던 광 열화 현상에 따른 오차 발생을 효율적으로 감소시키고 동일 재료에 기반한 기존 기술은 20분 이내인데 반해 최대 9시간까지 안정적으로 연속 사용이 가능하며, 이산화탄소 감지 형광 필름 교체시 다회 활용도 가능한 센서를 개발했다. 개발된 센서는 가볍고(0.12 g), 얇으며(0.7 mm), 유연하다는 장점을 기반으로 마스크 내부에 부착되어 이산화탄소 농도를 정확히 측정했다. 또한, 실시간으로 들숨과 날숨을 구별해 호흡수까지 모니터링 가능한 빠른 속도와 높은 해상도를 보였다. 유승협 교수는 "개발한 센서는 저전력, 고안정성, 유연성 등 우수한 특성을 가져 웨어러블 디바이스에 폭넓게 적용될 수 있어 과탄산증, 만성 폐쇄성 폐질환, 수면 무호흡 등 다양한 질병의 조기 진단에 사용될 수 있다”면서 “특히, 분진 발생 현장이나 환절기 등 장시간 마스크 착용 환경에서의 재호흡에 따른 부작용 개선에도 사용될 것으로 기대된다ˮ 라고 밝혔다. 신소재공학과 김민재 학사과정과 전기및전자공학부 최동호 박사과정이 공동 제1 저자로 참여한 이번 연구는 Cell 자매지인 `디바이스(Device)' 온라인판에 지난달 22일 공개됐다. (논문명: Ultralow-power carbon dioxide sensor for real-time breath monitoring) DOI: https://doi.org/10.1016/j.device.2024.100681 한편 이번 연구는 산업통상자원부 소재부품기술개발사업, 한국연구재단 원천기술개발사업, KAIST 학부생 연구참여 프로젝트 (URP) 프로그램의 지원을 받아 수행됐다.
2025.02.10 조회수 3536
스스로 학습·수정하는 뉴로모픽 반도체칩 개발 기존 컴퓨터 시스템은 데이터 처리 장치와 저장 장치가 분리돼 있어, 인공지능처럼 복잡한 데이터를 처리하기에는 효율적이지 않다. KAIST 연구팀은 우리 뇌의 정보 처리 방식과 유사한 멤리스터 기반 통합 시스템을 개발했다. 이제 원격 클라우드 서버에 의존하지 않고 의심스러운 활동을 즉시 인식하는 스마트 보안 카메라부터 건강 데이터를 실시간으로 분석할 수 있는 의료기기까지 다양한 분야에 적용될 수 있게 되었다. 우리 대학 전기및전자공학부 최신현 교수, 윤영규 교수 공동연구팀이 스스로 학습하고 오류를 수정할 수 있는 차세대 뉴로모픽 반도체 기반 초소형 컴퓨팅 칩을 개발했다고 17일 밝혔다. 연구팀이 개발한 이 컴퓨팅 칩의 특별한 점은 기존 뉴로모픽 소자에서 해결이 어려웠던 비이상적 특성에서 발생하는 오류를 스스로 학습하고 수정할 수 있다는 것이다. 예를 들어, 영상 스트림을 처리할 때 칩은 움직이는 물체를 배경에서 자동으로 분리하는 법을 학습하며 시간이 지날수록 이 작업을 더 잘 수행하게 된다. 이러한 자가 학습 능력은 실시간 영상 처리에서 이상적인 컴퓨터 시뮬레이션에 견줄 만한 정확도를 달성하며 입증됐다. 연구팀의 주요성과는 뇌와 유사한 구성 요소의 개발을 넘어, 신뢰성과 실용성을 모두 갖춘 시스템으로 완성한 것에 있다. 연구팀은 세계 최초로 즉각적인 환경 변화에 적응할 수 있는 멤리스터 기반 통합 시스템을 개발하며, 기존 기술의 한계를 극복하는 혁신적인 해결책을 제시했다. 이 혁신의 핵심에는 멤리스터(memristor)*라고 불리는 차세대 반도체 소자가 있다. 이 소자의 가변 저항 특성은 신경망의 시냅스 역할을 대체할 수 있게 되고, 이를 활용해 우리 뇌세포처럼 데이터 저장 및 연산을 동시에 수행할 수 있다. *멤리스터: 메모리(memory)와 저항(resistor)의 합성어로 두 단자 사이로 과거에 흐른 전하량과 방향에 따라 저항값이 결정되는 차세대 전기소자 연구팀은 저항 변화를 정밀하게 제어할 수 있는 고신뢰성 멤리스터를 설계하고, 자가 학습을 통해 복잡한 보정 과정을 배제한 효율적인 시스템을 개발했다. 이번 연구는 실시간 학습과 추론을 지원하는 차세대 뉴로모픽 반도체 기반 통합 시스템의 상용화 가능성을 실험적으로 검증했다는 점에서 중요한 의미를 가진다. 이 기술은 일상적인 기기에서 인공지능을 사용하는 방식을 혁신하여 AI 작업 처리를 위해 원격 클라우드 서버에 의존하지 않고 로컬에서 처리할 수 있게 되어, 더 빠르고 사생활 보호가 강화되며 에너지 효율성이 높아질 것이다. 이 기술 개발을 주도한 KAIST 정학천 연구원과 한승재 연구원은 “이 시스템은 책상과 자료 캐비닛을 오가며 일하는 대신 모든 것이 손이 닿는 곳에 있는 스마트 작업 공간과 같다. 이는 모든 것이 한 곳에서 처리돼 매우 효율적인 우리 뇌의 정보 처리 방식과 유사하다”고 설명했다. 전기및전자공학부 정학천 석박통합과정생과 한승재 석박사통합과정생이 제 1저자로 연구에 참여했으며 국제 학술지 `네이처 일렉트로닉스 (Nature Electronics)'에 2025년 1월 8일 자로 온라인 게재됐다. (논문 제목: Self-supervised video processing with self-calibration on an analogue computing platform based on a selector-less memristor array, https://doi.org/10.1038/s41928-024-01318-6) 이번 연구는 한국연구재단의 차세대지능형반도체기술개발사업, 우수신진연구사업, PIM인공지능반도체핵심기술개발사업, 정보통신기획평가원의 한국전자통신연구원연구개발지원사업의 지원을 받아 수행됐다.
2025.01.22 조회수 4765

34141 대전광역시 유성구 대학로 291 한국과학기술원(KAIST) T.042-350-2114 F.042-350-2210(2220)

Copyright (C) 2020, Korea Advanced Institute of Science and Technology, All Rights Reserved.