-
24시간 말하는 AI비서 가능성 여는 '스피치SSM' 개발
최근 음성 언어 모델(Spoken Language Model, SLM)은 텍스트 없이 인간의 음성을 학습해 음성의 언어적, 비언어적 정보를 이해 및 생성하는 기술로 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 각광받고 있다. 하지만 기존 모델은 장시간 콘텐츠 생성이 요구되는 팟캐스트, 오디오북, 음성비서 등에서 한계가 두드러졌는데, 우리 연구진이 이런 한계를 뛰어넘어, 시간 제약 없이 일관되고 자연스러운 음성 생성을 실현한 ‘스피치SSM’을 개발하는데 성공했다.
우리 대학 전기및전자공학부 노용만 교수 연구팀의 박세진 연구원(박사과정)이 장시간 음성 생성이 가능한 음성 언어 모델 ‘스피치SSM(SpeechSSM)’을 개발했다고 3일 밝혔다.
이번 연구는 국제 최고 권위 머신러닝 학회인 ICML(International Conference on Machine Learning) 2025에 전체 제출된 논문 중 약 1%만이 선정되는 구두 논문 발표에 확정돼 뛰어난 연구 역량을 입증할 뿐만 아니라 우리 대학의 인공지능 연구 능력이 세계 최고 수준임을 다시 한번 보여주는 계기가 될 전망이다.
음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리함으로써, 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질의 음성을 빠르게 생성할 수 있다는 점이 큰 강점이다.
그러나 기존 모델은 음성을 아주 세밀하게 잘게 쪼개서 아주 자세한 정보까지 담는 경우, ‘음성 토큰 해상도’가 높아지고 사용하는 메모리 소비도 증가하는 문제로 인해 장시간 음성의 의미적, 화자적 일관성을 유지하기 어려웠다.
연구팀은 이러한 문제를 해결하기 위해 하이브리드 상태공간 모델(Hybrid State-Space Model)을 사용한 음성 언어 모델인‘스피치SSM’를 개발해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있게 설계했다.
이 모델은 최근 정보에 집중하는 ‘어텐션 레이어(attention layer)’와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는 ‘순환 레이어(recurrent layer)’를 교차 배치한 ‘하이브리드 구조’를 통해 긴 시간 동안 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다. 또한, 메모리 사용량과 연산량이 입력 길이에 따라 급격히 증가하지 않아, 장시간의 음성을 안정적이고 효율적으로 학습하고 생성할 수 있다.
스피치SSM은 음성 데이터를 짧은 고정된 단위(윈도우)로 나눠 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들 수 있어 무한한 길이의 음성 시퀀스(unbounded speech sequence)를 효과적으로 처리할 수 있게 했다.
또한 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 ‘비자기회귀(Non-Autoregressive)’방식의 오디오 합성 모델(SoundStorm)을 사용해, 고품질의 음성을 빠르게 생성할 수 있게 했다.
기존은 10초 정도 짧은 음성 모델을 평가했지만, 연구팀은 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 ‘LibriSpeech-Long'을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다.
기존 음성 모델 평가 지표인 말이 문법적으로 맞는지 정도만 알려주는 PPL(Perplexity)에 비해, 연구팀은 시간이 지나면서도 내용이 잘 이어지는지 보는 'SC-L(semantic coherence over time)', 자연스럽게 들리는 정도를 시간 따라 보는 'N-MOS-T(naturalness mean opinion score over time)' 등 새로운 평가 지표들을 제안해 보다 효과적이고 정밀하게 평가했다.
새로운 평가를 통해 스피치SSM 음성 언어 모델로 생성된 음성은 긴 시간 생성에도 불구하고 초기 프롬프트에서 언급된 특정 인물이 지속적으로 등장하며, 맥락적으로 일관된 새로운 인물과 사건들이 자연스럽게 전개되는 모습을 확인했다. 이는 기존 모델들이 장시간 생성 시 쉽게 주제를 잃고 반복되는 현상을 보였던 것과 크게 대조적이다.
박세진 박사과정생은 “기존 음성 언어 모델은 장시간 생성에 한계가 있어, 실제 인간이 사용하도록 장시간 음성 생성이 가능한 음성 언어 모델을 개발하는 것이 목표였다”며 “이번 연구 성과를 통해 긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답할 수 있어, 다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”라고 밝혔다.
이 연구는 제1 저자인 우리 대학 박세진 박사과정 학생이 구글 딥마인드(Google DeepMind)와 협력해, ICML(국제 머신러닝 학회) 2025에서 7월 16일 구두 발표로 소개될 예정이다.
※ 논문제목: Long-Form Speech Generation with Spoken Language Models
※ DOI: 10.48550/arXiv.2412.18603
한편, 박세진 박사과정생은 비전, 음성, 언어를 통합하는 연구를 수행하며 CVPR(컴퓨터 비전 분야 최고 학회) 2024 하이라이트 논문 발표, 2024년 ACL(자연어 처리 분야 최고 학회)에서 우수논문상(Outstanding Paper Award) 수상 등을 통해 우수한 연구 역량을 입증한 바 있다.
[데모 페이지 링크]
https://google.github.io/tacotron/publications/speechssm/
2025.07.03
조회수 41
-
AI로 방사성 오염 '아이오딘' 제거용 최적 신소재 발굴
원자력 에너지 활용에 있어 방사성 폐기물 관리는 핵심적인 과제 중 하나다. 특히 방사성 ‘아이오딘(요오드)’는 반감기가 길고(I-129의 경우 1,570만 년), 이동성 및 생체 유독성이 높아 환경 및 인체에 심각한 위험을 초래할 수 있다. 한국 연구진이 인공지능을 활용해 아이오딘을 제거할 원자력 환경 정화용 신소재 발굴에 성공했다. 연구팀은 향후 방사성 오염 흡착용 분말부터 오염수 처리 필터까지 다양한 산학협력을 통해 상용화를 추진할 예정이다.
우리 대학 원자력및양자공학과 류호진 교수 연구팀이 한국화학연구원 디지털화학연구센터 노주환 박사가 협력하여, 인공지능을 활용해 방사성 오염 물질이 될 수 있는 아이오딘을 효과적으로 제거하는 신소재를 발굴하는 기술을 개발했다고 2일 밝혔다.
최근 보고에 따르면 방사능 오염 물질인 아이오딘이 수용액 환경에서 아이오딘산염(IO3-) 형태로 존재하는 것으로 밝혀졌으나, 기존의 은 기반 흡착제는 이에 대해 낮은 화학적 흡착력을 가져 비효율적이었다. 따라서 아이오딘산염을 효과적으로 제거할 수 있는 새로운 흡착제 신소재 개발이 시급한 실정이다.
류호진 교수 연구팀은 기계학습을 활용한 실험 전략을 통해 다양한 금속원소를 함유한 ‘이중층 수산화물(Layered Double Hydroxide, 이하 LDH)’이라는 화합물 중 최적의 아이오딘산염 흡착제를 발굴했다.
이번 연구에서 개발된 구리-크롬-철-알루미늄 기반의 다중금속 이중층 수산화물 Cu3(CrFeAl)은 아이오딘산염에 대해 90% 이상의 뛰어난 흡착 성능을 보였다. 이는 기존의 시행착오 실험 방식으로는 탐색이 어려운 방대한 물질 조성 공간을 인공지능 기반의 능동학습법을 통해 효율적으로 탐색해 얻어낸 성과다.
연구팀은 이중층 수산화물(이하 LDH)이 고엔트로피 재료와 같이 다양한 금속 조성을 가질 수 있고 음이온 흡착에 유리한 구조를 지녔다는 점에 주목했다. 그러나 다중금속 LDH의 경우 가능한 금속 조합이 너무 많아 기존의 실험 방식으로는 최적의 조합을 찾기 어려웠다.
이를 해결하기 위해 연구팀은 인공지능(기계학습)을 도입했다. 초기 24개의 2원계 및 96개의 3원계 LDH 실험 데이터로 학습을 시작해, 4원계 및 5원계 후보 물질로 탐색을 확장했다. 이 결과 전체 후보 물질 중 단 16%에 대해서만 실험을 수행하고도 아이오딘산염 제거에 최적인 신소재 물질을 찾아낼 수 있었다.
류호진 교수는 “인공지능을 활용하면 방대한 신소재 후보 물질 군에서 방사성 오염 제거용 물질을 효율적으로 찾아낼 가능성을 보여, 원자력 환경 정화용 신소재 개발에 필요한 연구를 가속화하는데 기여할 것으로 기대된다”고 말했다.
류 교수 연구팀은 개발된 분말 기술에 대한 국내 특허를 출원했으며 이를 기반으로 해외 특허 출원을 진행 중이다. 연구팀은 향후 방사성 오염 흡착용 분말의 다양한 사용 환경에서의 성능을 고도화하고, 오염수 처리 필터 개발 분야에서 산학 협력을 통한 상용화 방안을 추진할 예정이다.
우리 대학 신소재공학과를 졸업한 이수정 박사와 한국화학연구원 디지털화학연구센터 노주환 박사가 제1 저자로 참여한 이번 연구는 이번 연구 결과는 환경 분야 국제 저명 학술지인 ‘위험물질 저널(Journal of Hazardous Materials)'에 5월 26일 온라인 게재됐다.
※논문명: Discovery of multi-metal-layered double hydroxides for decontamination of iodate by machine learning-assisted experiments
※DOI: https://doi.org/10.1016/j.jhazmat.2025.138735
이번 연구는 과학기술정보통신부 한국연구재단의 원자력기초연구지원사업과 나노·소재기술개발사업의 지원으로 수행됐다.
2025.07.02
조회수 196
-
장내 미생물로 난치성 뇌종양 면역치료 효과 높인다
우리 몸의 면역세포인 T세포를 활성화시켜 암세포를 제거하도록 유도하는 첨단 치료법인 ‘면역항암제’는 가장 치명적인 뇌종양 ‘교모세포종(Glioblastoma)’에는 거의 반응하지 않고, 치료에 대한 저항성이 높아 단독 치료로는 효과가 매우 제한적이라는 한계가 있었다. 이에 우리 연구진이 장내 미생물과 그 대사산물을 활용해 뇌종양의 면역치료 효과를 높일 수 있는 새로운 치료 전략을 세계 최초로 입증했다. 향후 미생물을 기반으로 한 면역치료 보완제 개발에 대한 가능성도 보여줬다.
우리 대학 생명과학과 이흥규 교수 연구팀이 장내 미생물 생태계 변화에 주목해 교모세포종 면역치료의 효율을 크게 높이는 방법을 발굴하고 이를 입증했다고 1일 밝혔다.
연구팀은 교모세포종이 진행되면서 장내에서 중요한 아미노산인 ‘트립토판(tryptophan)’의 농도가 급격히 줄어들고, 이로 인해 장내 미생물 생태계가 변화한다는 점에 주목했다. 그리고 트립토판을 보충해 미생물 다양성을 회복시키면, 특정 유익한 균주가 면역세포 중 하나인 CD8 T세포를 활성화하고 종양 조직으로 다시 유도하는 역할을 한다는 사실을 밝혀냈다.
연구팀은 생쥐 교모세포종 모델을 통해, 트립토판을 보충하면 암을 공격하는 T세포(특히 CD8 T세포)의 반응이 향상되고, 이들이 림프절과 뇌 등 종양이 있는 부위로 더 많이 이동한다는 사실을 확인했다.
이 과정에서 장내에 존재하는 유익한 공생균인 ‘던카니엘라 두보시(Duncaniella dubosii)’가 핵심적인 역할을 한다는 점도 밝혀냈다. 해당 균주는 T세포가 몸 안에서 효과적으로 재분포하도록 도와줬고, 면역항암제(anti-PD-1)와 함께 사용할 때 생존율이 유의미하게 향상됐다.
또한, 장내 미생물이 전혀 없는 무균 생쥐에게 위 공생균을 단독으로 투입해도 교모세포종에 대한 생존율이 높아졌으며, 이는 이 균주가 트립토판을 활용해 장내 환경을 조절하고, 그 과정에서 생성되는 대사산물이 CD8 T세포의 암세포 공격 능력을 강화하기 때문임이 입증됐다.
이흥규 교수는 “이번 연구는 면역관문억제제가 효과를 보이지 않았던 난치성 뇌종양에서도, 장내 미생물을 활용한 병용 전략을 통해 치료 반응을 유의하게 높일 수 있음을 보여준 의미 있는 성과”라고 설명했다.
우리 대학 김현철 박사(現, 생명과학연구소 박사후연구원)가 제1 저자로 참여했고 연구 결과는 생명과학 분야 국제 학술지‘셀 리포츠(Cell Reports)’에 지난 6월 26 일자 온라인판에 게재됐다.
(논문명: Gut microbiota dysbiosis induced by brain tumor modulates the efficacy of immunotherapy, https://doi.org/10.1016/j.celrep.2025.115825)
한편, 이번 연구는 과학기술정보통신부와 한국연구재단이 지원하는 개인기초연구사업 및 바이오의료기술개발사업의 일환으로 수행됐다.
2025.07.01
조회수 309
-
기계공학과 윤국진 교수 연구팀, 세계 최고 권위 컴퓨터비전 국제학술대회 ICCV 2025에 논문 12편 채택
우리 대학 기계공학과 윤국진 교수 연구팀의 논문 12편이 세계 최고 권위 컴퓨터비전 국제 학술 대회 중 하나인 IEEE/CVF International Conference on Computer Vision 2025(ICCV 2025)에 채택되어, 연구팀의 독보적인 연구 역량을 다시 한번 국제적으로 인정받았다.
ICCV는 CVPR, ECCV와 함께 컴퓨터비전 및 인공지능 분야에서 가장 영향력 있는 국제 학술대회 중 하나로, 1987년부터 격년으로 개최되어 왔다. 이번 ICCV 2025에는 총 11,152편의 논문이 제출되었고, 이 중 2,698편이 채택되어 약 24.19%의 낮은 채택률을 기록하였다. 학술대회에 제출할 수 있는 논문 편수에 대한 제한이 있음에도 불구하고 단일 연구실에서 12편의 논문이 동시 채택되는 것은 매우 드문 성과다.
윤국진 교수 연구팀은 학습 기반의 시각 지능 구현을 목표로 연구를 진행하고 있으며, 이번에 발표된 12편의 논문들은 3D 객체 탐지 및 재구성, 동작 예측 및 계획, 악천후나 모션 블러와 같은 극한 환경에서의 영상 인식 및 개선, 테스트 시점 적응 및 멀티태스크 학습, 4D 맵을 활용한 재구성과 같은 컴퓨터비전 분야의 핵심 주제들에 대한 논문들이다.
특히 연구팀은 지난해 CVPR 2024와 ECCV 2024에서도 각각 9편과 12편의 논문을 발표하여 학계의 주목을 받은 바 있는데, 이번 ICCV 2025에서의 성과를 통해 전 세계 컴퓨터 비전 분야의 선두 연구실로서 입지를 더욱 확고히 했다. 연구팀은 앞으로도 도전적인 연구를 이어가며 학문적·기술적 한계를 확장해 나갈 계획이다.
ICCV 2025는 오는 10월 19일부터 23일까지 미국 하와이 호놀룰루에서 개최될 예정이다.
2025.06.30
조회수 379
-
‘슝’ 스스로 움직이는 생명체 세포로봇 개발
현재 전 세계적으로 마이크로 및 나노급의 작은 입자 기반의 비생명체 자가 추진 로봇 기술은 활발하게 연구되고 있는 반면에, 세포와 같은 생명체 구성 요소를 직접 활용한 세포로봇 연구는 아직 초기 단계에 머물러 있다. 우리 연구진이 세포 기반 시스템의 자율적으로 이동하는 세포로봇을 개발하는데 성공했다. 향후 정밀 약물 전달이나 차세대 세포 기반 치료법의 원천기술로 활용될 수 있을 것으로 기대된다.
우리 대학 화학과 최인성 교수 연구팀이 외부 동력 장치나 복잡한 기계 구조 없이, 생체 부산물인 ‘요소(urea)’*를 연료로 사용하는 자가 추진 세포로봇을 개발했다고 30일 밝혔다.
*요소(urea): 사람을 포함한 대부분의 동물 체내에서 단백질을 분해하면서 생기는 노폐물로 생명체 안에서는 단백질 대사 과정에서 암모니아를 독성이 낮은 형태로 전환하여 배출하는 중요한 역할을 함
연구팀이 구현한 세포로봇은 방향성을 갖고 스스로 이동할 수 있으며, 원하는 물질을 운반하거나 주변 환경 제어 기능을 탑재할 수 있는 다기능성 플랫폼으로 설계됐다.
연구팀은 쉽고 안정적으로 얻을 수 있는 생명체이면서 부산물로 생성된 에탄올 활용 가능성이 있고, 인공적인 복잡한 외부 장치 없이 생명체 스스로 만들어내는 물질을 활용할 수 있는 ‘효모’에 주목했다.
제빵과 막걸리 발효에 사용되는 효모(이스트, yeast)는 포도당을 분해해 에너지를 얻는 대사 과정에서 알코올(에탄올)을 부산물로 생성하는데, 연구팀은 이때 생성된 에탄올을 활용해 효모 표면에 생체친화적인 방식으로 나노 껍질을 형성할 수 있는 원천기술을 개발했다.
이를 위해, 알코올산화효소(AOx)와 겨자무과산화효소(HRP)로 구성된 효소 시스템을 도입했다. 이 효소 시스템은 효모의 포도당 분해 반응과 연계된 연쇄적 효소 반응을 유도하며, 그 결과로 멜라닌 계열의 나노껍질이 효모 표면에 형성된다.
특히, 이번에 개발된 화학적 방법론은 효모가 성장하고 분열하는 동안에도 나노껍질 형성이 지속적으로 일어나도록 설계돼 있어서, 세포의 형태 변화에 따라 비대칭적인 세포-껍질 구조가 자연스럽게 생성된다.
예를 들어, 분열 중인 세포 전체를 감싸는 껍질이 형성되기도 하지만, 모세포 부분에는 껍질이 생성되고 딸세포 부분에는 형성되지 않는 구조도 만들어진다.
연구팀은 세포를 감싸는 나노껍질에 우레아제(urease)*를 부착하고 세포로봇의 움직임을 관찰했다. 우레아제는 요소를 분해하는 촉매 역할을 하며 세포로봇이 스스로 움직일 수 있도록 구동력을 만들어내는 핵심 역할을 수행하며 비대칭 구조를 가진 세포로봇이 보다 명확한 방향성을 갖고 자가 추진하는 현상을 확인했다.
*우레아제(urease): 요소를 분해해 암모니아와 이산화탄소를 만드는 효소
이번에 개발된 세포로봇은 세포 주위에 존재하는 물질만으로 자가 추진이 가능하고, 자석이나 레이저 등 복잡한 외부 제어 장치에 의존하지 않아 구동 메커니즘이 훨씬 간단하고 생체친화적이다. 또한, 나노껍질에 다양한 효소를 화학적으로 접합할 수 있어, 다양한 생체 물질을 연료로 활용하는 세포로봇의 확장 개발도 가능하다.
이번 연구의 제1 저자인 화학과 김나영 박사과정은 “자가 추진 세포로봇은 스스로 환경을 감지하고 반응하며 움직이는 능력을 지닌 새로운 개념의 플랫폼으로, 향후 암세포 표적 치료나 정밀 약물전달시스템 등에서 중요한 역할을 할 수 있을 것”이라고 말했다.
이번 연구는 국제 학술지 ‘사이언스 어드밴시스(Science Advances)’에 지난 6월 25일 오후 2시(미국 동부시각) 온라인판에 게재됐다.
※ 논문명 : Autonomous Chemo-Metabolic Construction of Anisotropic Cell-in-Shell Nanobiohybrids in Enzyme-Powered Cell Microrobots; 국문 번역 : 효소 구동 세포 마이크로로봇 구축에서의 자율적인 화학-대사 반응을 통해 형성된 비등방성 세포내껍질 나노바이오하이브리드
※ DOI: https://doi.org/10.1126/sciadv.adu5451
한편, 이번 연구는 한국연구재단 기초연구사업 중견연구과제(제목: 세포대사 연계형 단일세포나노피포화)의 지원을 받아 수행됐다.
2025.06.30
조회수 415
-
이산화탄소만 잡아내는 유망 소재를 AI로 쉽게 찾는다
기후 위기를 막기 위해 이미 배출된 이산화탄소를 적극적으로 줄이는 것이 필수적이며, 이를 위해 공기 중 이산화탄소만 직접 포집하는 기술(Direct Air Capture, 이하 DAC)이 주목받고 있다. 하지만 공기 중에 존재하는 수증기(H₂O)로 인해 이산화탄소만 효과적으로 포집하는 것이 쉽지 않다. 이 기술의 핵심 소재로 연구되는 금속–유기 구조체(Metal-Organic Frameworks, 이하 MOF)를 활용해 우리 연구진이 AI 기반 기계학습 기술을 적용, MOF 중에서 가장 유망한 탄소 포집 후보 소재들을 찾아내는 데 성공했다.
우리 대학 생명화학공학과 김지한 교수 연구팀이 임페리얼 칼리지 런던(Imperial College London) 연구팀과 공동 연구를 통해 대기 중 이산화탄소 포집에 적합한 MOF를 빠르고 정확하게 선별할 수 있는 기계학습 기반 시뮬레이션 기법을 개발했다고 29일 밝혔다.
복잡한 구조와 분자 간 상호작용의 예측 한계로 인해 고성능 소재를 찾는 데 큰 제약을 극복하기 위해, 연구팀은 MOF와 이산화탄소(CO2), 물(H2O) 사이의 상호작용을 정밀하게 예측할 수 있는 기계학습(머신러닝) 기반 역장(Machine Learning Force Field, MLFF)을 개발하고, 이를 통해 양자역학 수준의 예측 정확도를 유지하면서도 기존보다 월등히 빠른 속도로 MOF 소재들의 흡착 물성을 계산할 수 있도록 했다.
연구팀은 개발된 시스템을 활용해 8,000여 개의 실험적으로 합성된 MOF 구조를 대규모 스크리닝한 결과, 100개 이상의 유망한 탄소 포집 후보 소재를 발굴했다. 특히 기존의 고전 역장 기반 시뮬레이션으로는 확인되지 않았던 새로운 후보 소재들을 제시했으며, MOF의 화학 구조와 흡착 성능 간의 상관관계를 분석해 DAC용 소재 설계에 유용한 7가지 핵심 화학적 특징도 함께 제안했다.
이번 연구는 MOF–CO2 및 MOF-H2O 간 상호작용을 정밀하게 예측함으로써, DAC 분야의 소재 설계 및 시뮬레이션 기술을 크게 향상한 사례로 평가된다.
우리 대학 생명화학공학과 임윤성 박사과정과 박현수 박사가 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 `매터 (Matter)'에 지난 6월 12일 게재됐다.
※논문명: Accelerating CO2 direct air capture screening for metal-organic frameworks with a transferable machine learning force field
※DOI: 10.1016/j.matt.2025.102203
한편, 이번 연구는 Saudi Aramco-KAIST CO2 Management Center와 과학기술정보통신부의 글로벌 C.L.E.A.N. 사업의 지원을 받아 수행됐다.
2025.06.30
조회수 228
-
폐타이어를 고무·나일론 원료로 전환 성공
전 세계적으로 매년 수십억 개의 타이어가 폐기되며, 이는 심각한 환경오염의 주요 원인 중 하나로 지목되고 있다. 우리 연구진이 폐타이어를 고무나 나일론 섬유 원료로 쓰이는 고부가가치 화학 원료인 고순도의 고리형 알켄으로 선택적 전환하는 데 성공했다. 이는 폐타이어 재활용 분야의 새로운 전환점으로 평가된다.
우리 대학 화학과 홍순혁 교수 연구팀이 이중 촉매 기반 연속 반응 시스템을 개발해 폐타이어 문제를 효과적으로 해결했다고 26일 밝혔다.
폐타이어는 합성고무와 천연고무의 복합체로 구성되며, 실리카, 카본블랙, 산화방지제 등의 첨가제를 포함해 물리적 강도와 내구성이 극대화되어 있다. 특히 가황 공정을 통해 고무 사슬 간의 가교가 형성돼 열과 압력에 강한 구조를 갖게 되는데, 이는 폐타이어의 화학적 재활용을 어렵게 만드는 주요 원인 중 하나다.
그동안 폐타이어의 재활용은 주로 열분해 방식이나 물리적 분쇄 재활용에 의존해 왔다. 열분해 방식은 350~800°C의 고온 환경에서 고분자 사슬을 분해해 연료유로 전환하는 기술이나, 높은 에너지 소비, 낮은 선택성, 그리고 저품질의 탄화수소 혼합물 생성이라는 한계가 명확히 존재한다.
연구팀은 이런 문제를 해결하고자 두 가지 촉매를 활용해 폐고무를 유용한 화학물질로 바꾸는 방법을 개발하였다. 첫 번째 촉매는 고무 분자 안의 결합 구조를 바꿔 분해가 잘 되도록 돕고, 두 번째 촉매는 고리를 닫는 반응을 통해 고리 모양의 화합물을 만들어낸다.
이 과정은 최대 92%의 높은 선택성과 82%의 수율을 보여준다. 만들어진 고리형 펜텐은 다시 고무로 재활용할 수 있고, 고리형 헥센은 나일론 섬유의 원료로 쓰이는 등 산업적으로 매우 가치가 높다.
연구팀은 개발한 시스템을 실제 폐기물로 버려진 폐타이어에 적용해, 고순도의 고리형 알켄으로 선택적 전환하는 데 성공했다. 이는 기존 열분해 방식과 달리 저온의 정밀 촉매 반응을 통해 고부가가치 화학 원료를 생산할 수 있다는 점에서 폐타이어 재활용 분야의 새로운 전환점으로 평가된다.
또한, 이번 기술은 다양한 종류의 합성고무와 폐고무에 폭넓게 적용될 수 있어, 자원 순환형 경제 실현에 기여할 수 있는 핵심 원천기술로 주목받고 있다.
홍순혁 교수는 “이번 연구는 폐타이어의 화학적 재활용에 대한 혁신적인 해법을 제시한 것이며, 경제성을 높이기 위해 차세대 고효율 촉매 개발, 상용화를 위한 기반을 마련해 나갈 예정이다”며, “기초화학을 통해 폐플라스틱 문제 해결에 기여하는 것이 목표”라고 밝혔다.
우리 대학 화학과 박범순, 조경일, 최경민 연구원이 참여한 이번 연구는 한국연구재단의 지원으로 수행됐으며, 국제 저명 학술지 ‘Chem’에 6월 18일 자로 온라인 게재됐다.
※논문명: Catalytic and Selective Chemical Recycling of Post-Consumer Rubbers into Cycloalkenes
※DOI: 10.1016/j.chempr.2025.102625
2025.06.26
조회수 594
-
軍 전투원, 신소재 입고 개인 맞춤형 훈련시대 연다
기존 군 훈련은 정형화된 방식에 의존하는 경우가 많아 전투원 개인의 특성이나 전투 상황에 맞춘 최적화된 훈련 제공에 한계가 있었다. 이에 우리 연구진이 전자섬유 플랫폼을 개발해 전투원 개개인의 특성과 전투 국면을 반영할 수 있는 원천기술을 확보했다. 이 기술은 전장에서 활용할 수 있을 만큼 튼튼함이 입증됐고, 많은 병력에게 보급할 수 있을 정도의 경제성도 갖췄다.
우리 대학 신소재공학과 스티브 박 교수 연구팀이 섬유 위에 전자회로를 `그려 넣는' 혁신적인 기술을 통해 유연하고 착용 가능한 전자 섬유(E-textile) 플랫폼을 개발했다고 25일 밝혔다.
연구팀이 개발한 웨어러블 전자 섬유 플랫폼은 3D 프린팅 기술과 신소재공학적 설계를 결합해 유연하면서도 내구성이 뛰어난 센서와 전극을 섬유에 직접 인쇄했다. 이를 통해 전투원 개개인의 정밀한 움직임 및 인체 데이터를 수집하고, 이를 기반으로 맞춤형 훈련 모델을 제시할 수 있게 됐다.
기존 전자 섬유 제작 방식은 복잡하거나 개인별 맞춤형 제작에 한계가 있었다. 연구팀은 이를 극복하고자 `직접 잉크 쓰기(Direct Ink Writing, DIW)' 3D 프린팅이라는 적층 방식 기술을 도입했다.
이 기술은 센서와 전극의 기능을 하는 특수 잉크를 섬유 기판 위에 원하는 패턴으로 직접 분사해 인쇄하는 방식이다. 이를 통해 복잡한 마스크 제작 과정 없이도 다양한 디자인을 유연하게 구현할 수 있게 됐다. 이는 수십만 명에 달하는 군 병력에 손쉽게 보급할 수 있는 효과적인 기술로 기대된다.
해당 기술의 핵심은 신소재공학적 설계에 기반한 고성능 기능성 잉크 개발이다. 연구팀은 유연성을 가진 스티렌-부타디엔-스티렌(Styrene-butadiene-styrene, SBS) 고분자와 전도성을 부여하는 다중 벽 탄소나노튜브(Multi-walled carbon nanotube,MWCNT)를 조합해, 최대 102% 늘어나면서도, 10,000번의 반복적인 테스트에서도 안정적인 성능을 유지하는 인장/굽힘 센서 잉크를 개발했다. 이는 전투원의 격렬한 움직임 속에서도 정확한 데이터를 꾸준히 얻을 수 있음을 의미한다.
또한, 섬유의 위아래 층을 전기적으로 연결하는 `상호연결 전극(Interconnect electrode)' 구현에도 신소재 기술이 적용됐다. 은(Ag) 플레이크와 단단한 폴리스티렌(Polystyrene) 고분자를 조합한 전극 잉크를 개발, 섬유 속으로 잉크가 스며드는 정도(Impregnation level)를 정밀하게 제어해 섬유의 양면 또는 다층 구조를 효과적으로 연결하는 기술을 확보했다. 이를 통해 센서와 전극이 집적된 다층 구조의 웨어러블 전자 시스템 제작이 가능하다.
연구팀은 실제 인체 움직임 모니터링 실험을 통해 개발된 플랫폼의 성능을 입증했다. 연구팀은 개발된 전자 섬유를 옷의 주요 관절 부위(어깨, 팔꿈치, 무릎)에 프린팅하여 달리기, 팔 벌려 높이뛰기, 팔굽혀 펴기 등 다양한 운동 시의 움직임과 자세 변화를 실시간으로 측정했다.
또한, 스마트 마스크를 활용해 호흡 패턴을 모니터링하거나, 장갑에 여러 센서 및 전극을 프린팅해 기계학습을 통한 물체 인식 및 복합적인 촉감 정보를 인지하는 응용 가능성도 시연했다. 이러한 결과는 개발된 전자 섬유 플랫폼이 전투원의 움직임 역학을 정밀하게 파악하는 데 효과적임을 보여준다.
이번 연구는 최첨단 신소재 기술이 국방 분야 첨단화에 기여할 수 있음을 보여주는 중요한 사례다. 이번 연구에 참여한 박규순 육군 소령은 군사적 활용이나 실 보급을 위한 경제성 등의 요구되는 목표들을 연구설계 시부터 고려했다.
박 소령은 "현재 우리 군은 인구절벽으로 인한 병력자원의 감소와 과학기술의 발전으로 위기이자 기회를 마주하고 있다. 또한, 전장에서의 생명 존중이 큰 이슈로 떠오르고 있다. 해당 연구는 병과/직책별, 전투의 유형에 따른 맞춤식 훈련을 제공할 수 있는 원천기술을 확보해 우리 장병들의 전투력을 향상하고 생존성을 보장하기 위한 것이다ˮ 라고 전했다.
이어, “이번 연구가 과학적인 기여와 군 활용성의 두 마리 토끼를 모두 잡은 사례로 평가받길 기대한다”라고 밝혔다.
우리 대학 신소재공학과 박규순 박사과정(육군 소령)이 제1 저자로 참여하고 스티브 박 교수가 지도한 이번 연구는 전기·전자/재료공학 분야 국제 학술지인 `npj Flexible Electronics (JCR 분야 상위 1.8%)' 에 2025년 5월 27일 자로 출판됐다.
※논문명 : Fabrication of Multifunctional Wearable Interconnect E-textile Platform Using Direct Ink Writing (DIW) 3D Printing
※DOI: https://doi.org/10.1038/s41528-025-00414-7
한편 이번 연구는 산업통상자원부 및 한국연구재단의 지원을 받아 수행됐다.
2025.06.25
조회수 722
-
와이파이보다 100배 빠른‘라이파이’속도·보안 다 잡았다
라이파이(Li-Fi)는 LED 불빛처럼 눈에 보이는 빛인 가시광선 대역(400~800 THz)을 활용한 무선통신 기술로, 기존 와이파이(Wi-Fi)보다 최대 100배 빠른 속도(최대 224Gbps)를 제공한다. 사용할 수 있는 주파수 할당의 제약이 없고 전파 혼신 문제도 적지만, 누구나 접근이 가능해서 보안에는 상대적으로 취약하다. 한국 연구진이 기존 광통신 소자의 한계를 뛰어넘어 송신 속도와 보안을 동시에 향상시킬 수 있는 라이파이의 새로운 플랫폼을 제시했다.
우리 대학 신소재공학과 조힘찬 교수 연구팀이 국가과학기술연구회(NST, 이사장 김영식) 산하 한국표준과학연구원(KRISS, 원장 이호성) 임경근 박사와 협력해, 차세대 초고속 데이터 통신으로 주목받는 ‘라이파이(Li-Fi)’ 활용을 위한 ‘온-디바이스 암호화 광통신 소자’ 기술을 개발했다고 24일 밝혔다.
조힘찬 교수팀은 친환경 양자점(독성이 적고 지속 가능한 소재)을 이용해 고효율 발광 트라이오드 소자를 만들었다. 연구팀이 개발한 소자는 전기장을 이용해 빛을 발생시키는 장치이다. 특히, ‘투과 전극에 존재하는 아주 작은 구멍(핀홀)’ 영역에 전기장이 집중되고 전극 너머로 투과되는데, 이 소자는 이를 이용하여 두 가지 입력 데이터를 동시에 처리할 수 있다.
이 원리를 이용해 연구팀은 ‘온-디바이스 암호화 광송신 소자’라는 기술을 개발했다. 이 기술의 핵심은 기기 자체에서 정보를 빛으로 바꾸면서 동시에 암호화까지 한다는 점이다. 즉, 복잡한 별도의 장비 없이도 보안이 강화된 데이터 전송이 가능하다.
외부양자효율(EQE)은 전기를 얼마나 효율적으로 빛으로 변환하는지를 나타내는 지표로, 상용화를 위한 기준은 일반적으로 약 20% 수준이다. 이번에 개발된 소자는 17.4%의 EQE를 기록했으며, 휘도(luminance) 또한 스마트폰 OLED 화면의 최대 밝기인 2,000nit를 크게 웃도는 29,000nit로, 10배 이상의 높은 밝기를 구현했다.
또한, 연구팀은 이 소자가 어떻게 정보를 빛으로 바꾸는지를 더 정확히 이해하기 위해, ‘과도 전계 발광 분석’이라는 방법을 사용하여, 아주 짧은 시간(수백 나노초 = 10억 분의 1초 단위) 동안 전압을 순간적으로 인가했을 때, 소자에서 발생하는 발광 특성을 분석했다. 이 분석을 통해 수백 나노초 단위에서 소자 내 전하들의 이동을 분석해 단일 소자 내에서 구현되는 이중채널 광변조의 작동 메커니즘을 규명했다.
KAIST 조힘찬 교수는 “이번 연구는 기존의 광통신 소자의 한계를 뛰어넘어 송신 속도를 높이면서도 보안능력을 향상할 수 있는 새로운 통신 플랫폼을 제시했다”라고 언급했다.
이어 “추가 장비 없이도 보안을 강화하면서, 암호화와 송신을 동시에 구현하는 이번 기술은 향후 보안이 중요한 다양한 분야에서 폭넓게 응용될 수 있을 것”이라고 덧붙였다.
KAIST 신소재공학과 신승민 박사과정이 제1 저자로 참여하고, 조힘찬 교수, KRISS 임경근 박사가 공동 교신 저자로 참여한 이번 연구는 국제학술지 `어드밴스드 머터리얼즈(Advanced Materials)'에 5월 30일 자 출판됐으며, inside front cover 논문으로 선정됐다.
※ 논문명: High-Efficiency Quantum Dot Permeable electrode Light-Emitting Triodes for Visible-Light Communications and On-Device Data Encryption
※ DOI: https://doi.org/10.1002/adma.202503189
한편, 이번 연구는 한국연구재단, 국가과학기술연구회(NST) 및 한국산업기술진흥원의 지원을 받아 수행됐다.
2025.06.24
조회수 910
-
AI가 여론 조작? 한국어 'AI 생성 댓글' 탐지 기술 개발
생성형 AI 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 이에 따른 AI 생성글 탐지 기술도 개발되었는데 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼, 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠다. 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발해서 화제다.
우리 대학 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.
최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다. OpenAI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이며, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능할 정도다. 공개 LLM은 자체 GPU 인프라만 갖추면 사실상 무상으로도 대량의 댓글 생성을 수행할 수 있다.
연구팀은 AI 생성 댓글과 사람 작성 댓글을 사람이 구별할 수 있는지 실험했다. 총 210개의 댓글을 평가한 결과, AI 생성 댓글의 67%를 사람이 작성한 것으로 착각했고, 실제 사람 작성 댓글도 73%만 정확히 구분해냈다. 즉, 사람조차 AI 생성 댓글을 정확히 구별하기 어려운 수준에 이르렀다는 의미다. AI 생성 댓글은 오히려 기사 맥락 관련성(95% vs 87%), 문장 유창성(71% vs 45%), 편향성 인식(33% vs 50%)에서 사람 작성 댓글보다 높은 평가를 받았다.
그동안 AI 생성글 탐지 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발되어 한국어의 짧은 댓글에는 적용이 어려웠다. 짧은 댓글은 통계적 특징이 불충분하고, 이모지·비속어·반복 문자 등 비정형 구어 표현이 많아 기존 탐지 모델이 효과적으로 작동하지 않는다. 또한, 현실적인 한국어 AI 생성 댓글 데이터셋이 부족하고, 기존의 단순한 프롬프팅 방식으로는 다양하고 실제적인 댓글을 생성하는 데 한계가 있었다.
이에 연구팀은 ▲14종의 다양한 LLM 활용 ▲자연스러움 강화 ▲세밀한 감정 제어 ▲참조자료를 통한 증강 생성의 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발해, 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축하고 이 중 일부를 벤치마크 데이터셋으로 공개했다. 또 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인했다.
예를 들어, AI는 "것 같다", "에 대해" 등 형식적 표현과 높은 접속어 사용률을 보였고, 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다.
특수문자 사용에서도 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음(ㅋ, ㅠ, ㅜ 등)이나 특수 기호(ㆍ, ♡, ★, • 등) 등 문화적 특수성이 담긴 다양한 문자를 활용했다.
특히, 서식 문자(줄바꿈, 여러 칸 띄어쓰기 등) 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만, AI 생성 댓글은 단 1%만 사용했다. 반복 문자(예: ㅋㅋㅋㅋ, ㅎㅎㅎㅎ 등) 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 훨씬 높았다.
XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 줄바꿈, 공백 등 서식 문자를 변환하고, 반복 문자 패턴을 기계가 이해할 수 있도록 변환하는 방식이 적용됐다. 또 각 LLM의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계됐다.
이러한 최적화로 XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰으며, 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.
고우영 선임연구원은 "이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성 모델까지 식별할 수 있는 세계 최초 기술"이라며 "AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다"고 강조했다.
연구팀은 XDAC의 탐지 기술이 단순 판별을 넘어 심리적 억제 장치로도 작용할 수 있다고 설명했다. 마치 음주단속, 마약 검사, CCTV 설치 등이 범죄 억제 효과를 가지듯, 정밀 탐지 기술의 존재 자체가 AI 악용 시도를 줄일 수 있다는 것이다.
XDAC는 플랫폼 사업자가 의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용될 수 있으며, 향후 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장 가능성이 크다.
이번 연구는 설명가능 인공지능(XAI) 기반 탐지 프레임워크를 제안한 것이 핵심이며, 인공지능 자연어처리 분야 최고 권위 학술대회인 7월 27일부터 개최되는 'ACL 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다.
※논문 제목: XDAC: XAI-Driven Detection and Attribution of LLM-Generated News Comments in Korean
※논문원본: https://github.com/airobotlab/XDAC/blob/main/paper/250611_XDAC_ACL2025_camera_ready.pdf
이번 연구는 우리 대학 김용대 교수의 지도 아래 국보연 소속이자 우리 대학 박사과정인 고우영 선임연구원이 제1 저자로 참여했으며, 성균관대학교 김형식 교수와 우리 대학 오혜연 교수가 공동 연구자로 참여했다.
2025.06.24
조회수 1489
-
가벼운 숨결·압력·소리까지 감지, 맞춤형 촉각 센서 개발
로봇이 물체를 잡을 때나, 의료기기가 몸의 맥박을 감지할 때 촉각 센서는 손끝처럼 ‘눌림’을 느끼는 기술이다. 기존 센서들은 반응이 느리거나 여러 번 쓰면 정확도가 떨어지는 단점이 있었는데, 한국 연구진이 가벼운 숨결, 압력, 소리까지 정확하고 빠르게 감지할 수 있어, 일상적인 움직임부터 의료용 진단까지 폭넓게 사용할 수 있는 센서를 개발하는데 성공했다.
우리 대학 기계공학과 박인규 교수 연구팀이 국가과학기술연구회(NST, 이사장 김영식) 산하 한국전자통신연구원(ETRI, 원장 방승찬)과의 공동연구를 통해 기존 촉각 센서 기술의 구조적 한계를 극복한 혁신적 기술을 개발했다고 23일 밝혔다.
이번 공동연구의 핵심은 ‘열성형 기반 3차원 전자 구조(Thermoformed 3D Electronics, T3DE)’를 적용해 유연성과 정밀성, 반복 내구성을 동시에 확보한 맞춤형 촉각 센서를 구현한 것이다.
특히, 소프트 엘라스토머(고무, 실리콘 등 쭉 늘렸다가 놓으면 다시 원래 모양으로 돌아오는 재료) 기반 센서가 갖는 느린 응답속도, 높은 히스테리시스*, 크립(오랫동안 힘을 가했을 때 재료가 천천히 변형되는 현상) 오차 등 구조적 문제를 극복하면서도 다양한 환경에서 정밀하게 작동하는 플랫폼으로 주목받고 있다.
* 히스테리시스(Hysteresis): 한 번 받았던 힘이나 변화가 기억처럼 남아서, 똑같은 자극을 주더라도 항상 같은 결과가 나오지 않는 현상
T3DE 센서는 2차원 필름 위에 정밀하게 전극을 형성한 후, 열과 압력을 가해 3차원 구조로 성형하는 과정을 통해 제작된다. 특히 센서 상부의 전극과 지지 다리 구조는 목적에 따라 기계적 물성을 조절할 수 있도록 설계되어 있으며, 지지 다리의 두께, 길이, 개수 등 미세한 구조 매개변수를 조정함으로써 센서의 영률(Young’s modulus)*을 10Pa에서 1MPa까지 폭넓게 설정할 수 있다. 이 수치는 피부, 근육, 힘줄 등의 생체조직과 유사한 수준으로, 실제 생체 인터페이스용 센서로도 유용하다.
* 영률(Young’s modulus): 재료의 강성을 나타내는 지표로, 이번 연구에서는 다양한 생체조직과 일치하는 수준까지 조절 가능함
이번에 개발된 T3DE 센서는 공기를 유전체로 활용해 전력 소비를 줄이는 동시에, 민감도, 응답속도, 온도 안정성, 반복 정밀도 측면에서도 우수한 성능을 보였다.
실험 결과, 해당 센서는 △민감도 5,884 kPa⁻¹ △응답속도 0.1ms(1,000분의 1초보다 짧은 시간) △히스테리시스 0.5% 이하 △5,000회 반복 측정에서도 정밀도 99.9% 이상을 유지하는 내구성을 입증했다.
연구팀은 이 센서를 활용해 고해상도 40×70 배열하여, 총 2,800개의 센서를 촘촘히 구성, 운동 중 발바닥의 압력 분포를 실시간 시각화하고, 손목 맥박 측정을 통한 혈관 건강 상태 평가 가능성도 확인했다. 또한, 상용 음향 센서 수준의 소리 감지 실험에서도 성공적인 결과를 얻었다. 즉, 이 센서는 발바닥 압력, 맥박, 소리까지 매우 정확하고 빠르게 측정할 수 있어서 운동, 건강, 소리 감지 등 다양한 분야에 활용될 수 있다.
T3DE 기술은 증강현실(AR) 기반 외과 수술 훈련 시스템에도 적용됐다. 각 센서 요소마다 서로 다른 영률을 부여해 실제 생체조직과 유사한 강성을 구현했으며, 수술 절개 시 가해지는 압력 강도에 따라 시각·촉각 피드백을 동시에 제공하고, 너무 깊이 베거나, 위험한 부위를 건드리면 실시간 위험 경고 기능까지 갖춘 시스템이 구현되었다. 이는 의료 교육의 몰입도와 정확성을 획기적으로 향상할 수 있는 기술로 평가된다.
우리 대학 박인규 교수는 “이 센서는 설계 단계에서부터 정밀하게 조절할 수 있어 다양한 환경에서도 안정적으로 작동한다”며, “일상생활은 물론 의료, 재활, 가상현실 등 다양한 분야에서 쓸 수 있을 것”이라고 밝혔다.
본 연구는 ETRI 최중락 박사, KAIST 한찬규 석사, 이돈호 박사과정이 공동 제1저자로 참여했으며, 박인규 교수가 전체 연구를 총괄했다. 연구 결과는 세계적 권위의 학술지 ‘사이언스 어드밴시스(Science Advances)’ 2025년 5월호에 게재됐으며, 해당 논문은 사이언스 어드밴시스 공식 SNS 채널(Facebook, Twitter)을 통해 전 세계에 소개되기도 했다.
※ 논문명: Thermoforming 2D films into 3D electronics for high-performance, customizable tactile sensing
※ DOI: 10.1126/sciadv.adv0057
이번 연구는 산업통상자원부, 한국연구재단, 한국산업기술평가관리원의 지원을 받아 수행됐다.
2025.06.23
조회수 816
-
‘뻔하지 않은 창의적인 의자’그리는 AI 기술 개발
최근 텍스트 기반 이미지 생성 모델은 자연어로 제공된 설명만으로도 고해상도·고품질 이미지를 자동 생성할 수 있다. 하지만, 대표적인 예인 스테이블 디퓨전(Stable Diffusion) 모델에서 ‘창의적인’이라는 텍스트를 입력했을 경우, 창의적인 이미지 생성은 아직은 제한적인 수준이다. KAIST 연구진이 스테이블 디퓨전(Stable Diffusion) 등 텍스트 기반 이미지 생성 모델에 별도 학습 없이 창의성을 강화할 수 있는 기술을 개발해, 예컨대 뻔하지 않은 창의적인 의자 디자인도 인공지능이 스스로 그려낼 수 있게 됐다.
우리 대학 김재철AI대학원 최재식 교수 연구팀이 네이버(NAVER) AI Lab과 공동 연구를 통해, 추가적 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다.
최 교수 연구팀은 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 또한, 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견하고, 특징 맵을 주파수 영역으로 변환 후, 높은 주파수 영역에 해당하는 부분의 값을 증폭하면 노이즈나 작게 조각난 색깔 패턴의 형태를 유발하는 것을 확인했다. 이에 따라, 연구팀은 얕은 블록의 낮은 주파수 영역을 증폭함으로써 효과적으로 창의적 생성을 강화할 수 있음을 보였다.
연구팀은 창의성을 정의하는 두 가지 핵심 요소인 독창성과 유용성을 모두 고려해, 생성 모델 내부의 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘을 제시했다.
개발된 알고리즘을 통해 사전 학습된 스테이블 디퓨전 모델의 내부 특징 맵을 적절히 증폭해 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화할 수 있었다.
연구팀은 개발된 알고리즘을 사용하면 기존 모델 대비 더욱 참신하면서도 유용성이 크게 저하되지 않은 이미지를 생성할 수 있음을 다양한 측정치를 활용해 정량적으로 입증했다.
특히, 스테이블 디퓨전 XL(SDXL) 모델의 이미지 생성 속도를 대폭 향상하기 위해 개발된 SDXL-Turbo 모델에서 발생하는 모드 붕괴 문제를 완화함으로써 이미지 다양성이 증가한 것을 확인했다. 나아가, 사용자 연구를 통해 사람이 직접 평가했을 때도 기존 방법에 비해 유용성 대비 참신성이 크게 향상됨을 입증했다.
공동 제1 저자인 KAIST 한지연, 권다희 박사과정은 "생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론ˮ이라며 "학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있음을 보였다ˮ 라고 말했다.
이어 “이번 연구는 기존 학습된 모델에서도 텍스트만으로 창의적 이미지를 손쉽게 생성할 수 있게 됐으며, 이를 통해 창의적인 상품 디자인 등 다양한 분야에서 새로운 영감을 제공하고, 인공지능 모델이 창의적 생태계에서 실질적으로 유용하게 활용될 수 있도록 기여할 것으로 기대된다”라고 밝혔다.
KAIST 김재철AI대학원 한지연 박사과정과 권다희 박사과정이 공동 제1 저자로 참여한 이번 연구는 국제 학술지 `국제 컴퓨터 비전 및 패턴인식 학술대회 (IEEE Conference on Computer Vision and Pattern Recognition, CVPR)’에서 6월 15일 발표됐다.
※논문명 : Enhancing Creative Generation on Stable Diffusion-based Models
※DOI: https://doi.org/10.48550/arXiv.2503.23538
한편 이번 연구는 KAIST-네이버 초창의적 AI 연구센터, 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받은 혁신성장동력프로젝트 설명가능인공지능, AI 연구거점 프로젝트, 점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구 및 KAIST 인공지능 대학원 프로그램과제의 지원을 받았고 방위사업청과 국방과학연구소의 지원으로 KAIST 미래 국방 인공지능 특화연구센터에서 수행됐다.
2025.06.19
조회수 840