< 수리과학과 김재경 교수 >
평균이 아닌 개인차를 고려하는 정밀 의학 시대가 열렸다. 사람마다 다른 유전적 특징을 알아내는 기술이 비약적으로 발전한 덕분이다. 더 빠르고, 정확하게 전사체를 해독할 수 있는 새로운 도구가 개발됐다. 우리 대학 수리과학과 김재경 교수(IBS 수리 및 계산 과학 연구단 의생명 수학 그룹 CI) 연구팀은 전사체 분석 빅데이터에서 유용한 생물학적 정보만 골라내는 새로운 도구인 ‘scLENS(single-cell Low-dimension Embedding using Effective Noise Subtraction)’를 개발했다.
단일세포 전사체 분석은 최근 생물학, 신약 개발, 임상 연구 등 여러 분야에서 주목받는 도구다. 개별 세포 단위에서 유전적 변화를 확인할 수 있기 때문이다. 가령, 단일세포 전사체 분석을 이용하면 암 조직 내 수십 가지 종류의 세포를 구분하고, 유전적 변이가 발생한 세포만 표적하는 정밀 치료가 가능해진다.
단일세포 전사체 분석 기술이 임상에 광범위하게 이용되려면, 도출되는 빅데이터에서 유용한 생물학적 신호를 찾아내는 효율적인 분석 도구 개발이 선행돼야 한다. 단일세포 전사체 분석은 수백~수천 개에 이르는 개별 세포의 수만 개에 이르는 다양한 유전자 발현량을 측정하기 때문에 데이터 용량이 수~수십 GB에 달한다. 이 방대한 데이터 중 생물학적으로 유용한 신호는 3% 내외에 불과하다.
이 방대하고 노이즈(잡신호)가 많은 데이터에서 유용한 생물학적 신호를 골라내기 위해 지금까지 여러 데이터 처리 도구가 개발됐다. 하지만 기존 도구는 사용자가 생물학적 신호와 노이즈의 ‘경계선’을 직접 설정해야 해서 주관이 개입됐다. 즉, 분석가에 따라 결과가 크게 달라지고, 정확도가 떨어진다는 한계가 있었다.
< 그림 1. scLENS 개요. (왼쪽) 기존의 단일세포 전사체 분석 방법은 로그 정규화를 이용해 데이터 전처리를 하고 전처리된 데이터로 부터 사용자가 직접 임계값을 설정하여 신호와 노이즈를 구별해야한다. 이 과정에서 신호 왜곡이 발생하여 분석결과가 부정확해짐을 이번 연구에서 밝혀내었다. (오른쪽) 연구진은 기존 로그 정규화에 L2 정규화를 통합하면 전처리 과정에서 신호 왜곡을 방지할 수 있음을 밝혔다. 나아가 랜덤 행렬 이론을 이용하여 사용자의 선택 없이 데이터에만 기반하여 신호와 노이즈를 구별하는 임계값을 설정하는 방법을 개발하였다. 덕분에 scLENS는 정확하고 자동화된 데이터 분석이 가능하다. >
우선, 연구진은 기존 분석 도구들이 부정확한 근본적인 원인을 규명하고 해결책을 제시했다. 사용자가 노이즈의 임계값을 결정하는 데이터 전처리 방식 자체가 생물학적 신호를 왜곡시킨다는 것을 규명하고, 왜곡 없는 새로운 전처리 방식을 개발했다. 나아가 연구진은 수학적 방법론인 ‘랜덤 행렬 이론’을 이용해 사용자의 주관적 선택 없이 자동으로 단일세포 전사체 분석 데이터에서 신호와 노이즈를 구별하는 프로그램인 ‘scLENS’를 개발했다.
제1 저자인 김현 연구원은 “scLENS는 사용자의 선택 없이 데이터에 내재된 구조만을 이용해 자동으로 신호와 노이즈를 구별하기 때문에 사용자 편향성 문제를 원천 차단할 수 있다”며 “연구자들의 노동집약적인 신호 선택 과정을 없애면서도 분석 정확성은 높였다”고 설명했다.
이어 연구진은 기존 개발된 11가지 데이터 분석 프로그램과 scLENS의 상대적 성능을 비교했다. 이를 통해 scLENS가 다른 모든 프로그램보다 우수한 성능을 보인다는 점을 확인할 수 있었다. 널리 쓰이는 프로그램인 ‘Seurat’과 비교했을 때 scLENS는 세포 그룹화 성능이 약 10% 이상 우수하며, 데이터에 내재된 국소 구조를 43% 더 효과적으로 포착하는 것으로 나타났다.
< 그림 2. scLENS 성능. a. scLENS는 11개의 다른 분석 도구들과 비교했을 때, 가장 높은 실루엣 스코어(파란색 막대)를 기록하였다. 이는 scLENS가 실제 세포 유형(true cell-type)을 가장 잘 반영하는 차원 축소 결과(임베딩)를 생성한다는 것을 의미한다. 더 나아가, 이 차원 축소 결과에 계층적 클러스터링(초록색 막대)과 그래프 기반 클러스터링(주황색 막대)을 적용하여 레이블을 얻었을 때, 실제 세포 유형과의 유사도가 다른 분석 도구들에 비해 가장 높게 나타났다. b. scLENS는 타 분석 도구들에 비해 원래 데이터로부터 얻은 k-최근접 이웃 구조와 가장 유사한 구조를 다운 샘플링된 데이터로부터 얻어낼 수 있음을 가장 높은 k-최근접 이웃 중첩 점수(kNN-overlap score)를 기록함으로써 입증했다. >
특히, scLENS는 기존 프로그램보다 많은 계산을 하지만 메모리 사용 최적화를 통해 10만 개의 세포와 2만 개의 유전자로 이뤄진 대규모 데이터를 3시간 만에 분석하는 경쟁력 있는 분석 속도를 보였다.
연구를 이끈 김재경 CI는 “지난 십여 년간 단일세포 전사체를 분석할 수 있는 실험 기술의 비약적인 발전했지만, 데이터 분석 방법의 한계로 인해 큰 비용과 시간을 투자해 얻은 데이터를 최대한 활용하지 못하는 경우가 많았다”며 “기초 수학 이론이 생명과학 연구의 혁신을 견인하고, 감춰졌던 생명의 비밀을 빠르고 정확하게 밝히는 데 쓰일 수 있음을 보여주는 연구”라고 말했다.
연구결과는 4월 27일(한국시간) 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 16.6)’ 온라인판에 실렸다.
우리 대학 연구진이 챗GPT를 활용해 큰 다공성, 높은 표면적, 그리고 뛰어난 조절 가능성으로 많은 화학 응용 분야에서 사용되는 금속 유기 골격체의 특성을 예측하고 새로운 재료를 자동으로 생성하는 챗봇 시스템(이하 챗MOF)을 개발했다. 챗MOF는 검색 및 예측 작업에서 각각 96.9% 및 95.7%의 높은 성공률을 보여 화제다. 생명화학공학과 김지한 교수 연구팀이 인공지능(AI)의 급격한 발전에 주목하며, 대규모 언어 모델(이하 LLMs) 활용을 통해 금속 유기 골격체(Metal-Organic Frameworks, MOFs)의 특성을 예측하고 새로운 재료를 자동으로 생성하는 챗봇 시스템(ChatMOF)을 개발했다고 26일 발표했다. 최근 인공지능(AI)의 발전에는 큰 도약이 있었지만 재료 과학에서의 LLM의 잠재력을 완전히 실현하기에는 여전히 물질의 복잡성과 재료별 특화된 훈련 데이터의 부족이라는 한계점이 존재했다. 김지한 교수 연구팀이 개발한 챗MOF는 재료 분야에
2024-06-26평면에 국한됐던 디스플레이 기술이 곡면형 모니터나 폴더블 휴대폰 화면처럼 다양한 형태로 진화되고 있는데, 이보다 더 나아가 잡아당겨도 동작 가능한 신축형 디스플레이의 핵심 기술이 개발되어 화제다. 우리 대학 전기및전자공학부 유승협 교수 연구팀이 동아대 문한얼 교수, 한국전자통신연구원(ETRI) 실감소자 연구본부와의 협력을 통해 세계 최고 수준의 높은 발광면적비를 가지며 신축 시에도 해상도가 거의 줄지 않는 신축 유기발광다이오드(organic light-emitting diode, OLED) 디스플레이를 구현하는 데 성공했다고 11일 밝혔다. 공동연구팀은 유연성이 매우 뛰어난 초박막 OLED를 개발하여 이의 일부 발광 면적을 인접한 두 고립 영역 사이로 숨겨 넣는 방법으로, 신축성과 높은 발광 밀도를 동시에 확보하는 데 성공했다. 이렇게 숨겨진 발광 영역은 신축 시 그 모습을 점차 드러내며 발광 면적비의 감소를 보상하는 메커니즘을 가능케 했다. 기존의 신축형 디스플레이는
2024-06-11약 20년 전 아주 작은 나노 크기 0차원 강유전체 내부에 특이한 형태의 분극 분포가 발생할 수 있음이 로랑 벨라이쉬(Laurent Bellaiche) 교수(現 미국 아칸소대 물리학과 교수) 연구진에 의해 이론적으로 예측됐다. 해당 소용돌이 분포를 적절히 제어하면 기존에 비해 10,000배 이상 높은 용량의 초고밀도 메모리 소자로 응용이 가능할 것이라는 가능성이 제시돼 학계의 이목을 끌었으나, 3차원 분극 분포 측정의 어려움으로 인해 실험적인 규명이 되지 못하고 있었다. 우리 대학 물리학과 양용수 교수 연구팀이 포항공과대학교, 서울대학교, 한국기초과학지원연구원과의 공동연구 및 미국 로런스 버클리 국립연구소, 아칸소대학교 연구진과의 국제협력 연구를 통해 나노강유전체 내부의 3차원 소용돌이 형태 분극 분포를 최초로 실험적으로 규명하였다고 30일 밝혔다. 영구자석과 같이 외부의 자기장이 없어도 자화 상태를 스스로 유지할 수 있는 물질들을 강자성체(ferromagnet)라 하고,
2024-05-30디지털 암 정보 축적의 시대에는 데이터 생산을 넘어서, 데이터의 수집 및 관리 방법을 정립하고 거대 규모의 빅 데이터를 운용하는 것이 가장 큰 경쟁력이 될 수 있다. 전략적으로는 정밀 임상 정보와 연계할 수 있는 국내 생산 데이터와 다양성에 대한 이해를 도모할 수 있는 대규모 국제 데이터를 모두 수집해 통합하는 것은 매우 중요한 과제다. 우리 대학 의과학대학원 박종은 교수, 바이오및뇌공학과 최정균 교수 공동 연구팀(제1 저자: 강준호 박사, 이준형 박사)이 세계 최대 규모의 암 조직 단일세포 및 공간전사체* 데이터베이스를 구성하고, 이를 바탕으로 삼성서울병원 이세훈 교수 연구팀과 함께 면역 치료의 예후 예측에 중요한 세포 생태계 타입을 보고했다고 22일 밝혔다. *단일세포 및 공간전사체: 모든 유전자의 발현 양상을 개별 세포 단위에서 혹은 3차원 조직 구조상에서 분석한 데이터 암은 우리 몸 안에서 스스로 진화하는 특성을 가지고 있어 암 조직 내의 세포 생태계를 구성하는
2024-05-22분자의 크기와 모양에 따라 분자를 구별할 수 있는 분리막 공정*은 기존의 열 분리 공정(예: 증류법)보다 훨씬 적은 에너지를 소비하며 화학 산업의 탄소 배출량을 줄일 수 있는 잠재력을 가지고 있다. *분리막 공정: 분리막은 물질의 크기나 흡수력에 따라서 특정 물질을 선택적으로 통과시키거나 배제하는 역할을 하는 선택적 장애물로 분리막을 이용한 분리 공정은 기존의 공정과 달리 많은 에너지를 사용하지 않고도 화합물들을 효율적으로 분리할 수 있음 우리 대학 생명화학공학과 고동연, 임성갑 교수 공동연구팀이 기존에 분리하기 어려웠던 크기의 활성 제약 분자들을 매우 높은 선택도로 분리할 수 있는 초박막 분리 기술을 세계 최초로 개발했다고 29일 밝혔다. 분리막은 산업계 전반에 사용되는 유기용매들을 분리하는데 저에너지, 저탄소 해결법을 제공할 수 있어 비교적 짧은 상업화 역사에도 불구하고 석유화학, 반도체, 재생합성연료(E-Fuel), 바이오 제약 분야 등 폭넓은 분야에 응용되고 있
2024-04-29