
< (왼쪽부터) 박정호 그래파이 엔지니어, 이건호 박사과정, 김민수 교수 >
기업들은 오랫동안 데이터를 관리하는 데 관계형 데이터베이스(DB)를 써왔다. 하지만 거대 AI 모델 활용이 늘면서, 이제는 그래프 DB와의 통합 운영이 요구된다. 그러나 이 과정에서 비용 부담, 데이터 불일치, 복합 질의 처리의 어려움 같은 한계가 드러난다. 우리 연구진은 이 같은 문제를 단번에 해결할 수 있는 차세대 그래프-관계형 DB 시스템 개발에 성공했으며, 곧바로 산업 현장에 적용될 것으로 기대된다. 이 기술이 적용되면 AI는 단순 검색을 넘어 복잡한 연결 관계까지 실시간으로 추론할 수 있어, 한층 똑똑한 AI 서비스 구현이 가능해질 것이다.
우리 대학 전산학부 김민수 교수 연구팀이 관계형 DB와 그래프 DB를 완전 통합하여 그래프-관계형 질의를 한층 효율적으로 실행할 수 있는 새로운 DB 시스템 ‘키마이라(이하 Chimera)’를 개발했다고 8일 밝혔다. Chimera는 국제 성능 표준 벤치마크에서 기존 시스템 대비 최소 4배에서 최대 280배 빠른 질의 처리 성능을 입증하며 세계 최고 수준을 기록했다.
기존 관계형 DB와 달리, 그래프 DB는 데이터를 정점(노드)과 간선(연결선)으로 표현하는 구조를 가지고 있어 사람·사건·장소·시간처럼 복잡하게 얽힌 정보를 분석하고 추론하는 데 강점을 지닌다. 이러한 특징 덕분에 최근에는 AI 에이전트, SNS, 금융, 전자상거래 등 다양한 분야에서 활용이 빠르게 확산되고 있다.
이와 함께 관계형 DB와 그래프 DB 간의 복합 질의 처리 수요가 커지면서, 관계형 질의 언어(SQL)에 그래프 질의 기능을 확장한 신규 표준 언어 ‘SQL/PGQ’도 제안됐다.
SQL/PGQ는 기존 데이터베이스 언어(SQL)에 그래프 탐색 기능을 추가한 새로운 표준 언어로, 표(테이블) 형태의 데이터와 사람·사건·장소 등 연결 관계 정보를 한 번에 질의(검색)할 수 있도록 설계됐다. 이를 활용하면 ‘이 사람의 친구의 친구가 어느 회사에 다니는가’와 같은 복잡한 관계도 기존보다 훨씬 간단하게 검색할 수 있다.

< 그림 (a): 기존 RDBMS 기반 그래프 질의 처리 시스템의 전형적인 아키텍처를 보여준다. 그래프 탐색을 위한 전용 연산자와 인메모리 그래프 구조가 별도로 존재하며, 속성 조인은 관계형 연산자를 통해 처리된다. 그러나, 이러한 구조는 탐색과 조인이 서로 다른 파이프라인에서 수행되므로 하이브리드 질의의 실행 계획 최적화가 어렵다. 또한, 대규모 그래프의 경우 인메모리 구조로 인해 메모리 제약이 발생하고, 관계형 데이터로부터 그래프 데이터를 추출하는 방식으로 인해 최신성 유지에도 한계가 따른다. 그림 (b): Chimera의 통합 아키텍처를 보여준다. Chimera는 기존의 RDBMS 아키텍처에 그래프 탐색 연산자와 조인을 결합한 탐색-조인 연산자, 디스크 기반 그래프 저장소, 그리고 전용 그래프 접근 계층을 새롭게 도입하여, 그래프와 관계형 데이터를 단일 실행 흐름에서 처리한다. 또한 하이브리드 질의 계획기를 통해 그래프·관계형 연산을 통합적으로 최적화하며, 공용 트랜잭션 관리와 디스크 기반 저장 구조를 통해 최신성을 유지하면서도 메모리 제약 없이 대규모 그래프 DB를 다룰 수 있다. 이 아키텍처는 탐색-조인-매핑을 하나의 실행 계획에서 유연하게 결합함으로써 기존 시스템의 병목을 제거하고 성능과 확장성을 동시에 향상시킨다. >
문제는 지금까지의 접근 방식이 그래프 탐색을 억지로 조인 연산으로 흉내 내거나, 메모리에 그래프 뷰(view)를 미리 구성해 처리하는 방법에 의존했다는 점이다. 전자의 경우 탐색 단계가 깊어질수록 성능이 급격히 떨어지고, 후자의 경우 데이터 규모가 조금만 커져도 메모리 부족으로 실행이 실패한다. 또 원본 데이터 변경이 뷰에 즉시 반영되지 않아 데이터 최신성이 떨어지고, 관계형 결과와 그래프 결과를 따로 결합해야 하는 비효율이 뒤따랐다.
우리 대학 연구팀이 개발한 ‘Chimera(키마이라)’는 이러한 한계를 근본적으로 해결했다. 연구팀은 데이터베이스의 저장 계층과 질의 처리 계층을 모두 새롭게 설계했다.
연구팀은 우선 그래프 전용 저장소와 관계형 데이터 저장소를 함께 운영하는 ‘듀얼 스토어 구조’를 도입했다. 여기에 그래프 탐색과 관계형 연산을 동시에 처리하는 ‘탐색-조인 연산자’를 적용해, 복잡한 연산을 단일 체계에서 효율적으로 실행할 수 있도록 했다. 덕분에 Chimera는 데이터 저장부터 질의 처리까지 전 과정을 하나로 통합한 세계 최초의 그래프-관계형 DB 시스템으로 자리매김했다.
그 결과, 국제 성능 표준 벤치마크인 ‘LDBC Social Network Benchmark(SNB)’에서 기존 시스템 대비 최소 4배에서 최대 280배 빠른 성능을 기록하며 세계 최고 수준을 입증했다.
그래프 데이터의 규모가 아무리 커져도 메모리 부족으로 인한 질의 실패가 발생하지 않으며, 뷰를 사용하지 않기 때문에 데이터 최신성 측면에서도 지연 문제가 없다.
김민수 교수는 “데이터 간 연결 관계가 갈수록 복잡해지는 만큼, 그래프와 관계형 DB를 아우르는 통합 기술의 필요성이 커지고 있다”며 “Chimera는 이 문제를 근본적으로 해결한 기술로, 앞으로 AI 에이전트, 금융, 전자상거래 등 다양한 산업에서 널리 쓰일 것으로 기대한다”고 밝혔다.
이번 연구에는 전산학부 이건호 박사과정이 제1저자로, 김민수 교수의 창업기업 ㈜그래파이의 박정호 엔지니어가 제2저자로 참여했으며, 김 교수가 교신저자를 맡았다.
연구 성과는 지난 9월 1일, 세계적 권위의 데이터베이스 분야 국제학술대회 VLDB에서 발표됐다. 특히 새롭게 개발된 Chimera 기술은 ㈜그래파이가 출시 예정인 벡터-그래프-관계형 DB 시스템 ‘AkasicDB’에 적용돼, ‘RAG 기반 고성능 AI 에이전트(검색 능력을 갖춘 똑똑한 AI 비서)’ 구현을 위한 핵심 기술로 즉각적인 산업적 파급력이 기대된다.
※ 논문제목: Chimera: A System Design of Dual Storage and Traversal-Join Unified Query Processing for SQL/PGQ
※ DOI: https://dl.acm.org/doi/10.14778/3705829.3705845
한편, 이번 연구는 과기정통부 IITP SW스타랩과 한국연구재단 중견과제의 지원을 받아 수행됐다.
디지털 암 정보 축적의 시대에는 데이터 생산을 넘어서, 데이터의 수집 및 관리 방법을 정립하고 거대 규모의 빅 데이터를 운용하는 것이 가장 큰 경쟁력이 될 수 있다. 전략적으로는 정밀 임상 정보와 연계할 수 있는 국내 생산 데이터와 다양성에 대한 이해를 도모할 수 있는 대규모 국제 데이터를 모두 수집해 통합하는 것은 매우 중요한 과제다. 우리 대학 의과학대학원 박종은 교수, 바이오및뇌공학과 최정균 교수 공동 연구팀(제1 저자: 강준호 박사, 이준형 박사)이 세계 최대 규모의 암 조직 단일세포 및 공간전사체* 데이터베이스를 구성하고, 이를 바탕으로 삼성서울병원 이세훈 교수 연구팀과 함께 면역 치료의 예후 예측에 중요한 세포 생태계 타입을 보고했다고 22일 밝혔다. *단일세포 및 공간전사체: 모든 유전자의 발현 양상을 개별 세포 단위에서 혹은 3차원 조직 구조상에서 분석한 데이터 암은 우리 몸 안에서 스스로 진화하는 특성을 가지고 있어 암 조직 내의 세포 생태계를 구성하는
2024-05-22우리 대학 전산학부 황규영 명예특훈교수가 'IEEE 데이터공학 기술위원회(Technical Committee on Data Engineering, 이하 TCDE)' 에서 수여하는 공로상(IEEE TCDE Service Award)을 한국인 최초로 수상했다. IEEE TCDE는 VLDB 국제학술재단(VLDB Endowment), ACM SIGMOD와 더불어 세계 데이터베이스 분야를 이끌어가는 3대 학회 조직 중 하나로 데이터베이스(DB) 분야에서 세계 최고 권위의 학술대회인 IEEE ICDE(International Conference on Data Engineering)를 비롯한 각종 학술대회를 주관하고 있으며 이 분야에서 권위를 인정받고 있는 학술지인 IEEE 데이터공학 회보(Data Engineering Bulletin)를 발간하고 있다. 수상 위원회는 황 교수가 2007년 IEEE 펠로우로(국내 전산학 분야 최초) 2009년 ACM 펠로우로(국내 최초) 선임됐으며, 데이
2023-06-13우리 대학은 KBS(사장 양승동)와 함께 한국형 보도영상 인공지능(AI) 데이터베이스와 메타데이터 구축에 나선다고 20일 밝혔다. 문화기술대학원 박주용(과제총괄책임), 이원재, 노준용 교수 연구팀이 주도하는 컨소시엄은 인공지능을 이용해 영상 정보 추출과 편집을 손쉽게 하는 기술 개발에 착수했다. 이와 함께 수행기관인 KBS가 보유한 방대한 뉴스 영상 데이터를 결합해 포스트 코로나 시대 인공지능 기반 영상 콘텐츠 산업 창출에 적극적으로 나설 계획이라고 밝혔다. 현재 인공지능은 질병 진단과 자율운전 등 인간의 기계적인 움직임과 판단력을 보완하는 영역을 벗어나 미디어 콘텐츠 제작과 같은 창의적 분야까지 급속히 확장하고 있다. 하지만 비전문가 누구라도 말을 통해 손쉽게 콘텐츠를 만들고 편집할 수 있게 하는 인공지능 기술은 아직 많은 발전이 필요하며 우리나라에서는 특히 한국어 기반 데이터 세트의 부족이 큰 걸림돌이 되고 있다고 전문가들은 입을 모으고 있다. 우리 대학은 KBS와
2021-07-20우리 연구진이 방대한 정보를 저장하고 목적에 맞게 검색, 관리할 수 있는 시스템을 통칭하는 데이터베이스관리시스템(DBMS, DataBase Management System)을 세계 최고 수준의 성능으로 끌어올렸다. 우리 대학 전산학부 김민수 교수 연구팀이 데이터베이스 질의 언어 SQL(Structured Query Language, 구조화 질의어) 처리 성능을 대폭 높인 세계 최고 수준의 DBMS 기술을 개발했다. 김 교수 연구팀은 데이터 처리를 위해 산업 표준으로 사용되는 SQL 질의를 기존 DBMS와는 전혀 다른 방법으로 처리함으로써 성능을 기존 옴니사이(OmniSci) DBMS 대비 최대 88배나 높인 신기술을 개발했다. 김 교수팀이 개발한 이 기술은 오라클·마이크로소프트 SQL서버·IBM DB2 등 타 DBMS에도 적용할 수 있어 고성능 SQL 질의 처리가 필요한 다양한 곳에 폭넓게 적용될 수 있을 것으로 기대된다. 대부분의 DBMS는 SQL
2020-06-23〈 왼쪽위부터 시계방향으로 이종훈 박사과정, 공정렬 박사과정, 조광현 교수, 신동관 연구교수 〉 우리 대학 바이오및뇌공학과 조광현 교수 연구팀이 대장암이 발병하는 과정에서 생기는 유전자 네트워크의 원리를 규명하는 데 성공했다. 이를 통해 대장암의 근본적인 발병 원리를 밝혀낼 뿐 아니라 향후 새로운 개념의 효과적인 항암제의 분자표적을 찾는데 활용될 것으로 기대된다. 또한 4차 산업혁명의 핵심 기술로 주목받는 IT와 BT의 융합연구인 시스템생물학 연구로 규명해냈다는 의의를 갖는다. 신동관 박사, 이종훈, 공정렬 학생연구원 등이 함께 참여한 이번 연구는 ‘네이처 커뮤니케이션즈(Nature Communications)’ 2일자 온라인 판에 게재됐다. 인간의 암은 유전자 돌연변이에 의해 발생한다. 이 돌연변이의 빈도는 암종에 따라 차이가 나는데 백혈병, 소아암은 10여 개 정도이지만 성인 고형암은 평균 50여 개, 폐암 등의 외부인자로 인한 경우는 수백 개에
2017-11-07