-
한국인의 자연스러운 감성 인식 인공지능을 위한 공공 DB 구축
기계적 인공지능을 뛰어넘는 감성 지능기술 기반의 미래산업 창출과 효율적인 동영상 요약 서비스 개발을 위한 공공 데이터베이스 구축 사업에 대학이 주도적으로 나선다.
문화기술대학원 박주용 교수 연구팀은 한국인의 감정을 인지할 수 있는 감성 기술과 지능형 영상 요약기술 개발을 위한 인공지능 빅데이터 구축 사업을 통해 코로나 이후 새로운 인공지능산업 창출에 적극적으로 나설 계획이라고 24일 밝혔다.
현재 인공지능은 질병 진단과 자율운전 등 인간의 기계적인 움직임과 판단력을 보완하는 영역에서 활용 폭을 넓히고 있다. 그러나 사람들의 미묘한 감정 표현 인식처럼 기계적으로 판단하기 어려운 문제를 해결하는 '감성 지능' 기술의 국내 수준은 아직 걸음마 단계라고 평가받고 있다. 미국이나 일본과 같은 선진국에서 '험인텔(Humintell)'과 같은 감성 인식 기술기반 서비스가 두각을 보이는 상황에서 이제 우리나라도 사람의 감정을 인지할 수 있는 인공지능 기술 개발을 위해 고품질의 한국인 고유의 감정 표현과 관련된 데이터 수집하고, 또 다양한 응용 서비스 개발에도 더욱 박차를 가해야 한다는 목소리가 커지고 있다.
박주용 교수 연구팀의 '감성 인식 인공지능 공공DB 구축사업'은 COVID-19로 인한 경기침체를 극복하고 코로나19 종식 이후 디지털 시대의 신산업 창출을 위해 과기정통부(장관 최기영)와 한국정보화진흥원(원장 문용식)의 '인공지능 학습용 데이터 구축(2차)' 사업 예산 및 KAIST가 주도하는 컨소시엄의 민간투자금 등 모두 46억 원의 재원으로 운용된다. 이를 위해 일반인과 전문배우 등 약 2,500명의 자발적 참여자로부터 감정 학습을 위한 얼굴 데이터 수집과 함께, K-pop과 K-드라마 등의 세계적 성공으로 수요가 급증하고 있는 환경에서 다양한 동영상 콘텐츠의 효과적인 영상 요약과 맞춤형 마케팅을 가능케 하는 영상 데이터 확보에 나선다.
이 사업은 우리 대학 문화기술대학원이 주관하고 메트릭스리서치(대표 나윤정), 액션파워(공동대표 조홍식/이지화), 소리자바(대표이사 안상현), 데이터헌트(대표이사 김태헌), 아트센터 나비미술관(관장 노소영), 리콘랩스(대표이사 반성훈)가 공동연구기관으로, 그리고 대홍기획(대표이사 홍성현)이 수요기관으로 참여한다. 이밖에 한국 소비자 광고심리학회가 자문하는 이 프로젝트에서 개발되는 데이터베이스, 인공지능 학습모델, 프로그래밍 코드 등 모든 연구결과는 공공재이기 때문에 누구나 연구와 사업에 사용이 가능하다.
특히 문화기술대학원 박주용, 이원재, 남주한 교수팀과 리콘랩스, 아트센터 나비미술관은 사용자의 심리적 건강을 추적할 수 있는 심리 일기장, 음악 영상의 하이라이트 생성을 위한 알고리즘, 서비스 사용자의 반응을 감지할 수 있는 앱 등 이번 사업을 통해 구축예정인 공공 데이터베이스를 활용하는 각종 응용 서비스를 설계하고 실험할 계획이다.
박주용 교수는 "인간을 감정을 이해하는 미래 인공지능 기술발전을 위해서는 고품질의 공공데이터 확보가 필수ˮ라고 전제하면서 "일상 사진을 공유하며 공감대를 찾는 소셜미디어 시대의 문화에 힘입어 새로운 산업을 창출하고 세계적 팬데믹으로 인한 위기 극복에 주도적인 역할을 하는 것은 KAIST의 당연한 책무"라고 강조했다.
2020.09.24
조회수 23933
-
세계 최고 성능을 지닌 데이터베이스 관리 시스템(DBMS) 기술 개발
우리 연구진이 방대한 정보를 저장하고 목적에 맞게 검색, 관리할 수 있는 시스템을 통칭하는 데이터베이스관리시스템(DBMS, DataBase Management System)을 세계 최고 수준의 성능으로 끌어올렸다.
우리 대학 전산학부 김민수 교수 연구팀이 데이터베이스 질의 언어 SQL(Structured Query Language, 구조화 질의어) 처리 성능을 대폭 높인 세계 최고 수준의 DBMS 기술을 개발했다.
김 교수 연구팀은 데이터 처리를 위해 산업 표준으로 사용되는 SQL 질의를 기존 DBMS와는 전혀 다른 방법으로 처리함으로써 성능을 기존 옴니사이(OmniSci) DBMS 대비 최대 88배나 높인 신기술을 개발했다. 김 교수팀이 개발한 이 기술은 오라클·마이크로소프트 SQL서버·IBM DB2 등 타 DBMS에도 적용할 수 있어 고성능 SQL 질의 처리가 필요한 다양한 곳에 폭넓게 적용될 수 있을 것으로 기대된다.
대부분의 DBMS는 SQL 질의를 처리할 때 내부적으로 데이터 테이블들을 `왼쪽 깊은 이진 트리(left-deep binary tree)' 형태로 배치해 처리하는 방법을 사용한다. 지난 수십 년간 상용화돼 온 대부분의 DBMS는 데이터 테이블들의 배치 가능한 가지 수가 기하급수적으로 많기 때문에 이를 `왼쪽 깊은 이진 트리' 형태로 배치해 SQL 질의를 처리해 왔다.
임의의 두 테이블이 기본 키(primary key, PK)와 외래 키(foreign key, FK)라 불리는 관계로 결합(조인 연산)하는 경우에는 이러한 방법으로 SQL 질의를 효과적으로 처리할 수 있다. 여기서 기본 키는 각 데이터 행(row)을 유일하게 식별할 수 있는 열(column)이고, 외래 키는 그렇지 않은 열이다.
지난 수십 년간 산업에서 사용되는 DB의 구조가 점점 복잡해지면서 두 테이블은 PK-FK 관계가 아닌 FK-FK 관계, 즉 외래 키와 외래 키의 관계로 결합하는 복잡한 형태의 SQL 질의들이 많아지고 있다. 실제 DBMS의 성능을 측정하는 산업 표준 벤치마크인 TPC-DS에서 전체 벤치마크의 26%가 이런 복잡한 SQL 질의들로 구성돼 있고 기계학습(머신러닝), 생물 정보학 등 다양한 분야들서도 이러한 복잡한 SQL 질의 사용이 점차 증가하는 추세다.
이전에 나온 DBMS들은 두 테이블이 주로 PK-FK 관계로 결합한다는 가정하에 개발됐기 때문에 FK-FK 결합이 필요한 복잡한 SQL 질의를 매우 느리거나 심지어 처리하지 못하는 실패를 거듭해왔다.
김 교수팀은 문제 해결을 위해 테이블들을 하나의 커다란 `왼쪽 깊은 이진 트리' 형태가 아닌 여러 개의 작은 `왼쪽 깊은 이진 트리'를 `n항 조인 연산자'로 묶는 형태로 배치해 처리하는 기술을 개발했다. 이때 각각의 `작은 이진 트리' 안에는 FK-FK 결합 관계가 발생하지 않도록 테이블들을 배치하는 것이 핵심이다.
각각의 `작은 이진 트리'의 처리 결과물을 `n항 조인 연산자'로 결합해 최종 결과물을 구하는 것도 난제로 꼽히는데 연구팀은 `최악-최적(worst-case optimal) 조인 알고리즘'이라는 방법으로 이 문제를 해결했다.
`최악-최적 조인 알고리즘'은 그래프 데이터를 처리할 때 이론적으로 가장 우수하다고 알려진 알고리즘이다. 김 교수 연구팀은 세계에서 가장 먼저 이 알고리즘을 SQL 질의 처리에 적용해 난제를 해결하는 데 성공했다.
김민수 교수 연구팀은 새로 개발한 DBMS 기술을 GPU 기반의 DBMS 개발업체인 미국 옴니사이(OmniSci)社 제품에 적용한 결과, OmniSci DBMS보다 성능이 최대 88배나 향상된 결과를 얻었다. 또 TPC-DS 벤치마크에서도 세계 최고 수준의 성능을 가진 기존의 상용 DBMS보다 5~20배나 더 빠른 사실을 확인했다. TPC-DS는 DBMS의 성능을 측정하기 위한 산업 표준의 최신 벤치마크이다.
교신저자로 참여한 김민수 교수는 "연구팀이 개발한 새로운 기술은 대부분의 DBMS에 적용할 수 있기 때문에 산업적 측면에서 파급 효과가 매우 클 것으로 기대한다ˮ 라고 말했다.
이번 연구에는 김 교수의 제자이자 미국 옴니사이(OmniSci)社에 재직 중인 남윤민 박사가 제1 저자로, 김 교수가 교신저자로 참여했으며 지난 18일 미국 오리건주 포틀랜드에서 열린 데이터베이스 분야 최고의 국제학술대회로 꼽히는 `시그모드(SIGMOD)'에서 발표됐다. (논문명 : SPRINTER: A Fast n-ary Join Query Processing Method for Complex OLAP Queries).
한편, 이 연구는 한국연구재단 선도연구센터 사업 및 중견연구자 지원사업, 과기정통부 IITP SW스타랩 사업의 지원을 받아 수행됐다.
2020.06.23
조회수 18623
-
이동만 교수, 빅데이터로 SNS 분석해 맞춤형 장소 제공 기술 개발
<좌측부터 전산학부 이동만 교수, 신병헌 박사과정 학생, 최인경 박사과정 학생>
전산학부 이동만 교수 연구팀이 소셜 네트워크 서비스(SNS)의 사진과 글을 기반으로 장소의 특성을 분석해 사용자에게 맞춤형 장소를 제공하는 기술을 개발했다. 이 기술은 현재의 위치기반 추천서비스를 인공지능형 개인비서서비스로 도약시키는 원천기술이 될 것으로 기대된다.
이번 연구는 기존 위치기반 장소 검색 및 추천서비스의 검색 수준을 향상시켜 사용자들이 장소를 선택하는 기준을 다양하게 적용시킬 수 있다. 사용자의 트렌드를 반영해 실시간으로 변화된 장소 추천을 할 수 있을 것으로 보인다. 문화기술대학원 이원재, 박주용 교수와 전산학과 차미영 교수가 공동으로 참여한 이번 연구의 API(응용 프로그래밍 인터페이스)는 http://placeness.kaist.ac.kr:8080/ 을 통해 공개됐고 관련 정보는 http://placeness.kaist.ac.kr/wiki/doku.php 에서 열람할 수 있다.
맛집 추천서비스, 소셜 커머스 등 위치를 기반으로 정보 검색 및 추천서비스를 제공하는 업체들은 주로 고객의 후기를 수집하거나 직접 방문을 통해 경험한 내용을 토대로 음식점 혹은 매장을 평가한다. 이는 비교적 정확한 정보를 제공하지만 시간적, 경제적 비용이 많이 소모된다. 또한 사용자 전체의 관심과 선택의 평균에 중점을 두기 때문에 사용자 개인의 특성을 충분히 고려하지 못한다는 한계가 있다. 시간이 지날수록 사용자는 평균 중심의 예상 가능한 선택지를 추천받을 확률이 높아진다.
따라서 같은 장소라도 사용자가 방문하고자 하는 목적이 다르기 때문에(모임, 상견례, 소개팅 등) 방문 목적과 사회적 맥락을 파악할 수 있는 추가적인 기능이 필수적이다. 이를 위해 기본적으로 제공되는 정보 외에도 실제 사람들이 각 장소에서 어떤 세부적 활동을 하며 공간을 소비했는지에 대한 데이터 수집이 필요하다. 연구팀은 문제 개선을 위해 특정 소셜 네트워크 서비스(인스타그램)에 올라온 사진과 텍스트 자료를 바탕으로 이를 분석하는 알고리즘을 개발했다.
기존에 존재하는 딥러닝 방식을 이용해 사진을 분석하는 기술과 연구팀이 새로 개발한 텍스트 분석 기술인 워드백(Wordbag) 기술을 결합했다. 특정 상황이나 분위기에 사용되는 단어들을 분석하고 단어마다 가중치를 둬 분류하는 기술이다. 연구팀은 API에서 주요 연구 이슈에 따라 크게 4개의 세부 분야별 정보를 제공한다. ▲상위 장소의 장소성(장소의 성격 : placeness), ▲상위 장소 내에 있는 세부 장소의 장소성 추론, ▲감성분석 기반의 장소 분위기 추론, ▲사용자와 장소성 간 연관성을 제공한다.
연구팀의 API는 SNS에 존재하는 연구개발 대상으로 지정된 특정 상위장소(코엑스. 아이파크 몰) 및 그 내부의 세부장소에 대해 언급된 데이터를 분석해 행위, 방문자, 시간, 분위기 등 다양한 관점에서 공간의 활용 가능성을 제공한다. 이는 같은 장소라도 사용자가 시간대, 목적에 따라 다르게 활용했던 이력이나 기존 서비스에서 제공이 어려웠던 분위기(ex. 밝은, 전통적인 등)나 방문 목적(ex. 데이트, 공부, 회의)을 데이터로 수집할 수 있기 때문에 사용자의 의도에 따라 장소를 추천할 수 있다.
이 교수는 “이 연구에서 개발된 API를 통해 기존의 위치기반 장소 검색 및 추천 서비스의 검색 수준을 향상시키고 방문자들의 트렌드 변화에 따라 자동으로 변화된 장소를 추천할 수 있다”고 말했다. 또한 “기존 비정형 텍스트 데이터 분석의 한계를 극복하기 위해 사진과 텍스트를 동시에 분석해 공간에 대한 사회적 정보를 추론할 수 있어 현재의 위치기반 추천 서비스가 인공지능형 개인비서서비스로 도약하는 핵심 기술이 될 것이다”고 말했다.
이번 연구는 과학기술정보통신부 디지털콘텐츠 원천기술개발사업의 지원을 받아 수행됐다.
2017.08.29
조회수 17842
-
전산학전공 황규영 교수팀, 순수 국내기술로 엑스쿼리 지원 XML DBMS 개발 성공
KAIST 첨단정보기술연구센터 소장 황규영(黃奎永, 54, KAIST 전산학과) 교수팀이 한국과학재단의 지원을 받아 XML DBMS (eXtensible Markup Language Database Management System)인 ‘오디세우스/XML"을 순수 국내 기술로 개발하는데 성공했다.
‘오디세우스/XML’은 객체관계형 DBMS (ORDBMS/Object-Relational Database Management System) 및 관계형 DBMS (RDBMS/Relational Database Management System)에 기반하고 있기 때문에 대량의 데이터를 효율적으로 관리할 수 있으며, 표준 XML 질의 언어인 엑스쿼리(XQuery)를 지원한다.
또한, 복잡한 형태의 질의를 단순한 형태의 질의로 변환하여 처리하는 정규화(normalization) 기술을 탑재하여 질의 처리 성능이 탁월하며, 정보 검색에서 필수인 전문 검색(full-text search)도 지원한다.
黃 교수가 개발한 엑스쿼리를 지원하는 XML DBMS는 오라클, IBM, 마이크로소프트社와 같은 세계적 DBMS 개발사에서도 최근에야 개발이 완료되었을 만큼 고난도의 핵심 기술이다.
총 5만 1천 라인의 C++ 코드로 구성된 ‘오디세우스/XML’은 데이터베이스에 접근하기 위해 사용하는 응용프로그램의 표준 인터페이스를 지원하므로 객체관계형 DBMS 뿐만 아니라 오라클, 마이크로소프트 SQL(structured query language) 서버, IBM DB2(database2)와 같은 다양한 상용 관계형 DBMS에서도 사용 가능하다.
黃 교수는 “최근 소프트웨어 산업에서 XML의 활용범위가 넓어짐에 따라 대량의 XML 데이터를 효율적으로 관리할 수 있는 XML DBMS 수요가 급증하고 있다.”며, "이번에 개발한 오디세우스/XML은 국내 유명 ‘L’전자에 기술 이전 예정이며, 원하는 기업이나 개인에게도 이 기술을 적극 이전하여 국내 소프트웨어 산업 발전에 기여하겠다"고 밝혔다.
2005.11.29
조회수 17623
-
황규영 교수, 최첨단 DBMS 저장시스템 개발
64비트 멀티쓰레드 최첨단 DBMS 저장 시스템 "코스모스/MT-64" 개발
KAIST 첨단정보기술연구센터 소장 황규영(黃奎永, 53, KAIST 전산학과) 교수는 과학재단으로부터 15년간 약 30억원의 연구비를 지원받아 데이터베이스 관리 시스템(DBMS)의 핵심 모듈인 저장 시스템 "코스모스/MT-64"를 개발했다고 밝혔다.
코스모스/MT-64는 64비트 플랫폼(platform, 응용프로그램이 실행될 수 있는 기초를 이루는 컴퓨터 시스템)과 멀티쓰레드(multi-thread, 한 프로그램이 다수의 작업을 동시에 수행하는 방식)를 지원하는 상용 수준의 최첨단 DBMS 저장 시스템이다.
이번에 개발된 코스모스/MT-64는 64비트 플랫폼을 지원함으로써 32비트 플랫폼이 가지는 저장 용량의 한계를 극복하였다. 64비트 플랫폼은 100GB 하드디스크 3,000억 개의 저장 용량 지원이 가능한데, 이는 현재 전 세계의 모든 웹 문서를 저장하고도 남는 방대한 용량이다. 또한, 코스모스/MT-64는 멀티쓰레드 (multi-thread)를 지원함으로써 수천 개의 응용프로그램을 동시에 처리하는데 탁월한 성능을 발휘한다. 멀티쓰레드는 적은 컴퓨팅 자원으로 동시에 다수의 프로그램을 수행시킬 수 있는 기술이며, 이로 인해 소형워크스테이션에서도 마치 대형서버의 효과를 얻을 수 있다.
오디세우스 객체관계형 DBMS의 개발자이기도 한 黃교수는 상용 수준의 DBMS저장 시스템 기술이 Oracle, IBM, Microsoft와 같은 세계 최고의 DBMS 개발社 들만이 보유하고 있는 최첨단의 고난도 기술이며, 특히 64비트 멀티쓰레드 저장시스템 기술은 國內最初이고 외국 주요 개발사에서도 불과 1~2년 전에서야 개발이 완료된 최신기술이라고 전했다. 또한, 코스모스/MT-64는 10년간의 개발과 5년간의 테스팅을 거친 부단한 노력의 결정체로서 세계 시장에 내놓아도 전혀 손색이 없을 것이라고 확신했다. 2004년도 세계 DBMS 시장 규모는 약 88억 달러로 추정되며, 향후 지속적인 연구 개발을 통해 세계 시장에 진출함으로써 막대한 부가 가치를 창출하겠다는 원대한 포부를 밝혔다.
코스모스/MT-64는 데이터 관리 소프트웨어를 자동차로 비유했을 때 핵심 부품인 엔진에 해당하며, 엔진 중에서도 포뮬러(국제자동차연맹이 매년 발표하는 경주용 자동차의규격) 경주용차를 위해 개발된 최강의 고성능 엔진이라고 보면 된다. 즉, 코스모스/MT-64는 각종 데이터 관리 소프트웨어에 내장되어 그 소프트웨어의 성능을 최고로 끌어올려 줄 수 있다는 것이다. 이와 같은 막강한 기능과 용이한 탑재성으로 코스모스/MT-64는 향후 다양한 데이터 관리 소프트웨어의 개발에 핵심적으로 사용될 수 있을 것으로 기대된다.
2004.10.27
조회수 18014