맑은내친구의 AI 유창성 분석 화면: 15초간 자연 발화한 구어를 대상으로 비유창성의 빈도, 구사한 어휘의 다양도, 말 속도를 분석해서 유창성 지수를 알려준다
서울--(뉴스와이어)--마인드테크 인공지능(AI) 스타트업 바이칼에이아이(대표 윤기현)가 말을 물 흐르듯 유창하게 하는지 분석하고 도와주는 AI ‘맑은내친구’의 업데이트를 마치고 출시했다고 27일 밝혔다.
맑은내친구는 자연 발화를 듣고, 실시간으로 한국어의 유창성을 분석하는 기능이 탑재됐다. 자연 발화는 정해진 문장을 읽거나 유도해서 말하는 게 아닌 일상적인 말하기를 뜻한다. 맑은내친구는 최소 15초 이상 잡음이 없는 공간에서 진행된 자연 발화의 유창성 분석이 가능하다. 이때 분석 결과는 ‘유창성 지수’와 ‘의사소통 능력’에 대한 측정값으로 보여준다.
유창성 지수는 유창성을 방해하는 6가지 비유창성 요소(△반복 △수정 △대용어 △간투사 △무의미어 △첨가)가 얼마나 자주 발생하는 지를 측정한다.
예를 들어 “그런데 얘네들이 지금 인제 그러니까 그런 문제가 지금 터지고 있, 있, 있는 거예요”라는 문장에는 비유창성 요소가 7개나 들어 있다. 분석해보면 “그런데”, “얘네들이”, “인제”, “그러니까”, “(두 번째 나온)지금”은 ‘무의미어’, “(2개의)있”은 ‘반복’의 비유창성 요소들에 해당된다. 이 요소들을 제거하면 “지금 그런 문제가 터지고 있는 거예요”라는 유창한 말의 흐름이 된다.
해당 예문은 전체 32개 음절 가운데 17개 음절, 즉 53%가 불필요한 말이다. 발화자는 한 문장을 표현하기 위해 2배 이상의 에너지를 들인 셈이다. 듣는 사람도 그만큼 에너지를 더 사용해야 제대로 이해할 수 있다. 한 사람의 비유창성이 두 사람의 에너지를 낭비하고 있다.
의사소통 능력은 얼마나 다양한 어휘를 사용하는지에 대한 ‘어휘 다양도’와 말의 흐림이 부드러운지를 보는 ‘말 속도’로 측정된다. 유창성 지수는 이 3가지 요소를 종합한 점수이며, 80점대라면 유창한 말을 구사한다고 볼 수 있다.
맑은내친구의 유창성 분석 기술은 바이칼에이아이의 3년에 걸친 자연어 및 구어 AI 연구의 성과물이다. 2020년 국내 최고의 뇌신경학자, 언어치료학자, 언어학자, AI 전문가들이 모여 ‘라고연구단’을 결성했고, 종합병원 신경과 3곳과 공동 연구를 통한 AI 학습용 데이터 수집 및 정제, 한국어 유창성 라벨링 지침을 완성했다. 최근에는 우울증과 자폐 스펙트럼 진단에도 유창성 분석 기술을 적용하고 있다.
한국어 유창성 분석 AI 기술 개발을 직접 지휘하고 있는 바이칼에이아이 윤기현 대표는 “챗GPT 이후 똑똑한 AI에 모두 놀라고 있다. 그 놀람 중 하나는 AI가 사람을 소외시킬지도 모른다는 불안감”이라며 “AI가 가야 할 길은 그 반대다. AI는 사람을 위해 존재해야 하고, 사람을 응원하고 도와주고 지원해야 한다. 사람이 말을 더 잘할 수 있도록 도와주는 맑은내친구가 바로 그 시작이다. 사람을 돕는 AI를 만들 것”이라고 AI 개발 방향을 제시했다.
바이칼에이아이 소개
바이칼에이아이는 2019년 6월 창업한 음성-자연어 처리 기반 인공지능(AI) 소프트웨어 스타트업이다. 핵심 사업으로 한국어 말소리를 자연어 처리(컴퓨터를 이용해 사람의 언어를 분석하는 기술) 분석을 통해 사람들의 건강 상태를 예측 및 자가 관리할 수 있는 ‘맑은내친구’ 서비스를 운영하고 있다. 말은 인간의 핵심 의사소통 수단으로, 말을 통해 뇌에서 일어나는 변화를 포착할 수 있다. 이를 바탕으로 사람들의 말소리 데이터를 통해 인지 장애까지 진단할 수 있도록 기술 개발 영역을 확대해 나가고 있다. 또 최고 성능의 한국어 형태소 분석기 ‘바른(bareun)’, 인공지능 학습 데이터 구축 플랫폼 ‘AI달고나’를 개발·운영하고 있다.