상단영역

본문영역

'말 이해하는 AI' ETRI, 구어체 분석 기술 공개

기존 모델대비 오류 41% 감소, 한국어 최고수준 달성

이 기사를 공유합니다
  • 입력 : 2020.08.06 16:30
  • 기자명 By. 이정화 기자
한국전자통신연구원(ETRI) '엑소브레인' 구어체 언어분석표.
한국전자통신연구원(ETRI) '엑소브레인' 구어체 언어분석표.
[충청신문=대전] 이정화 기자 = 국내 연구진이 구어체를 분석할 수 있는 인공지능(AI) 기술을 공개했다. AI가 대화까지 이해하게 될 전망이다.

6일 한국전자통신연구원(ETRI)에 따르면 위키백과와 법령 등 문어체를 주로 이해하는 언어분석 AI '엑소브레인'을 확장, 구어체 분석이 되도록 고도화했다. 대화 분석오류를 최대 41% 개선했다.

기존 기술은 '충청도인데'를 '충청돈데'라고 표현하는 경우 '충청도+인데'라는 축약 표현을 인식하지 못한 채 '충청돈+데'라고 분석하는 한계가 있었다.

ETRI가 공개한 구어체 언어분석 기술은 크게 형태소분석 기술과 개체명 인식 기술 두가지다. 형태소분석 기술은 한국어 의미 최소 단위를 분석하는 기술이고, 개명체 인식 기술은 문장 내 고유 대상과 그 의미를 인식한다. '국민은행'이 '국민'과 '은행'이라는 명사의 결합이 아닌 고유 명칭이라는 점을 인식하는 기술이다.

연구진은 학습 데이터 부족 한계를 극복하기 위해 이미 존재하는 타 분야의 학습 모델과 소량의 학습데이터를 재사용하는 방식을 이용했다.

결과로, 기존 모델 대비 형태소분석과 개체명 인식 성능이 각각 5%, 7.6% 개선됐으며 오류는 41.74%, 39.38% 감소했다. 특히, 형태소분석은 산업계에서 사용되는 한국어 형태소분석 오픈소스 중 하나인 메캡(Mecab) 오픈소스 라이브러리 대비 10.6% 더 우수한 것으로 평가됐다.

해당 기술은 '공공 AI 오픈 API·데이터 서비스포털'에서 선보이고 있다.

저작권자 © 충청신문 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

충청신문기사 더보기

하단영역

매체정보

  • 대전광역시 중구 동서대로 1337(용두동, 서현빌딩 7층)
  • 대표전화 : 042) 252-0100
  • 팩스 : 042) 533-7473
  • 청소년보호책임자 : 황천규
  • 법인명 : 충청신문
  • 제호 : 충청신문
  • 등록번호 : 대전 가 00006
  • 등록일 : 2005-08-23
  • 발행·편집인 : 이경주
  • 사장 : 김충헌
  • 「열린보도원칙」충청신문은 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
    고충처리인 : 노경래 (042-255-2580 / nogol69@dailycc.net)
  • Copyright © 2024 충청신문. All rights reserved. mail to dailycc@dailycc.net
ND소프트