상단영역

본문영역

ETRI, AI 서비스 개발 돕는 한국어 최첨단 언어모델 공개

이 기사를 공유합니다
  • 입력 : 2019.06.11 16:16
  • 기자명 By. 박진형 기자
ETRI 정보통신전시관에서 연구진들의 가상 엑소브레인 퀴즈대결 기술을 시연하는 모습. (사진=ETRI)
ETRI 정보통신전시관에서 연구진들의 가상 엑소브레인 퀴즈대결 기술을 시연하는 모습. (사진=ETRI 제공)

[충청신문=대전] 박진형 기자 = 과학기술정보통신부와 정보통시기획평가원의 혁신성장동력 프로젝트로 추진 중인 엑소브레인 사업에서 최첨단 한국어 언어모델을 공개했다.

이에 따라 인공지능 비서, AI 질의응답, 지능형 검색 등 한국어를 활용한 인공지능 서비스 개발이 한층 고도화될 것으로 전망된다.

한국전자통신연구원은 10일 최첨단 한국어 언어모델 코버트를 홈페이지에 공개했다.

연구진이 공개한 모델은 두 종류다. 구글의 언어표현 방법을 기반으로 더 많은 한국어 데이터를 넣어 만든 언어모델과 한국어의 교착어 특성까지 반영해 만든 언어모델이다.

이 기술은 올해 3월 한컴오피스 지식검색 베타버전에 탑제됐다. 하반기에는 ETRI의 언어모델을 활용한 '법령분야 질의응답 API'에 추가 공개하고 유사 특허 지능형 분석 기술도 출시를 목표하고 있다.

구글은 40여 만 건의 위키백과 문서 데이터를 사용해 한국어 언어모델을 개발했다. 하지만 ETRI 연구진은 여기에 23기가에 달하는 지난 10년간의 신문기사와 백과사전 정보를 더해 45억개의 형태소를 학습시켜 구글보다 많은 데이터를 기반으로 언어모델을 개발했다.

ETRI에 따르면 구글이 배포한 한국어 모델보다 성능이 평균 4.5%가량 우수하다. 특히 단락 순위화 기준에서는 7.4% 높은 수치를 기록했다.

개발된 언어모델은 딥러닝 프레임워크인 파이토치와 텐서플로우 환경 모두에서 사용 가능하다. 공공인공지능 오픈 API, 데이터 서비스 포털에서도 찾아볼 수 있다.

저작권자 © 충청신문 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

충청신문기사 더보기

하단영역

매체정보

  • 대전광역시 중구 동서대로 1337(용두동, 서현빌딩 7층)
  • 대표전화 : 042) 252-0100
  • 팩스 : 042) 533-7473
  • 청소년보호책임자 : 황천규
  • 법인명 : 충청신문
  • 제호 : 충청신문
  • 등록번호 : 대전 가 00006
  • 등록일 : 2005-08-23
  • 발행·편집인 : 이경주
  • 사장 : 김충헌
  • 「열린보도원칙」충청신문은 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
    고충처리인 : 노경래 (042-255-2580 / nogol69@dailycc.net)
  • Copyright © 2024 충청신문. All rights reserved. mail to dailycc@dailycc.net
ND소프트