상단영역

본문영역

ETRI, 24개 언어 이해 ‘음성인식 기술’ 개발

글로벌社와 성능 대등... 연내 30개어 확보, 사업화 추진

이 기사를 공유합니다
  • 입력 : 2022.11.03 17:25
  • 기자명 By. 김의영 기자
▲ ETRI연구진이 24개 음성인식 기술을 이용, 세계 각국 정상의 연설을 실시간 자막화 하는 모습. (사진=ETRI 제공)

[충청신문=대전] 김의영 기자 = 한국전자통신연구원이 한국어와 영어, 중국어뿐만 아니라 독일어, 프랑스어 등 세계 주요 24개 언어를 인식할 수 있는 음성인식 기술을 개발했다.

디지털 전환의 시대, 음성인식을 바탕으로 인공지능(AI) 비서, AI 튜터 등 다양한 AI 서비스 확산에 큰 도움이 될 전망이다.

3일 한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 ‘대화형 인공지능 기술’을 개발했다고 밝혔다.

ETRI가 개발한 음성인식 기술의 성능은 구글 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.

기존 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 연구진은 자기 지도학습, 의사 레이블 적용, 대용량 다국어 사전 학습 모델 등을 통해 언어 확장의 어려움을 해결했다.

또한 연구진은 기존에 흔히 활용되던 종단형 음성인식 기술의 단점을 개선해 활용성을 높였다.

ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여 개의 국내외 기업에 음성인식 기술을 이전했다. 이를 통해 기업들은 ▲회의록 작성 ▲자막 통역 ▲키오스크 ▲의료·교육 등 다양한 AI 서비스에 ETRI의 음성인식 기술을 활용 중이다.

특히 연구진은 연내 지원 언어를 30여 개로 확대하고, 국내외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

김상훈 책임연구원은 “국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다”며 “이 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.

저작권자 © 충청신문 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

충청신문기사 더보기

하단영역

매체정보

  • 대전광역시 중구 동서대로 1337(용두동, 서현빌딩 7층)
  • 대표전화 : 042) 252-0100
  • 팩스 : 042) 533-7473
  • 청소년보호책임자 : 황천규
  • 법인명 : 충청신문
  • 제호 : 충청신문
  • 등록번호 : 대전 가 00006
  • 등록일 : 2005-08-23
  • 발행·편집인 : 이경주
  • 사장 : 김충헌
  • 「열린보도원칙」충청신문은 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
    고충처리인 : 노경래 (042-255-2580 / nogol69@dailycc.net)
  • Copyright © 2024 충청신문. All rights reserved. mail to dailycc@dailycc.net
ND소프트