시각지능 학습에 필요한 이미지 데이터도 함께 공개해 국내 인공지능 산업 생태계에 큰 도움이 될 전망이다.
한국전자통신연구원(ETRI)은 사물 인식, 행동 추적 등 시각 인공지능 구현에 필요한 핵심 기술인 백본 네트워크(VoVNet)와 포토샵 없이도 얼굴을 마음대로 편집할 수 있는 기술(SC-FEGAN)을 공개한다고 12일 밝혔다.
또 연구진은 시각 인공지능 기술을 학습시키는데 필요한 도심환경 사물 560종 대상 사물인식 학습 데이터 20만 장을 공개한다.
사람의 눈과 달리 컴퓨터가 영상 속 이미지를 분별하고 인식하기 위해서는 복잡한 과정이 필요하다.
ETRI가 공개하는 백본 네트워크는 사진 속 객체들의 특징을 찾아내 정보를 추출하고 분석하여 인공신경망으로 모델을 만들어내는 기술이다.
이 기술을 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능들을 구현할 수 있어 시각지능의 핵심 기반 기술로 평가받는다.
연구진이 공개하는 또 하나의 핵심 기술은 전문 편집 프로그램 없이도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 기술(SC-FEGAN)이다.
사진 속 인물이 하고 있지 않던 액세서리를 추가하거나 머리 모양, 표정까지도 바꿀 수 있다. 심지어 낙서 등으로 인해 일부가 훼손되거나 빈 공간이 생겨도 원하는 내용을 간단하게 그려 복원할 수도 있다. 이 기술에는 딥러닝 기법 중 하나인 갠(GAN) 기술이 사용된다.
덕분에 컴퓨터 그래픽, 웹 디자인, 산업디자인 등 분야에서 작업 시간을 대폭 줄이고 결과물의 품질을 높일 수 있어 관련 업계에서 많은 활용이 이뤄질 것으로 예측된다.
ETRI 박종열 시각지능연구실장은 “국내 시각 인공지능 기술이 급속도로 성장하고 있지만 외국 의존도가 점차 높아지고 있어 관련 기술을 공개해 국내 산·학·연이 보다 경쟁력 있는 기술을 확보하고 생태계 조성을 위해 적극 지원할 예정이다”고 밝혔다.
한편 이번 기술은 과학기술정보통신부 혁신성장동력사업의 일환으로 진행되어 관련 특허출원 47건, 특허등록 4건, 논문 34편(SCI 6편), 기술 이전 12건의 성과를 냈다.