27일 KAIST에 따르면 전산학부 이재길 교수 연구팀이 이같은 '비선호(比選好) 특성 억제' 기술을 고안해 훈련 데이터 부족에 대한 해결 방안을 제시했다.
인공지능이 낙타를 구분하도록 딥러닝 훈련을 하는 경우, '낙타'라고 답을 적은 여러 낙타사진을 훈련 데이터로 제공하면 인공지능은 낙타의 주요 특성이 등에 있는 혹이라는 것을 알아내고 낙타를 가려낸다.
하지만 훈련 데이터가 충분하지 않으면 적합하지 않은 특성까지도 같이 추출되는 문제가 발생한다. 낙타 배경으로 종종 등장한 사막을 낙타 특성으로 간주할 수 있다. 사막이 아닌 동물원에 있는 낙타는 인식하지 못하는 셈이다.
이번 기술은 '분포 외 데이터'를 활용해 적합하지 않은 특성을 제거하는 방식이다.
낙타 훈련에서는 여우 사진이 분포 외 데이터가 된다. 여우 사진에는 혹이 없지만 사막은 배경으로 나올 수 있다. 분포 외 데이터에서 추출된 모든 특성을 영(0) 벡터가 돼 소멸하도록 모델 학습 과정을 규제하면 적합하지 않은 특성이 억제됐다.
이 방식은 기존의 이미지 데이터 분석 최신 방법론과 비교했을 때 이미지 분류 문제에서 최대 12%, 객체 검출 문제에서 최대 3%, 객체 지역화 문제에서 최대 8% 예측 정확도가 향상됐다.
제1 저자인 박동민 박사과정 학생은 "분류, 회귀 분석을 비롯한 다양한 기계 학습 문제에 폭넓게 적용될 수 있어 심층 학습의 전반적인 성능 개선에 기여할 수 있다"고 말했다.
연구팀을 지도한 이재길 교수도 "이 기술이 텐서플로우 혹은 파이토치와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있을 것"이라고 말했다.