ETRI, 세계 최초 AI 테스팅 국제표준 제정 성공
데이터 품질·모델 성능·편향성까지 전주기 검증 가능
2025-11-19 하서영 기자
이번 표준은 ISO/IEC 인공지능 기술위원회(SC 42)에서 우리나라가 주도적으로 제정한 최초의 AI 테스팅 핵심 국제표준으로 글로벌 AI 기술 경쟁 속에서 대한민국이 ‘선도자’로 자리매김했음을 보여준다.
이번 표준은 인공지능 데이터 품질, 모델 성능, 편향성 등 AI 전주기 테스트 방법론을 최초로 정의했으며 향후 국제 공인시험과 적합성 평가에도 활용될 수 있는 기준을 제시한다.
AI 기본법과 EU AI ACT 등에서 요구하는 고영향·고위험 AI 시스템 검인증 방법과 적합성 시험 기준을 만들었다는 점에서 의미가 크다.
기존 소프트웨어 테스트 표준을 AI 시스템에 맞게 확장해 △데이터 품질 테스트 △모델 테스트 등 AI 특화 테스트 단계를 도입했으며 위험 기반 테스트 개념을 적용해 잠재적 위험 요소를 사전에 점검할 수 있도록 했다.
이 외에도 △편향성 테스트 △적대적 테스트 △드리프트 테스트 등 AI 시스템 특화 검증 절차를 구체화했다.
이번 국제표준은 앞으로 제정될 △AI 레드팀 테스팅 △생성형 AI 테스팅 등 후속 표준의 기반이 되는 ‘총론’ 격 표준으로 AI 신뢰성 검증 체계의 근간을 우리나라가 설계했다는 데 큰 의미가 있다.
지능정보표준연구실 전종홍 책임연구원이 최초 제안하고 소프트웨어 테스트 분야 세계적 권위자 스튜어트 리드 박사와 공동 에디터로 참여해 완성했다.
양 기관은 ISO/IEC JTC 1 산하 AI 표준화 위원회(SC 42)와 SW 테스팅 위원회(SC 7) 간 합동작업반(JWG 2)을 구성해 5년간 공동 개발을 추진했다.
이번 성과는 정부의 ‘소버린 AI(주권형 AI)’ 및 ‘AI G3 도약’ 전략의 핵심 목표인 ‘안전하고 신뢰할 수 있는 AI 구현’을 뒷받침하며 AI 시스템 성능과 위험을 객관적으로 검증하는 국제 공통 기준을 마련함으로써 글로벌 시장에서 대한민국이 AI 안전·신뢰성 분야의 규범을 선도할 기반을 구축했다.
방승찬 원장은 “AI의 안전성과 신뢰성을 확보하는 것은 인공지능 시대의 핵심 과제이며 이번 국제표준 제정은 대한민국이 AI 기술뿐 아니라 AI 테스팅과 평가 규범을 선도하는 분기점이 될 것”이라고 밝혔다.
이승윤 표준연구본부장도 “이번 표준은 전 세계 AI 시스템 안전성과 신뢰성을 시험 평가하는 공통 기준의 ‘뼈대’를 우리 손으로 만든 것”이라며 “앞으로 소버린 AI 테스팅 기술과 표준화 주도에 힘쓰겠다”고 말했다.
전종홍 책임연구원은 “AI 공통 핵심 표준을 만드는 국제 표준화 활동이 강화돼야 하며 국가 차원의 표준화 전략과 국제표준화 장기 투자가 필요하다”고 강조했다.
ETRI는 이번 표준을 기반으로 △레드팀 테스팅 △온톨로지 표준 △AI 벤치마크 등 후속 국제 표준 시리즈 개발을 이어갈 계획이다.