
한국과학기술원(KAIST)은 전산학부 김민수 교수 연구팀이 기존 다중 GPU 서버 방식과 달리 단일 GPU 서버에서 대규모 풀(full) 그래프 AI 모델을 신속하게 학습·추론할 수 있는 GNN 시스템 ‘FlexGNN’을 개발했다고 13일 밝혔다.
이 기술은 기존 대비 학습 속도를 최대 95배 높였다.
풀 그래프 학습 방식은 모든 데이터를 학습에 활용해 정확도가 높지만, 중간 데이터가 대규모로 발생해 메모리 부족과 서버 간 데이터 통신 지연 문제가 있었다.
FlexGNN은 SSD와 메인 메모리를 결합한 최적화 설계와 AI 쿼리 최적화 기술을 적용해 GPU·메인 메모리·SSD 간 데이터 이동과 계산을 효율적으로 조율함으로써 자원 효율성과 속도를 동시에 높였다.
이로써 메인 메모리 용량을 초과하는 데이터도 단일 GPU 서버에서 처리 가능해졌으며, 기후 예측 등 초정밀 분석이 요구되는 분야에서도 슈퍼컴퓨터급 성능을 구현할 수 있게 됐다.
김민수 교수는 “날씨 예측, 신소재 개발 등 복잡한 문제 해결에서 풀 그래프 GNN 모델의 중요성이 커지고 있다”며 “FlexGNN이 학습 규모와 속도 한계를 동시에 해결한 만큼, 다양한 산업 분야에 폭넓게 활용되길 기대한다”고 말했다.
