단일 GPU로 95배 빠르게… KAIST, GNN 시스템 ‘FlexGNN’ 개발

2025-08-13 남수현 기자

▲ FlexGNN이 생성한 최적화된 학습 실행 계획에 따른 실행 흐름.(사진=한국과학기술원 제공)

[충청신문=대전] 남수현 기자 = 텍스트 기반 LLM(대규모 언어 모델)뿐 아니라 금융·의료·제약·제조 등 산업 현장에서 비정형 데이터를 그래프 형태로 분석하는 GNN(Graph Neural Network) 기술이 확산되는 가운데, KAIST 연구진이 단 한 대의 GPU 서버로도 대규모 GNN 모델을 최고 속도로 학습할 수 있는 소프트웨어 기술을 개발했다.

한국과학기술원(KAIST)은 전산학부 김민수 교수 연구팀이 기존 다중 GPU 서버 방식과 달리 단일 GPU 서버에서 대규모 풀(full) 그래프 AI 모델을 신속하게 학습·추론할 수 있는 GNN 시스템 ‘FlexGNN’을 개발했다고 13일 밝혔다.

이 기술은 기존 대비 학습 속도를 최대 95배 높였다.

풀 그래프 학습 방식은 모든 데이터를 학습에 활용해 정확도가 높지만, 중간 데이터가 대규모로 발생해 메모리 부족과 서버 간 데이터 통신 지연 문제가 있었다.

FlexGNN은 SSD와 메인 메모리를 결합한 최적화 설계와 AI 쿼리 최적화 기술을 적용해 GPU·메인 메모리·SSD 간 데이터 이동과 계산을 효율적으로 조율함으로써 자원 효율성과 속도를 동시에 높였다.

이로써 메인 메모리 용량을 초과하는 데이터도 단일 GPU 서버에서 처리 가능해졌으며, 기후 예측 등 초정밀 분석이 요구되는 분야에서도 슈퍼컴퓨터급 성능을 구현할 수 있게 됐다.

김민수 교수는 “날씨 예측, 신소재 개발 등 복잡한 문제 해결에서 풀 그래프 GNN 모델의 중요성이 커지고 있다”며 “FlexGNN이 학습 규모와 속도 한계를 동시에 해결한 만큼, 다양한 산업 분야에 폭넓게 활용되길 기대한다”고 말했다.