[쿠키과학] '컴퓨터 25대 연산 → GPU 컴퓨터 1대로'… KAIST, 세계 최고 그래프연산 혁신

[쿠키과학] '컴퓨터 25대 연산 → GPU 컴퓨터 1대로'… KAIST, 세계 최고 그래프연산 혁신

GPU로 1조 간선 초대규모 그래프 고속처리 연산 프레임워크 개발
3바이트 최초 활용, GPU 메모리 사용량 25% 절감

KAIST 전산학부가 개발한 GFlux  실행 구조. KAIST


KAIST 전산학부 김민수 교수 연구팀이 컴퓨터 25대로 2000초가 걸리던 연산을 한 대의 GPU 컴퓨터로 처리할 수 있는 세계 최고 성능 연산 프레임워크 개발에 성공했다.

연구팀은 한정된 메모리를 지닌 GPU를 이용해 1조 간선 스케일의 초대규모 그래프에 대해 다양한 연산을 고속으로 처리할 수 있는 스케줄러 및 메모리 관리 기술을 갖춘 일반 연산 프레임워크 ‘지플럭스(GFlux)를 개발했다.

지플럭스 프레임워크는 그래프 연산을 GPU에 최적화된 단위 작업 ‘지테스크(GTask)’로 나누고, 이를 효율적으로 GPU에 배분 및 처리하는 특수한 스케줄링 기법이 핵심이다.
이를 위해 연구팀은 그래프를 GPU 처리에 최적화된 압축 포맷 ‘HGF’를 자체 개발했다.

기존 표준 포맷 CSR로 저장할 경우 1조 간선 규모의 그래프 크기가 9테라바이트에 이르지만, HGF 포맷을 활용하면 이 크기를 4.6테라바이트로 절반 가까이 줄일 수 있다. 

아울러 GPU에서 메모리 정렬 문제로 그간 사용되지 않았던 3바이트의 주소 체계를 최초로 활용해 GPU 메모리 사용량을 25% 절감했다.

특히 엔비디아(NVIDIA) 쿠다(CUDA)의 통합 메모리에 의존하지 않고 메모리 부족으로 인한 연산 실패를 방지할 수 있도록 메인 메모리와 GPU 메모리를 통합 관리하는 GTask 전용 메모리 관리 기술도 개발했다.

연구팀은 삼각형 개수 세기와 같은 고난도 그래프 연산으로 지플럭스 기술성능을 검증했다. 삼각형 개수 세기는 그래프에서 서로 연결된 세 개의 정점이 이루는 삼각형 형태의 관계를 모두 찾고 개수를 세는 연산으로, 데이터 분석이나 AI에서 널리 활용된다.

700억 간선 규모 그래프를 대상으로 한 실험 결과 기존 최고 성능은 고속 네트워크 연결 컴퓨터 25대를 이용해 2000초가 걸리던 삼각형 개수 세기 연산을 지플럭스는 GPU를 장착한 단일 컴퓨터로 1184초 만에 처리했다.

이는 현재까지 단일 컴퓨터로 삼각형 개수 세기 연산 최대 규모다.

김 교수는 “최근 그래프 RAG(검색증강생성), 지식그래프, 그래프 벡터색인 등 대규모 그래프에 대한 고속연산 처리기술의 중요성이 점점 커지고 있다”며 “지플럭스 기술이 이런 문제를 효과적으로 해결할 것으로 기대한다”고 말했다.

한편, 이번 연구는 KAIST 전산학부 오세연 박사과정이 제1저자, 윤희용 박사과정이 제2저자, 김 교수가 창업한 그래프 딥테크기업 ㈜그래파이 소속 한동형 연구원이 제3저자로 참여했고,  과기정통부 IITP SW스타랩과 한국연구재단 중견과제 지원을 받아 수행됐다. 연구결과는 지난 22일 열린 IEEE 주최 국제데이터공학학술대회(ICDE)에서 발표됐다. 
(논문명 : GFlux: A fast GPU-based out-of-memory multi-hop query processing framework for trillion-edge graphs ※ DOI:  https://doi.ieeecomputersociety.org/10.1109/ICDE65448.2025.00075)


(왼쪽부터)윤희용 박사과정, 한동형 박사과정, 오세연 박사과정, 김민수 교수. KAIST
이재형 기자
jh@kukinews.com
이재형 기자
이 기사, 어떻게 생각하세요
  • 추천해요
    0
  • 슬퍼요
    0
  • 화나요
    0
쿠키뉴스 헤드라인