엔비디아(CEO 젠슨 황)는 딥러닝 성능을 측정하는 MLPerf 벤치마크 테스트의 최근 발표 결과에서 자사의 텐서(Tensor) 코어 GPU가 6개 부문에서 최고 성능을 기록했다고 밝혔다.

MLPerf는 새로운 AI 벤치마크 스위트(Suite)로 엔비디아를 비롯해 구글, 인텔, 바이두 등 수 십여 개의 기술 선도업체들이 지원하며, 광범위한 딥 러닝 워크로드를 측정한다. MLPerf는 업계 최초의 포괄적인 AI 벤치마크 스위트를 목표로, 컴퓨터 비전, 언어 번역, 맞춤형 추천, 강화 학습 과제 등을 다룬다.

엔비디아는 제출한 6개의 MLPerf 벤치마크 결과에서 최고 성능을 달성했다. 여기에는 단일 노드의 16개의 GPU부터 80개 노드의 640개의 GPU에 이르는 다양한 워크로드와 인프라 규모가 포함된다.

엔비디아가 최고 성능을 기록한 6개 부문에는 이미지 분류, 객체 인스턴스 분류, 객체 탐지, 비 반복 번역, 반복 번역, 추천 시스템이 해당된다. 엔비디아는 강화 학습과 관련된 일곱 번째 부문의 결과는 제출하지 않았는데, 이는 GPU 가속을 최대한 활용하지 않았기 때문이다. 특히, 엔비디아 기술이 두각을 나타낸 주요 벤치마크는 언어 번역으로, 단 6.2분 만에 트랜스포머(Transformer) 신경망을 훈련시켰다.

엔비디아 엔지니어들은 16개의 V100 텐서 코어 GPU를 장착한 업계에서 가장 강력한 AI 시스템인 엔비디아 DGX-2가 포함된 엔비디아 DGX 시스템으로 이 같은 성과를 달성했다. 엔비디아는 6개의 MLPerf 벤치마크를 기록한 유일한 업체로, 이번 결과를 통해 다양한 AI 워크로드를 위한 V100 텐서 코어 GPU의 활용성을 증명했다.

최첨단 AI 컴퓨팅에 요구되는 풀 스택 혁신
복잡하고 다양한 컴퓨팅 워크로드를 위한 성능에는 뛰어난 칩 이상의 것이 요구된다. 마찬가지로, 가속 컴퓨팅은 단순한 가속기 이상의 것, 즉 풀 스택(full stack)을 필요로 한다. 엔비디아의 스택에는 엔비디아 텐서 코어, NV링크(NVLink), NV스위치(NVSwitch), DGX 시스템, 쿠다(CUDA), cnDNN, NCCL, 최적화된 딥 러닝 프레임워크 컨테이너 및 엔비디아 소프트웨어 개발자 키트가 포함돼 있다.

엔비디아의 AI 플랫폼은 접근성이 높고 합리적인 가격으로 제공되는 것이 특징이다. 텐서 코어 GPU는 주요 클라우드 서비스 제공업체와 컴퓨터 제조사, 그리고 모든 지역에서 이용 가능하며, 가장 강력한 데스크톱 GPU인 엔비디아 타이탄(TITAN) RTX가 장착된 데스크탑에서 동일하게 사용할 수 있다. 소프트웨어 가속 스택은 엔비디아 GPU 클라우드(NGC) 클라우드 레지스트리에서 상시 업데이트 된다.

모든 AI 개발자들도 사용 가능
엔비디아가 업계 최고의 MLPerf 벤치마크를 기록하는데 사용된 소프트웨어 혁신과 최적화는 엔비디아의 최신 NGC 딥 러닝 컨테이너에서 무료로 제공되며, NGC 컨테이너 레지스트리에서 다운로드 할 수 있다. 이 컨테이너에는 엔비디아가 최적화한 완벽한 소프트웨어 스택과 최고 수준의 AI 프레임워크가 포함돼 있다. 18.11 버전의 NGC 딥 러닝 컨테이너에는 엔비디아가 MLPerf 결과를 달성하는데 사용한 소프트웨어가 포함돼 있다.

개발자들은 이 소프트웨어를 개발 전 단계에 걸쳐 활용할 수 있다. 데이터 과학자들은 NGC 딥 러닝 컨테이너를 사용해 엔비디아 타이탄 RTX GPU로 최첨단 연구를 수행할 수 있다. 또한, 기업들은 이 컨테이너를 엔비디아 DGX 스테이션에서 실행할 수 있을 뿐 아니라, 알리바바 클라우드, 아마존웹서비스(AWS), 바이두 클라우드, 구글 클라우드 플랫폼, IBM 클라우드, 마이크로소프트 애저, 오라클 클라우드 인프라, 텐센트 클라우드 등에서 엔비디아 GPU 가속 인스턴스를 통해 클라우드 상의 데이터에 AI 적용을 가속화할 수 있다. 또한, 자체 AI 인프라를 구축하는 기업들은 아토스(Atos), 시스코(Cisco), 크레이(Cray), 델 EMC, HP, HPE, 인스퍼(Inspur), 레노버(Lenovo), 수곤(Sugon), 수퍼마이크로(Supermicro) 등에서 엔비디아 DGX 시스템과 NGC 지원 시스템을 통해 AI를 구현할 수 있다. 

엔비디아가 최고 성능을 기록한 6개 벤치마크 부문에 대한 보다 자세한 사항은 엔비디아 개발자 뉴스 센터에서 확인할 수 있다.
저작권자 © 아이러브PC방 무단전재 및 재배포 금지