엔비디아(CEO 젠슨 황)가 새로운 GPU 아키텍처 튜링(Turing)을 발표했다.

2006년 쿠다(CUDA) GPU가 탄생한 이래 가장 큰 도약을 이룬 튜링의 주요 특징은 레이 트레이싱(ray-tracing)을 가속화하는 새로운 RT 코어와 세계 최초로 실시간 레이 트레이싱을 지원하는 AI(인공지능) 추론용 텐서 코어(Tensor Core)를 갖췄다는 점이다.

이 두 가지 엔진은 시뮬레이션과 향상된 래스터화(rasterization)를 위한 보다 강력한 컴퓨팅을 제공하는 동시에, 2,500억 달러 규모의 시각효과 시장을 겨냥한 차세대 하이브리드 렌더링의 새로운 지평을 열 것으로 기대된다. 하이브리드 렌더링은 매우 복잡한 모델에서 신경망 및 유체 상호작용을 통해 영화와 같은 수준의 인터랙티브 경험과 새로운 효과를 구현해낸다.

엔비디아는 또한 다양한 산업 분야에 종사하는 5천 만여 디자이너 및 아티스트들의 작업을 혁신시키는 자사 최초의 튜링 기반 제품 엔비디아 쿼드로(Quadro) RTX 8000, 쿼드로 RTX 6000, 쿼드로 RTX 5000 GPU도 공개했다.

엔비디아의 젠슨 황(Jensen Huang) CEO는 컴퓨터 그래픽 컨퍼런스인 시그라프 2018(SIGGRAPH 2018)에서 기조연설을 통해 “튜링은 지난 10여 년 간 컴퓨터 그래픽 분야에서 엔비디아가 이룬 가장 중대한 혁신”이라며, “하이브리드 렌더링은 업계를 변화시켜 한층 아름다운 디자인과 풍부한 엔터테인먼트 및 인터랙티브 경험을 통해 우리의 삶을 고양시킬 수 있는 놀라운 가능성을 열어줄 것이다. 실시간 레이 트레이싱의 등장은 업계의 ‘성배’나 다름없다”고 설명했다.

엔비디아의 8세대 GPU 아키텍처인 튜링은 세계 최초의 레이 트레이싱 기반 GPU로, 1만여 엔지니어들이 수년간 연구한 노력의 결과이다. 튜링의 하이브리드 렌더링을 사용하는 애플리케이션은 기존 파스칼(Pascal) 세대 보다 6배 빠른 속도로 실제 세계를 시뮬레이션 할 수 있다.

엔비디아는 개발자들이 튜링의 이 같은 기능을 최대한 활용할 수 있도록 새로운 AI, 레이 트레이싱 및 시뮬레이션 SDK를 통해 RTX 개발 플랫폼을 개선시켰다. 또한, 수백만 디자이너, 아티스트 및 과학자들을 대상으로 하는 핵심 그래픽 애플리케이션도 RTX 개발 플랫폼을 통해 튜링 기능을 활용할 계획이다.

시장조사기관 JPR의 존 페디 (Jon Peddie) CEO는 “엔비디아의 이번 발표는 컴퓨터 그래픽 역사의 중요한 순간”이라며 “엔비디아는 우리 예상보다 5년이나 앞서 실시간 레이 트레이싱을 선보였다”고 말했다.

RT 코어로 가속화된 실시간 레이 트레이싱
튜링 아키텍처는 RT 코어라고 불리는 레이 트레이싱 전용 프로세서를 갖추고 있어 초당 최대 10 기가레이(GigaRays)에 달하는 3D 환경에서 빛과 소리가 이동하는 방식을 한층 빠르게 계산한다. 튜링은 실시간 레이 트레이싱을 기존 파스칼 세대보다 최대 25배까지 가속화하며, GPU 노드는 CPU 노드의 30배 이상 속도로 영화 효과를 위한 최종 프레임 렌더링에 사용할 수 있다. 

시네사이트(Cinesite)의 미셸 숄레트(Michele Sciolette) 최고기술책임자(CTO)는 “시네사이트는 오토데스크 (Autodesk) 및 엔비디아와 제휴해 아놀드(Arnold)를 GPU에 도입할 수 있게 된 점을 자랑스럽게 생각한다. 그러나 결과가 이렇게나 극적일 것으로 예상하지 못했다”며, “이는 곧 우리가 더 높은 품질 설정으로 더욱 빨리, 더욱 자주 반복할 수 있음을 의미한다. 이는 우리 아티스트들의 작업 방식을 완전히 바꿔 놓을 것”이라고 말했다.
강력한 텐서 코어로 가속화된 AI
튜링 아키텍처는 텐서 코어, 딥 러닝 훈련 및 추론을 가속화하는 프로세서 등도 갖추고 있으며, 초당 최대 500조 회의 텐서 연산을 지원한다.

이러한 수준의 성능은 새롭고 강력한 기능을 갖춘 애플리케이션을 제작하기 위한 AI 기반 기능을 제공한다. 여기에는 고화질 모션 이미지 생성의 핵심 요소인 딥 러닝 앤티 앨리어싱(DLAA), 디노이징, 해상도 스케일링 및 비디오 리타이밍 등이 포함된다.

이 같은 기능들은 엔비디아 NGX 소프트웨어 개발 키트의 일환이다. 이 키트는 개발자들이 가속화되고 향상된 그래픽과 사진 이미징, 비디오 프로세싱을 사전 훈련된 네트워크로 애플리케이션에 쉽게 통합할 수 있도록 지원하는 새로운 딥 러닝 기반 기술 스택이다.

새로운 튜링 스트리밍 멀티프로세서로 한층 빠른 시뮬레이션 및 래스터화 지원
튜링 기반 GPU는 부동 소수점 데이터 경로, 병렬식 정수 실행 장치, 그리고 이전 세대의 두 배에 달하는 대역폭을 가진 새로운 통합 캐시 아키텍처를 갖춘 새로운 스트리밍 멀티 프로세서(SM) 아키텍처를 특징으로 한다.

가변 비율 음영과 같은 새로운 그래픽 기술과 결합된 튜링 SM은 코어 당 전례없는 수준의 성능을 제공한다. 최대 4,608개의 코어를 지원하는 튜링은 1초에 최대 16조 회의 병렬식 부동 소수점 연산과 정수 연산이 가능하다.

개발자들은 엔비디아 CUDA 10, FleX 및 PhysX SDK를 활용해 과학적 시각화, 가상 환경 및 특수 효과를 위한 입자 또는 유체 역학과 같은 복잡한 시뮬레이션을 생성할 수 있다.
저작권자 © 아이러브PC방 무단전재 및 재배포 금지