月刊 아이러브PC방 10월호(통권 359호)에 게재된 기사입니다.

2세대 RTX인 암페어 아키텍처 기반 RTX30 시리즈의 첫 등장은 RTX3080이 테이프를 끊었다. 그동안 엔비디아가 새로운 그래픽카드를 선보일 때마다 보다 나은 성능을 선보인 것이 사실이지만 이번에는 좀 더 강렬했다. 출시 전 루머로 돌던 정보보다 실제 성능이 더 상회하는 모습을 보여준 것이다. 그래픽카드 발전의 변곡점이 될 RTX30 시리즈, 그 중 RTX3080의 성능과 그 의미를 살펴봤다.

예상을 뒤엎은 성능과 가격
지난 9월 2일 오전 1시(국내 기준) 엔비디아 CEO 젠슨 황이 암페어 아키텍처 기반의 지포스 RTX30 시리즈 GPU를 공개했다. 루머를 통해 1.5배 가량 성능이 높아질 것으로 예상되어 왔던 터라 많은 관심이 집중되었는데, 젠슨 황은 3가지 핵심 키워드를 던져 세간에 충격을 안겨줬다. 바로 ‘RTX3080은 699달러로, RTX2080 Ti 대비 최대 2배의 성능을 갖췄다’, ‘RTX3070은 499달러로 RTX2080 Ti 보다 빠르다’, ‘RTX3090은 8K 게이밍이 가능한 BFGPU’였다.

젠슨 황의 발언대로라면 공식소비자가격이 699달러로 책정된 RTX3080은 이전 세대 동일 넘버링인 RTX2080 보다 최대 2배의 성능을 발휘하면서도 가격은 100달러 더 저렴한 것이었다. 심지어 499달러인 RTX3070은 아예 RTX2080 Ti와 비슷하거나 조금 더 높은 성능을 갖춘 것으로 발표됐다.

결국 이번 RTX30 시리즈는 ‘큰 폭의 성능 향상’, ‘저렴해진 가격’이라는 두 마리의 토끼를 모두 잡아낸 걸작이라 할 수 있다.

TWICE THE PERFORMANCE OF 2080
젠슨 황은 RTX3080이 RTX2080 대비 2배의 성능(TWICE THE PERFORMANCE)이라고 밝혔지만, 배포 자료에는 최대 2배(UP TO 2)의 성능을 발휘한다고 표기해놓았다.

약 2배와 최대 2배는 분명히 차이가 있지만 중요한 것은 그만큼 성능이 향상됐다는 의미라는 것이다.

사실 이 부분은 암페어 아키텍처, 즉 이전 세대인 튜링 아키텍처와 달라진 부분의 영역에 해당된다. 우선 RTX3080의 사양표를 살펴보면 CUDA 코어가 무려 8,704개나 된다. RTX2080의 CUDA 코어가 2,944개인 것을 감안하면 2.96배로 늘어난 것이다. 그런데 CUDA 코어가 2.96배 증가했는데 성능은 최대 2배라는 것은 효율, 즉 단위 성능이 낮아졌다는 의미로 보일 수 있다.

여기가 바로 암페어 아키텍처가 선택한 FP32와 INT32 유닛의 SM(Streaming Multiprocessor) 구조와 운용 방식이 변경된 지점이다. 기존에는 FP32와 INT32가 각각 전용 유닛으로 구성·작동됐는데, 이번에는 FP32 전용 유닛과 FP32 INT32 혼합 유닛으로 구성·작동된다. 즉 50:50 구조에서 50:50 ~ 25:75 가변 구조로 변경된 것이다. 또한 이 유닛 모두를 CUDA 코어로 분류하는 것으로 바뀌었다.
결과적으로 다양한 작업 환경에 보다 능동적으로 대응이 가능해져 이전보다 확실하게 성능을 끌어올 수 있게 된 것은 분명하다.

삼성전자의 8nm 공정 도입?!
성능 발표 이후 공개된 자료에 삼성전자의 8㎚ 공정으로 제조됐다는 내용이 가장 눈길을 끌었다. TSMC에서 12㎚ 공정으로 제조해왔던 것에서 벗어나 삼성에서 8㎚ 공정으로 제조하는 것인 만큼 공정과 파운더리를 모두 바꾼 것이기 때문이다. 심지어 삼성으로서는 빅칩을 맡게 된 것이라는 점에서도 이번 RTX3080의 성능과 안정성은 그래픽카드와 CPU 시장 판도를 크게 바꿔놓을 수 있는 터라 그 상징성이 매우 크다.

RTX3080의 GPU 모델명이 GA102-200-KD-A1인 것으로 보아 2차 컷칩인 점으로 미뤄, GTX3090은 1차 컷칩인 300이, 그 상위에 풀칩인 400이 위치할 것이 확실시 된다.

그리고 넘버링 80 라인 모델이 빅칩 기반 GPU를 이용한 것은 2010년 페르미 아키텍처 기반 GTX580과 2013년 GTX600 시리즈의 케플러 아키텍처를 리플레시한 GTX700 시리즈의 GTX780 이후 7년 만이다.

보조전원 8핀 2개, 소비전력 320W, 발열은?
GTX3080은 보조전원 8핀 2개를 요구하며, 소비전력은 대략 320W 수준이고 펙토리오버클럭 모델에 따라서는 440W까지 늘어난다. 8핀 보조전원 2개는 없는 파워서플라이 찾기가 더 어려우니 문제가 아니지만 소비전력은 이전세대보다 제법 높아졌다. 기존 넘버링 80 라인은 250W 전후였던 것을 감안하면 30% 가까이 증가한 것인데, 현재 적어도 700W 80+ 급 이상의 싱글레일 파워서플라이에서 원활한 구동이 가능하고 장기적인 구동 안정성과 효율을 생각한다면 750W 이상이 권장된다. 80+ 미만이거나 600W 대에서는 아예 부팅이 안 되거나 로드가 걸리는 순간 재부팅이 되는 문제가 발생하기 때문에 RTX1080이나 RTX2080/2070에서 RTX3080으로 전환할 경우에는 파워서플라이의 용량을 상향하는 수요도 수반된다.

그런데 성능이 향상되고 소비전력도 늘어났지만 온도는 오히려 더 낮다. 벤치마크 프로그램 등 풀로드가 걸려도 68도에 그쳐 이전 세대 제품들이 80도 전후까지 올라가던 것과 대조적이다. 심지어 백플레이트 팬을 장착하면 온도가 1~2도 가량 더 낮아져 더욱 안정적인 작동이 가능해 RTX3080은 GPU 뿐만 아니라 쿨링 솔루션 설계 또한 매우 우수한 결과를 보여주고 있다.
실제 구동 중의 온도가 이전 세대 보다 낮아지다보니 제로팬 기능도 한결 더 돋보이게 됐다. 제로팬 기능은 40도 전후에 팬이 작동되는 기능이다보니 <리그오브레전드>와 같이 요구사양이 낮은 게임을 플레이하는 동안은 방열판(과 히트파이프)만으로 쿨링이 이뤄진다. 말 그대로 ‘무소음 쿨러’의 재현인 셈이다.

역시 중요한 것은 성능! 프리미엄 좌석 QHD 해상도에 최적
그래픽카드가 다양한 분야에 활용되고는 있지만 PC방과 게이머에게는 뭐니 뭐니 해도 게이밍 성능이 가장 중요하다.

테스트 PC를 구성해 벤치마크 프로그램과 주요 게임에 대한 성능을 확인해봤다. 테스트 PC는 AMD 라이젠7 3800XT CPU, ASUS EX A320M GAMING 메인보드, 하이닉스 KLEVV DDR4 2966 8GB(4GB × 2) 메모리, 큐닉스 RS-700WF 80+ 파워서플라이, 윈도우 10 프로 64비트 OS다. 메인보드는 PCIe 3.0 기반임에도 불구하고 PC방에서 많이 이용하는 A320 칩셋을 탑재한 메인보드를 선택해 실제 PC방에서의 이용환경에 최대한 유사하게 맞췄다. 테스트 대상이 되는 그래픽카드는 갤럭시 지포스 RTX3080 SG D6X 10GB 제품을 이용했다.

갤럭시 지포스 RTX3080 SG D6X 10GB는 LED 싱크 기능을 갖춘 트리플 쿨러에 백플레이트 쿨러를 갖췄고, LED가 탑재된 그래픽카드 지지대를 추가해 그래픽카드와 관련된 별도의 구매가 필요 없도록 구성된 것이 특징이다.

우선 3D Mark FireStrike는 41,374점을 기록해 RTX2080 8GB(27,000점 대), RTX2070 8GB(24,200점 대), GTX1080 8GB(22,100점 대)와 비교해 각 53.2%, 70.9%, 87.2% 향상된 성능을 보여줬다.

온라인게임 가운데 요구사양이 가장 높은 <배틀그라운드>는 FHD와 QHD 해상도로 사녹 맵 리플레이 시 각각 232fps와 201fps를 보여줘 옵션을 소폭 낮추면 QHD 144Hz 모니터에 완전하게 대응할 수 있다.

FHD보다는 QHD 이상에서 더욱 효과적, 프리미엄 좌석에 어울려
RTX3080을 비롯한 RTX30 시리즈는 이전 세대와 비교해 저해상도에서는 성능차가 좁혀지고 고해상도일수록 성능차가 넓혀진다. 즉 FHD 60Hz 환경보다는 8K 120Hz 환경에서 더 큰 성능 차이를 보인다는 것이다. PC방에서는 아직 4K 모니터가 생소하지만 QHD 모니터는 그 비중이 점차 늘어나고 있다.

<배틀그라운드>가 흥행에 성공한 이후 고해상도 모니터가 주류로 자리를 잡은데 이어 2018년부터 PC방 프리미엄 좌석에는 QHD 모니터가 하나둘 도입되기 시작해 이제는 제법 많은 PC방에서 사용하고 있다. RTX30 시리즈는 이러한 프리미엄 좌석의 QHD 모니터를 보다 효과적으로 활용해 고사양 게임의 체험성을 높이는데 이전 세대 그래픽카드보다 훨씬 큰 역할을 할 것으로 보인다.

특히 모니터 제조사마다 브랜드존을 구축하고 프리미엄 게이밍 존을 강조하는 흐름이 거세지고 있는 만큼 RTX3080은 프리미엄 좌석을 중심으로 빠르게 도입될 것으로 예상된다.

이런 까닭에 RTX3080은 DP 외에도 대역폭이 큰 HDMI 2.1 인터페이스를 도입해 4K와 8K 게이밍 환경에 대비하고 있다.

PCIe 4.0에서의 성능은?
벤치마크는 PC방 환경에 가깝게 하고자 A320 칩셋을 탑재한 메인보드를 이용해 PCIe 3.0 환경에서 결과값을 도출한 것이다. 하지만 RTX3080은 PCIe 4.0을 지원하기 때문에 X570과 같이 PCIe 4.0을 지원하는 칩셋을 탑재한 보드에서는 좀 더 성능을 끌어올릴 수 있다.

RTX3080은 X570 칩셋이 탑재된 메인보드에서 FireStrike 그래픽 점수 43,000점 전후를 기록해 A320 칩셋 탑재 메인보드에서 41,300점대를 기록한 것과 비교해 3.7% 정도의 차이를 보였다. 대역폭이 배로 늘어난 것에 비해 실제 성능 향상은 크지 않은 셈인데, PC방은 PC를 영업용으로 이용하는 만큼 최대 성능보다는 도입 가능한 가격대와 그 가격대에서 창출할 수 있는 최대 성능이 더 중요하다. 즉, 개인이 아닌 PC방에서라면 3.7%의 성능을 위해 고가의 X570 칩셋 메인보드를 구비하는 것보다는 저렴한 A320 칩셋의 메인보드가 훨씬 효과적인 셈이다.

물론 향후 PCIe 4.0 호환 환경이 개선되고 보다 높은 성능의 그래픽카드가 출시된다면 PCIe 4.0의 도입 가치는 달라질 수 있다.

PC방 업계에 적지 않은 변화 예고
그래픽카드 가격은 세대를 거듭할수록 높아져왔던 터라 대량구매를 해야 하는 PC방 업계로서는 신제품 출시가 마냥 즐거울 수는 없는 노릇이었으나, 이번 RTX30 시리즈는 아쉬웠던 가격 부분까지 모두 챙겨냈기 때문에 PC방 업계에서도 적지 않은 변화를 이끌 것으로 보인다.

고사양 신작이 출시되기 전까지는 기존 세대만으로도 충분해 교체할 필요가 없다는 의견도 있지만, 반대로 여전히 <배틀그라운드>를 울트라 옵션으로 고해상도, 고주사율을 만족시키는 데는 어려움이 따르고, 가격 역시 부담스러웠던 것도 사실이다. 결과적으로 기존 RTX2070 SUPER 가격으로 RTX2080 2개를 SLI로 구성한 성능을 얻을 수 있다는 것은 PC방 그래픽카드의 세대교체를 앞당길 것으로 보인다. 특히 10월 중에 실체를 드러낼 것으로 보이는 RTX3070이 출시되면 PC방의 그래픽카드 세대교체는 급물살을 탈 것으로 전망된다.

저작권자 © 아이러브PC방 무단전재 및 재배포 금지

관련기사