제품/PC

GPU 용어 알아보기(CUDA, VRAM, Tensor Core, RT Core 등)

후미니 2023. 5. 8. 00:00
반응형

그래픽 처리 장치인 GPU(Graphical Processing Unit)는 고화질의 그래픽 및 이미지를 처리하도록 설계된 프로세서입니다. 요즘 컴퓨터 부품에서 아주 중요한 구성 요소이며, 화면에 표시되는 이미지를 렌더링 하는 역할을 합니다.

이번 포스팅에서는 CUDA, VRAM, 클럭 속도, 메모리 대역폭, 트레이싱 기법, 텐서코어, 오버클럭킹 등 엔비디아 GPU를 구매하실 때 알면 유용한 GPU 관련 용어들에 대해서 알아보겠습니다.


엔비디아-GPU
엔비디아 GPU

1) CUDA

CUDA란 'Compute Unified Device Architecture'의 약자이며, NVIDIA에서 GPU 용으로 개발한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델입니다. CUDA코어를 통해 딥 러닝, 과학 시뮬레이션 및 멀티미디어 처리를 포함한 광범위한 애플리케이션에 GPU 병렬 처리 능력을 활용합니다. CUDA를 사용하면 프로그래머는 C, C++ 및 파이썬과 같은 친숙한 프로그래밍 언어로 코드를 작성한 다음 엔비디아 GPU에서 컴파일하고 실행할 수 있습니다. 훨씬 빠른 속도로 복잡한 계산을 수행할 수 있으므로 기존 CPU 기반 컴퓨팅에 비해 상당한 이점을 제공합니다.

2) VRAM

VRAM(Video Random Access Memory)은 그래픽 처리와 관련된 데이터를 저장하기 위해 GPU에서 사용하는 메모리입니다. GPU용으로 특별히 설계된 Video RAM이기 때문에 일반 RAM보다 빠릅니다. VRAM의 양은 모니터에 표시할 수 있는 해상도와 이미지 품질을 결정합니다. VRAM 용량이 더 큰 GPU는 더 높은 해상도와 질감을 처리할 수 있으므로, 게임 및 기타 그래픽 집약적인 응용 프로그램에 적합합니다. 일부 고급 GPU에는 최대 24GB의 VRAM이 있을 수 있습니다.

CPU에서 사용되는 시스템 RAM과는 별개이며, 이미지 렌더링에 필요한 데이터를 빠르게 액세스 하도록 설계되었습니다.

3) Clock Speed

클럭 속도는 GPU 프로세서가 실행되는 속도를 나타냅니다. 기가헤르츠(GHz) 단위로 측정되며, 클럭 속도가 높을수록 GPU가 더 빠른 속도로 데이터를 처리할 수 있습니다. 하지만 클럭 속도만이 GPU의 성능을 결정하는 요소는 아닙니다. 코어 수, VRAM양, 메모리 대역폭과 같은 다른 요소도 GPU의 전체 성능을 결정하는 데 중요한 역할을 합니다.

4) Memory Bandwidth

메모리 대역폭은 GPU 메모리에서 프로세서로 데이터를 전송할 수 있는 속도입니다. 초당 기가바이트(GB/s) 단위로 측정됩니다. GPU가 계산을 수행하는 데 필요한 데이터에 얼마나 빨리 액세스 할 수 있는지 결정됩니다. 더 높은 메모리 대역폭은 GPU가 데이터를 더 빨리 전송할 수 있음을 의미하며, 이는 그래픽 집약적인 애플리케이션의 성능을 크게 향상할 수 있습니다. 메모리 대역폭은 GPU 메모리의 속도메모리 버스의 폭에 의해 결정됩니다.

5) Ray Tracing

레이 트레이싱 기술은 가상 장면에서 빛의 동작을 시뮬레이션 하는 3D 그래픽에 사용되는 렌더링 기술입니다. 사실적인 조명과 그림자를 실시간으로 생성할 수 있는 계산 비용이 많이 드는 기술입니다. 레이 트레이싱은 비디오 게임, 애니메이션, 영화 제작을 비롯한 다양한 애플리케이션에 사용됩니다. NVIDIA의 RTX 시리즈 GPU는 고사양 게임에서 마치 영화처럼 실시간 렌더링을 가능하도록 해주기 때문에 그래픽 집약적인 애플리케이션에 이상적입니다.

5-1) RT Core

RT코어는 5번의 레이 트레이싱 기술을 가속화하고 렌더링의 효율성을 향상시키는 엔비디아 GPU의 전용 하드웨어 구성 요소입니다. RT코어는 NVIDIA Geforece RTX 시리즈 그래픽 카드에 사용된 Turning 아키텍처에 처음 도입되었습니다.

RT코어를 통해 실시간 Ray tracing을 수행할 수 있으므로 게임 및 기타 애플리케이션에서 보다 사실적이고 상세한 이미지를 생성할 수 있습니다.

6) Tensor Core

텐서 코어는 기계학습 및 인공 지능 작업을 위해 특별히 설계된 처리 장치 유형입니다. 이들은 NVIDIA의 최신 GPU 아키텍처에 포함되어 있으며, 딥 러닝 애플리케이션을 위한 상당한 성능 향상을 제공합니다. Tensor 코어는 기존 CPU 컴퓨팅보다 훨씬 빠른 속도로 매트릭스 작업을 수행할 수 있으므로 뉴럴 네트워크 학습에 이상적입니다.

7) Overclocking

오버클러킹은 더 나은 성능을 달성하기 위해 GPU의 클럭 속도를 공장 사양 이상으로 높이는 과정을 말합니다. 전력 소비와 발열이 증가할 수 있지만, 성능을 향상할 수 있기 때문에 Boost Clock이 어느 정도 가능한지 확인이 필요합니다.

8) Stream Processor

세이더 코어라고도 하는 스트림 프로세서는 GPU 내의 개별 처리 장치입니다. 그래픽을 렌더링 하고 이미지를 처리하는 데 필요한 계산을 수행하는데 필요한 프로세서입니다. GPU의 스트림 프로세서 수는 성능을 결정하며, 프로세서가 많을수록 성능이 향상됩니다.


위의 9개 용어에 대해서 알면 엔비디아의 GPU 제품의 상세 페이지를 어느정도 이해하실 수 있을 거 같습니다. GPU 용어를 이해하는 데 도움이 되셨길 바랍니다.

반응형