NVIDIA GV100 grafische kaart

 

30 maart 2018

 
Naast de door NVIDIA marketing met kracht ingezette campagne vanaf midden 2017 voor de Quadro GP100 is er nu nog een groter kopstuk van een grafische kaart bijgekomen. Geheel afgestemd op de professionele markt.
 

GV100

 
Tijdens de GPU Technology Conference werd deze GPU aangekondigd, waarbij Ray Tracing wel heel erg veel sneller wordt. De verwachte verschijningsdatum is april.
Met RTX Real-time Ray Tracing technology. Naast de onlangs geïntroduceerde Titan V ($ 3.000,-) is dit een ongekende GPU van de volgende generatie Volta architectuur.
De GP100 werd voor rond de 7.000 euro verkocht, de GV100 zal naar verwachting ca. 8.700,- euro kosten.
 

Specificaties GV100

5120 CUDA Cores
640 Tensor Cores
 
32 GB HBM2 aan VRAM GEHEUGEN !
 
dubbele precisie FP64 7,4 TFLOPS
enkele precisie FP32 14,8 TFLOPS
halve precisie FP16 29,6 TFLOPS
Tensor Performance 118,5 TFLOPS
Tensor cores zijn voor het trainen van neurale netwerken
 
 
NVLINK verbindt 2 Quadro GV100 GPU's met elkaar.
om daarmee een grafisch geheugen van 64 GB mogelijk te maken.
met een bandbreedte van 200 GB/s
 
Benodigd
Modern werkstation moederbord met PCI Express 3.0 x16
Form factor: Dual Slot full height
Vermogen: 250 Watt
 
OpenGL 4.5 volgens Khronos Conformance Testing Process
DirectX 12.0 API Hardware Feature Level 12_1
Vulkan 1.0 volgens Khronos Conformance Testing Process
Shader Model 5.1
OpenCL API, geen versie opgegeven.
 
 

"The World's Most Advanced Visual Computing GPU"

The NVIDIA Quadro GV100 is reinventing the workstation to meet the demands of next-generation real-time ray tracing, AI, simulation, and VR enhanced workflows. It's powered by NVIDIA Volta, delivering the extreme memory capacity, scalability, and performance that professionals depend on.
 
 
Vergelijk tussen GV100 en GP100
 

GV100

GP100

CUDA Cores

5120

3584

dubbele precisie FP64

7,4 TFLOPS

5,2 TFLOPS

enkele precisie FP32

14,8 TFLOPS

10,3 TFLOPS

halve precisie FP16

29,6 TFLOPS

20,7 TFLOPS

Tensor Cores

118,5 TFLOPS

VRAM geheugen

32 GB

16 GB

 

NVSwitch

Naast de NVLINK optie om twee van deze GPU's te koppelen (bij de GP100 werd dat voor het eerst mogelijk) komt er nu ook een NVSwitch, waarmee max. 16 GPU's in servers met elkaar zijn te koppelen. De PCI E bus wordt daarmee overbrugd met een veel snellere interconnectie tussen de GPU's onderling. Per twee kunnen de GPU's met 300 GB/s data uitwisselen.
Netzoals bij NVLINK kunnen de CUDA cores opgeteld worden, een professionele opzet van 16 GPU's levert 16 x 5120 = 81.920 CUDA Cores.
Een fors aantal jaren terug werkten we zelf met een redelijk goedkope kaart de Quadro 100 en die had 96 CUDA cores. Ook de geheugens kunnen we hier optellen: 16 x 32 GB = 512 GB HBM2 VRAM geheugen.
 

NVIDIA DGX-2 server

De NVSwitch wordt bij NVIDIA in de nieuwe DGX-2-server toegepast, in de voorganger -1 was het mogelijk om 8 stuks te plaatsen. Bedoeld voor intensieve berekeningen zoals deep learning.
De server is opgebouwd rond 2 stuks Xeon Platinum processoren en een gigantische hoeveelheid opslag capaciteit van 30 TB middels SSD. Het werkgeheugen RAM mag er ook zijn: 1,5 TB.
De professionele server is voor een kleine 400.000 dollar te koop en zal in het derde kwartaal van 2018 op de markt verschijnen.
 
 

Documentatie

 
NVIDIA Quadro GV100 GPU Will power its Ray Tracing Tech
https://www.engadget.com/2018/03/27/nvidia-quadro-gv100-gpu/
 
https://tweakers.net/nieuws/136753/nvidia-komt-met-quadro-gv100-en-maakt-interconnect-om-16-gpus-te-koppelen.html
 
https://www.ontmoeting.nl/renderzone/106-quadro29mrt.html
 
DGX-2
https://www.nvidia.com/en-us/data-center/dgx-2/
 

naar boven