Schede grafiche

Nvidia lancia tesla t4, la scheda più veloce per i data center

Sommario:

Anonim

Nvidia ha annunciato la sua nuova GPU per l'apprendimento automatico e l'inferenza nei data center. La nuova scheda Tesla T4 si basa sull'architettura Turing ed è il successore dell'attuale modello Tesla P4, che copre praticamente tutti i principali fornitori di cloud computing.

Nvidia Tesla T4 vuole rivoluzionare i data center

Nvidia sostiene che i Tesla T4 sono significativamente più veloci dei P4. Per quanto riguarda l'inferenza linguistica, ad esempio, T4 è 34 volte più veloce dell'uso di una CPU e oltre 3, 5 volte più veloce di P4. Il throughput massimo per Tesla P4 è 260 TOP per operazioni a 4 bit e 65 TOP per operazioni in virgola mobile. T4 si trova su una scheda PCI-e da 75 watt con profilo standard.

Ti consigliamo di leggere il nostro post sui dettagli dell'architettura Turing di Nvidia

Ancora più importante, Nvidia ha progettato questi chip appositamente per l'inferenza AI, il che rende Tesla T4 una GPU così efficiente per fare inferenze è il nuovo Tensor Core di Turing. Jensen Huang ha già parlato del nuovo Tensor Core e di cosa può fare per le operazioni di gioco, rendering e AI. In totale, il chip presenta 320 Tensor Core Turing e 2.560 core CUDA.

Oltre al nuovo chip, Nvidia sta anche lanciando un aggiornamento al suo software TensorRT per ottimizzare i modelli di deep learning. Questa nuova versione include anche il TensorRT Inference Server, un microservizio completamente containerizzato per l'inferenza del data center che si collega perfettamente a un'infrastruttura Kubernetes esistente.

Turing è una delle architetture Nvidia più innovative, anche nel mercato dei giochi, dove consentirà per la prima volta di utilizzare il ray tracing in tempo reale per migliorare la finitura grafica dei giochi più all'avanguardia.

Carattere Techpowerup

Schede grafiche

Scelta dell'editore

Back to top button