Placas Gráficas

Nvidia lança tesla t4, o cartão mais rápido para data centers

Índice:

Anonim

A Nvidia anunciou sua nova GPU para aprendizado de máquina e inferência em data centers. O novo cartão Tesla T4 é baseado na arquitetura Turing e é o sucessor do atual modelo Tesla P4, que abrange praticamente todos os principais fornecedores de computação em nuvem.

Nvidia Tesla T4 quer revolucionar data centers

A Nvidia argumenta que os Tesla T4s são significativamente mais rápidos que os P4s. Para inferência de idioma, por exemplo, o T4 é 34 vezes mais rápido que o uso de uma CPU e mais de 3, 5 vezes mais rápido que o P4. A taxa de transferência máxima para o Tesla P4 é de 260 TOPS para operações inteiras de 4 bits e 65 TOPS para operações de ponto flutuante. O T4 está em uma placa PCI-e de perfil padrão de 75 watts.

Recomendamos a leitura de nosso post sobre Detalhes da arquitetura Turing da Nvidia.

Mais importante ainda, a Nvidia projetou esses chips especificamente para inferência de IA, o que torna o Tesla T4 uma GPU tão eficiente para fazer inferências no novo Tensor Core de Turing. Jensen Huang já falou sobre o novo Tensor Core e o que ele pode fazer para operações de jogos, renderização e IA. No total, o chip possui 320 núcleos Tensor Core e 2.560 núcleos CUDA.

Além do novo chip, a Nvidia também está lançando uma atualização para o seu software TensorRT para otimizar modelos de aprendizado profundo. Essa nova versão também inclui o TensorRT Inference Server, um microsserviço totalmente em contêiner para inferência de data center que se conecta perfeitamente a uma infraestrutura existente do Kubernetes.

Turing é uma das arquiteturas mais inovadoras da Nvidia, mesmo no mercado de jogos, onde permitirá pela primeira vez usar o traçado de raios em tempo real para melhorar o acabamento gráfico dos jogos mais avançados.

Fonte Techpowerup

Placas Gráficas

Escolha dos editores

Back to top button