AMD lança GPU Instinct MI355X com até 2,2x mais performance que NVIDIA Blackwell
Durante o Advancing AI nesta quinta-feira (12), a AMD revelou novidades no campo de inteligência artificial, entre elas as novas aceleradoras Instinct MI350X e MI355X baseadas na nova arquitetura CDNA 4. As duas GPUs são equipadas com 288 GB HBM3e, oferecendo largura de banda de até 8 TB/s e salto de 3x em performance sobre a geração passada, além de superar a rival NVIDIA e suas GPUs Blackwell.
Com um processo de fabricação mais avançado (TSMC N3P) e mudança para arquitetura CDNA 4, foi possível alcançar 35x mais desempenho em inferência de IA. Ambas as GPUs têm configurações bem parecidas e por isso entregam desempenho similar. Apesar de serem equipados com 1,6x mais memória em relação à NVIDIA Blackwell, esses chips entregam os mesmos 8 TB/s de largura de banda da rival.
Desempenho das Instinct MI350X e MI355X
Em relação à NVIDIA GB200, o MI355X entrega cerca de 2x mais performance em FP64 e FP32 e o mesmo salto de desempenho acontece em FP6. Em outros níveis de precisão, como FP4, FP8 e FP16, a vantagem da nova Instinct topo de linha é de 10%, segundo a AMD.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
Desempenho teórico das GPUs AMD Instinct MI350X e MI355X | ||
Precisão | Instinct MI355X | Instinct MI350X |
FP64 | 72 TFLOPs | 72 TFLOPs |
FP16 | 5 PFLOPS | 4.6 PFLOPS |
FP8 | 10.1 PFLOPs | 9.2 PFLOPs |
FP6 | 20.1 PFLOPS | 18.45 PFLOPS |
FP4 | 20.1 PFLOPS | 18.45 PFLOPS |


Todo esse poder de processamento tem um preço: o aumento no consumo energético. O TBP (Total Board Power) da Instinct MI355X é de 1.400W no modelo refrigerado a água. Isso é quase o dobro em relação à MI300X. Já o chip MI350X chega a 1.000W.
Racks com AMD Instinct MI350 series
A AMD também revelou racks com diferentes configurações envolvendo as duas GPUS, seja na quantidade de unidades usadas, como também no método de refrigeração. São três ao todo: o mais simples deles é equipado com 64 MI350X refrigerados a ar, garantindo 18 TB de memória e 0,6 EF (ExaFLOPS) em FP8 e 1,2 EF em FP6 e FP4, que é uma novidade para o hardware da AMD.



O rack intermediário conta com 96 GPUs MI355X e 27 TB de memória HBM3e, com desempenho subindo para 1 EF em FP8, além de 2 EF em FP6 e FP4. Já a configuração topo de linha oferece números 2x maiores em relação ao rack menor: 128 GPUs Instinct MI355X refrigerados a água, totalizando 36 TB de memória. Em FP8, o desempenho é 1,3 EF, e em FP6 e FP4 a performance fica em 2,6 EF.
Segundo a AMD, o chip topo de linha entrega 4,2x mais performance em agentes de AI e workloads com chatbot em relação à MI300X. Em trabalhos que envolvem conversação, geração de conteúdo e sumarização com IA, os ganhos são entre 2,6x a 3,8x sobre a geração passada. Em DeepSeek R1, a melhoria chega a 3x, além de 3,3x em Llama 4 Maverick.
Veja mais do CTUP:
- 8 melhores jogos para jogar em casal
- 5 melhores processadores até R$ 3.000 para jogos em 2025
- Review Nintendo Switch 2 | Console é um salto tecnológico e tanto, mas só
Leia a matéria no Canaltech.
O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!
Esta notícia foi originalmente publicada em:
Fonte original