- Ironwood tem até 42,5 Exaflops e 9.216 chips por pod.
- Chip oferece 30 vezes mais eficiência que primeira TPU do Google.
- Projeto foca em IA generativa, raciocínio e inferência em escala.
Durante o Google Cloud Next 25, nessa quarta-feira (9), o Google apresentou o Ironwood, sua TPU (Unidade de Processamento Tensor) de sétima geração. Projetado para a nova era da inferência, o chip entrega o maior desempenho já alcançado por um acelerador de IA da empresa, superando todos os modelos anteriores em escala, eficiência e capacidade de processamento.
O Ironwood representa um salto tecnológico para cargas de trabalho complexas de IA generativa, modelos de linguagem (LLMs) e algoritmos de raciocínio, como os usados no Gemini 2.5 e no AlphaFold, por exemplo. O novo chip suporta até 9.216 unidades refrigeradas a líquido, conectadas por uma rede de interconexão de alta largura de banda (ICI). Assim, essa arquitetura alcança 42,5 Exaflops, mais de 24 vezes o poder do supercomputador El Capitan, que opera com 1,7 Exaflops.
Cada chip individual atinge 4.614 TFLOPs, com 192 GB de memória de alta largura de banda (HBM) e velocidade de leitura de 7,2 Tbps. Em comparação com a TPU anterior, por exemplo, o Ironwood oferece 6 vezes mais memória, 4,5 vezes mais largura de banda e o dobro de desempenho por watt. Além disso, a eficiência energética cresceu quase 30 vezes em relação à primeira TPU lançada pelo Google em 2018.
Ironwood se destaca em eficiência
O Ironwood também traz o SparseCore aprimorado, um acelerador especializado para processar embeddings gigantescos, comuns em sistemas de recomendação e classificação em IA moderna. O chip foi construído para reduzir latência e movimentação de dados, dois gargalos críticos em modelos com bilhões de parâmetros.
A arquitetura do Google Cloud AI Hypercomputer integra o Ironwood ao ecossistema do Pathways — ambiente de execução desenvolvido pelo Google DeepMind. Isso permite distribuir tarefas de IA entre centenas de milhares de chips com coordenação síncrona, essencial para escalar modelos de pensamento com rapidez e confiabilidade.
Segundo o Google, o Ironwood estará disponível ainda este ano para clientes do Google Cloud em dois tamanhos: configurações com 256 chips ou com 9.216 chips por pod, dependendo da carga de trabalho. A empresa destaca que essa nova TPU está pronta para impulsionar avanços científicos, aplicações financeiras e soluções de IA generativa de nova geração.