
A Amazon lançou seu projeto Rainier de US$ 11 bilhões, que utilizará mais de um milhão de chips Trainium 2 para alimentar o modelo Claude da Anthropic até o final do ano. O complexo rural de 485 hectares em Indiana, próximo ao Lago Michigan, é dedicado ao treinamento de modelos de IA da Anthropic exclusivamente em chips da Amazon.
A empresa de tecnologia afirmou que o cluster de data centers Rainier opera atualmente com aproximadamente 500.000 chips Tranium2, e a Anthropic se comprometeu a dobrar seu investimento na infraestrutura de IA da Amazon. Enquanto isso, a Amazon investiu cerca de US$ 8 bilhões e o Google injetou cerca de US$ 3 bilhões na Anthropic. A Amazon Web Services (AWS) se refere ao Projeto Rainier como o cluster de computação para treinamento de IA mais poderoso do mundo.
relatou recentemente que a Anthropic não está apenas realizando tarefas pontuais; ela é calculista, metódica e está escalando sua infraestrutura ao máximo . Seus modelos Claude são distribuídos entre GPUs da Nvidia, TPUs do Google e chips Trainium da Amazon, e cada chip executa uma tarefa específica. A pesquisa é conduzida em um local, o treinamento ocorre em outro e a inferência é feita em um terceiro.
O CEO da AWS, Matt Garman, afirmou que o cluster de computação Rainier não é um conceito futuro, mas um projeto que já está em funcionamento. No entanto, há relatos de céticos questionando se existem recursos financeiros, energia e apoio da comunidade suficientes para concretizar esses ambiciosos centros de dados de IA.
O executivo afirmou que a Amazon está cumprindo o prometido, graças às suas décadas de experiência no gerenciamento de dados logísticos em larga escala. A empresa também estabeleceu laços profundos e estreitos com autoridades locais e estaduais por meio de seus enormes centros de distribuição, do projeto HQ2, dos data centers da AWS e dos hubs logísticos.
“Este não é um projeto futuro que discutimos e que talvez venha a se concretizar… Trata-se de executar e treinar seus modelos hoje.”
– Matt Garman, CEO da Amazon Web Services
Mike Krieger, diretor de produtos da Anthropic, afirmou que os negócios parecem bons apenas no papel, mas só se concretizarão se forem implementados, carregados e utilizados pelos clientes. No entanto, ele reconheceu que a Amazon é incrível nesse aspecto. Josh Sallabedra, que lidera a unidade de Indiana Rainier e constrói data centers da Amazon há mais de 14 anos, disse que nunca viu a empresa de tecnologia se mover tão rápido. Garman descreveu a situação como uma transição de plantações de milho para data centers, quase da noite para o dia.
Mike Krieger, da Anthropic, enfatizou a alta demanda pelos modelos de IA de sua empresa, acrescentando que a estratégia de múltiplos chips permitiu que a empresa atendesse a tantos clientes este ano. No entanto, ele observou que a empresa precisará de toda a capacidade de processamento disponível.
Entretanto, Garman afirmou estar ciente dos esforços em prol de múltiplos chips e múltiplas nuvens, mas esclareceu que a Amazon não tem planos para nada drástico, como fazer uma oferta pela Anthropic. Ele acrescentou que ambas as empresas estão satisfeitas com a parceria atual.
A Anthropic também afirmou que não depende exclusivamente da Amazon para definir seu futuro. A empresa anunciou na semana passada uma parceria com a Alphabet para obter acesso a US$ 1 milhão em TPUs (Unidades de Processamento de Tensores) personalizadas do Google. A empresa de IA revelou que o acordo vale dezenas de bilhões de dólares, embora nenhum valor específico tenha sido divulgado.
A Anthropic enfatizou que está se movendo em ritmo acelerado e investindo cash para acompanhar outras gigantes da IA. Seu chatbot Claude já é utilizado por mais de 300.000 empresas, um aumento de 300 vezes nos últimos dois anos. O número de grandes clientes corporativos, cada um com faturamento anual superior a US$ 100.000, cresceu quase sete vezes em um ano. Enquanto isso, o Claude Code gerou US$ 500 milhões em receita anualizada nas suas primeiras oito semanas.
Prasad Kalyanaraman, vice-dent de Serviços de Infraestrutura da AWS, acredita que é fundamental construir o conjunto adequado de recursos que os provedores de modelos desejam. Ele acrescentou que controlar a pilha a partir das camadas inferiores da infraestrutura é igualmente crucial.
Quer que seu projeto seja apresentado às mentes mais brilhantes do mundo das criptomoedas? Apresente-o em nosso próximo relatório do setor, onde dados encontram impacto.