Por Liam Mo e Fanny Potkin
PEQUIM/TAIPÉ, 25 Mai (Reuters) - A Nvidia NVDA.O lançará um novo chipset de inteligência artificial para a China a um preço significativamente menor do que seu modelo H20 recentemente restrito e planeja iniciar a produção em massa já em junho, disseram fontes familiarizadas com o assunto.
A GPU, ou unidade de processamento gráfico, fará parte dos processadores de IA de arquitetura Blackwell de última geração da Nvidia e deverá custar entre US$ 6.500 e US$ 8.000, bem abaixo dos US$ 10.000 a US$ 12.000 pelos quais o H20 foi vendido, de acordo com duas das fontes.
O preço mais baixo reflete suas especificações mais fracas e requisitos de fabricação mais simples.
Ele será baseado no RTX Pro 6000D da Nvidia, um processador gráfico de nível de servidor, e usará memória GDDR7 convencional em vez de memória de alta largura de banda mais avançada, disseram as duas fontes.
Eles acrescentaram que não usariam o chip-on-wafer-on-substrate avançado 2330.TW da Taiwan Semiconductor Manufacturing Co.(CoWoS) tecnologia de embalagem.
O preço, as especificações e o cronograma de produção do novo chip não foram divulgados anteriormente.
As três fontes com as quais a Reuters falou para este artigo não quiseram ser identificadas, pois não estavam autorizadas a falar com a mídia.
Um porta-voz da Nvidia disse que a empresa ainda estava avaliando suas opções "limitadas". "Até que definamos um novo design de produto e recebamos a aprovação do governo dos EUA, estamos efetivamente excluídos do mercado chinês de data centers, avaliado em US$ 50 bilhões."
A TSMC não quis comentar.
QUEDA NA PARTICIPAÇÃO DE MERCADO
A China continua sendo um mercado enorme para a Nvidia, respondendo por 13% de suas vendas no último ano fiscal. É a terceira vez que a Nvidia precisa adaptar uma GPU para a segunda maior economia do mundo, após restrições impostas pelas autoridades americanas, que buscam impedir o desenvolvimento tecnológico chinês.
Depois que os EUA efetivamente proibiram (link) o H20 em abril, a Nvidia inicialmente considerou desenvolver uma versão rebaixada do H20 para a China, disseram fontes, mas esse plano não deu certo.
O presidente-executivo da Nvidia, Jensen Huang, disse (link) na semana passada, a arquitetura Hopper mais antiga da empresa - usada pelo H20 - não pode mais acomodar modificações adicionais sob as atuais restrições de exportação dos EUA.
A Reuters não conseguiu determinar o nome final do produto.
A corretora chinesa GF Securities disse em nota publicada na terça-feira que a nova GPU provavelmente se chamaria 6000D ou B40, embora não tenha divulgado preços nem citado fontes para as informações.
De acordo com duas das fontes, a Nvidia também está desenvolvendo outro chip com arquitetura Blackwell para a China, cuja produção deve começar em setembro. A Reuters não conseguiu confirmar imediatamente as especificações dessa variante.
A participação de mercado da Nvidia na China despencou de 95% antes de 2022, quando começaram as restrições sobre exportações dos EUA que impactaram seus produtos, para 50% atualmente, disse Huang a repórteres em Taipé esta semana. Sua principal concorrente é a Huawei. HWT.UL que produz o chip Ascend 910B.
Huang também alertou que, se as restrições sobre exportações dos EUA continuarem, mais clientes chineses comprarão os chips da Huawei.
A proibição do H20 forçou a Nvidia a dar baixa contábil de US$ 5,5 bilhões (link) no estoque e Huang disse ao podcast Stratechery na segunda-feira que a empresa também teve que cortar US$ 15 bilhões em vendas.
As restrições de exportação mais recentes introduziram novos limites na largura de banda da memória da GPU — uma métrica crucial que mede as velocidades de transmissão de dados entre o processador principal e os chips de memória. Esse recurso é particularmente importante para cargas de trabalho de IA que exigem processamento de dados extenso.
O banco de investimentos Jefferies estima que as novas regulamentações limitem a largura de banda da memória em 1,7-1,8 terabytes por segundo. Isso se compara aos 4 terabytes por segundo que o H20 é capaz de atingir.
A GF Securities prevê que a nova GPU atingirá aproximadamente 1,7 terabytes por segundo usando a tecnologia de memória GDDR7, dentro dos limites de controle de exportação.