tradingkey.logo

Alibaba lança modelo de IA que afirma superar DeepSeek-V3

Reuters29 de jan de 2025 às 11:54

Por Eduardo Baptista

- A empresa chinesa de tecnologia Alibaba 9988.HK lançou nesta quarta-feira uma nova versão de seu modelo de inteligência artificial Qwen 2.5 que, segundo ela, superou o DeepSeek-V3.

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga do trabalho, aponta para a pressão que a ascensão meteórica da startup chinesa de IA DeepSeek nas últimas três semanas exerceu não apenas sobre os rivais estrangeiros, mas também sobre sua concorrência doméstica.

"O Qwen 2.5-Max supera (...) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B", disse a unidade de computação em nuvem da Alibaba em anúncio publicado em sua conta oficial na rede social WeChat, referindo-se aos modelos de IA de código aberto mais avançados das norte-americanas OpenAI e Meta.

O lançamento, em 10 de janeiro, do assistente de IA da DeepSeek, equipado com o modelo DeepSeek-V3, bem como o lançamento, em 20 de janeiro, de seu modelo R1, chocou o Vale do Silício e fez com que ações de empresas de tecnologia ao redor do mundo despencassem.

Mas o sucesso do DeepSeek também levou a uma corrida entre seus concorrentes nacionais para atualizar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance, proprietária do TikTok, lançou uma atualização de seu principal modelo de IA, que, segundo ela, superou o o1, da OpenAI, no teste AIME, um exame que mede a capacidade dos modelos de IA de entender e responder a instruções complexas.

Isso ecoou a afirmação da DeepSeek de que seu modelo R1 rivalizava com o o1 em vários benchmarks de desempenho.

DEEPSEEK VERSUS CONCORRENTES CHINESES

O predecessor do modelo V3 da DeepSeek, o DeepSeek-V2, desencadeou uma guerra de preços de modelos de IA na China após seu lançamento em maio passado.

O fato de o DeepSeek-V2 ser de código aberto e barato, apenas 1 iuan (0,14 dólar) por 1 milhão de tokens - ou unidades de dados processados pelo modelo de IA - fez com que a unidade de computação em nuvem do Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.

Outras empresas chinesas de tecnologia seguiram o exemplo, incluindo a Baidu 9888.HK, que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a empresa de tecnologia mais valiosa da China, a Tencent 0700.HK.

Liang Wenfeng, fundador da DeepSeek, disse em julho em uma rara entrevista ao meio de comunicação chinês Waves que a startup "não se importava" com guerras de preços e que alcançar a AGI (inteligência artificial geral) é seu principal objetivo.

A OpenAI define AGI como sistemas autônomos que superam os humanos nas tarefas mais valiosas do ponto de vista econômico.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, têm centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, com uma equipe formada principalmente por jovens graduados e estudantes de doutorado das principais universidades chinesas.

Liang disse na entrevista de julho que acreditava que as maiores empresas de tecnologia da China talvez não fossem adequadas para o futuro do setor de IA, contrastando seus altos custos e estruturas de cima para baixo com a operação enxuta e o estilo de gerenciamento flexível da DeepSeek.

"Grandes modelos fundamentais exigem inovação contínua, as capacidades dos gigantes da tecnologia têm seus limites", disse ele.

((Tradução Redação São Paulo, 55 11 56447753))

REUTERS AAJ

Aviso legal: as informações fornecidas neste site são apenas para fins educacionais e informativos e não devem ser consideradas consultoria financeira ou de investimento.

Artigos relacionados

Tradingkey
KeyAI