tradingkey.logo

O QWEN3 do Alibaba derrota o R1 de Deepseek, agora lidera modelos de IA de código aberto

Cryptopolitan6 de mai de 2025 às 16:55

A nova família de modelos de IA da Alibaba, da Família QWEN3, superou o R1 da Deepseek para se tornar o melhor modelo de código aberto do mundo. Segundo relatos, a QWEN3 fez melhor que o R1 em testes que medem as habilidades dos modelos de IA de código aberto em áreas como instrução de idiomas, matemática, codificação e análise de dados. 

A família QWEN3 foi lançada na semana passada pela unidade de computação em nuvem da Alibaba. Possui oito modelos aprimorados com entre 600 milhões e 235 bilhões de parâmetros. No aprendizado de máquina, os parâmetros são as variáveis ​​em um sistema de IA enquanto está sendo treinado.

De acordo com LiveBench , uma plataforma independente dent testa grandes modelos de idiomas, antes desses novos testes, o R1 da Deepseek era o melhor modelo de IA de código aberto do mundo desde que foi lançado em janeiro. Mas não mais.

As empresas americanas e chinesas correm para adotar Qwen 3

A ascensão do QWEN3 no ranking do Livebench mostra a rapidez com que a IA está se desenvolvendo na China. A indústria de tecnologia chinesa cresceu muito graças às ferramentas de código aberto. O código do método de código aberto do Alibaba permitiu que outros desenvolvedores de software de terceiros compartilhassem o design, corrigissem links quebrados ou tornam o programa mais poderoso. 

No entanto, os resultados gerais do LiveBench mostraram que o QWEN3 não era tão bom quanto o O3 O3, o Gemini Pro 2.5 do Google e o Claude 3.7 do Antrópico, que são os melhores modelos de IA de código fechado do mundo. O Livebench diz que o O3-Mini High, o modelo de IA mais popular do OpenAI, foi o melhor do mundo em geral. Microsoft Backs OpenAi.

Para cada 1 milhão de tokens, são necessários US $ 10 para executar O3. Por outro lado, o QWEN3 é mais barato de usar, porque custa apenas US $ 0,55 por 1 milhão de tokens para executar. Como a QWEN3 é mais barata e funciona melhor, muitas empresas disseram que apoiariam o mais novo modelo de IA do Alibaba assim que saiu.

Tecnologias Huawei, Threads Moore, Technologies Cambricon e Hygon Information Technology são empresas de chips que disseram que apoiarão a QWEN3.

Cambricon disse na terça -feira passada que havia otimizado com sucesso o QWEN3 para executar rapidamente em suas unidades de processamento de gráficos. Isso foi feito porque os desenvolvedores de IA nas Filipinas queriam chips feitas na China.

O QWEN3 também está sendo usado nos serviços de computação em nuvem de hiperbólicos e fogos de artifício. Os fabricantes de chips americanos Nvidia e Intel começaram a apoiar a QWEN3.

Muitos big centers da China, como os de Pequim, Xangai, Hangzhou e as províncias de Hubei, Jilin e Northwest Shaanxi, também disseram que usarão os modelos Qwen AI de terceira geração da Alibaba. A rede de supercomputação na China também adotou o QWEN3. Essa rede vincula mais de 20 data centers em 20 cidades em 14 províncias.

CEO antrópico diz que a Deepseek era "um pouco exagerada"

Em um evento de negócios, co-fundador da Anthropic, a empresa que fez os modelos de IA de Claude disse que a Deepseek ainda está "seis a oito meses atrás, onde as empresas de fronteira dos EUA estão". Ele também disse que o burburinho recente em torno da start-up chinês era "talvez um pouco exagerado".

Deepseek chamou atenção em todo o mundo no final de dezembro de 2024 e no início de janeiro de 2025, compartilhando dois modelos avançados de IA de código aberto, V3 e R1. Esses modelos foram feitos para uma pequena fração do poder de custo e computação que as grandes empresas de tecnologia geralmente precisam de projetos de LLM.

Não está claro quando a Deepseek lançará a próxima geração de seus modelos. A empresa com sede em Hangzhou lançou discretamente seu Prover-V2 de 671 bilhões de parâmetros no final de abril . Esta foi uma atualização para o seu modelo especializado para lidar com provas de matemática. No entanto, ele não disse nada sobre o progresso de seu tão esperado modelo de raciocínio R2.

O fio de diferença -chave ajuda as marcas de criptografia a romper e dominar as manchetes rapidamente

Aviso legal: as informações fornecidas neste site são apenas para fins educacionais e informativos e não devem ser consideradas consultoria financeira ou de investimento.
KeyAI