R1-0528 de Deepseek agora está logo atrás do O4-Mini do Openai

Cryptopolitan30 de mai de 2025 às 10:30

A Deepseek lançou o R1-0528, uma grande atualização para o modelo de raciocínio R1 da start-up chinês, lançado em janeiro. A atualização chegou apenas um mês depois que o QWEN3 do Alibaba Group Holding venceu o Deepseek R1 original em Livebench, um benchmark on-line para modelos de inteligência artificial de código aberto.

O modelo R1-0528 atualizado da DeepSeek agora está ao lado dos modelos de IA líderes do OpenAI e Google no desempenho. O retorno mostra a rapidez com que as grandes empresas de tecnologia e empresas de tecnologia mais recentes estão pressionando para melhorar suas ferramentas de IA.

Em seu comunicado, Deepseek disse que R1-0528 mostra melhores habilidades de raciocínio e escrita criativa. A atualização também traz a capacidade de codificaçãotronGer. Mais importante, a empresa afirma que o modelo agora produz 50% menos "alucinações".

A Deepseek explicou que as atualizações vieram de poder de computação extra investido durante a fase pós-treinamento, quando os engenheiros ajustam um modelo após o principal processo de treinamento. Durante a fase pós-treinamento, os engenheiros visam aumentar a eficiência do modelo e aprimorar sua precisão e segurança.

R1-0528 agora está logo atrás do OpenAi e O4-Mini do Openai

No LivecodeBench, que mede o desempenho do modelo de IA, o R1-0528 agora está logo atrás dos modelos O4-Mini e O3 do Openai.

"A última atualização da Deepseek é mais nítida sobre o raciocínio, otronGer sobre matemática e código e fechando modelos de primeira linha como Gemini e O3", disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão mostra "grandes melhorias na inferência e redução de alucinação" e prova que a start-up não está apenas alcançando, mas competindo ativamente.

O rápido progresso ocorreu depois que Washington restringiu chips avançados e outras exportações de tecnologia para a China. No entanto, as empresas chinesas continuam a refinar seus sistemas. No início deste mês, Baidu e Tencent descreveram maneiras pelas quais estão fazendo seus modelos funcionarem com mais eficiência, apesar do acesso limitado a semicondutores de ponta.

O executivo -chefe da Nvidia, Jensen Huang, criticou os controles de exportação na quarta -feira. "Os EUA basearam sua política na suposição de que a China não pode fazer chips de IA", disse ele. "Essa suposição sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Já faz."

Deepseek aumentou o desempenho do modelo QWEN3 8B do Alibaba em 10%

A Deepseek também disse que destilou as etapas de raciocínio usadas em R1-0528 no QWEN3 8B do Alibaba. Esse processo criou um modelo novo e menor que superou o desempenho da QWEN3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

"Acreditamos que a cadeia de pensamentos da DeepSeek-R1-0528 terá uma importância significativa para pesquisas acadêmicas sobre modelos de raciocínio e trabalho industrial em pequenos modelos", afirmou a empresa.

Segundo a Reuters, um representante do Deepseek disse a um grupo do WeChat que a mudança era uma "atualização de julgamento menor" que já estava aberta para testes públicos. Em resposta à competição mais feroz, o Google desconsiderou algumas camadas de acesso de Gemini, enquanto o OpenAI introduziu o modelo O3 Mini de menor custo.

Academia Cryptopolitan: Cansado de balanços de mercado? Saiba como DeFi pode ajudá -lo a criar renda passiva constante. Registre -se agora

Aviso legal: as informações fornecidas neste site são apenas para fins educacionais e informativos e não devem ser consideradas consultoria financeira ou de investimento.