tradingkey.logo

Microsoft presenta Phi-4, un nuevo modelo de IA generativa: aquí está el paquete

Cryptopolitan13 de dic de 2024 9:03

Phi-4: rendimiento mejorado en razonamiento matic

Microsoft ha posicionado a Phi-4 como líder en resolución de problemas matic , citando mejoras sustanciales en el rendimiento tanto con respecto a sus predecesores como a modelos comparables. La compañía dent en las capacidades del modelo de IA después de que, según se informa, Phi-4 obtuvo las mejores calificaciones en varios puntos de referencia estandarizados.

Microsoft presenta Phi-4, un nuevo modelo de IA generativa: aquí está el paquete
Fuente: Microsoft

En la prueba GPQA, obtuvo una puntuación de 56,1, superando el 40,9 de GPT-4o y el 49,1 de Llama-3. En la prueba de referencia MATH, Phi-4 logró 80,4, lo que refleja sus capacidades avanzadas para abordar problemas matic complejos. También se destacó en pruebas de codificación, logrando una puntuación de 82,6 en HumanEval.

Además, Phi-4 demostró su destreza en escenarios del mundo real, incluidas altas puntuaciones en problemas de las competiciones estadounidenses de matic de la Asociación de matic de Estados Unidos (AMC-10/12). Estos resultados indican aplicaciones potenciales en la investigación científica, la ingeniería y la modelación financiera, campos donde la precisión y el razonamiento matic son críticos.

Microsoft presenta Phi-4, un nuevo modelo de IA generativa: aquí está el paquete
Fuente: Microsoft

Mientras que los modelos más grandes como el GPT-4o de OpenAI y el Gemini Ultra de Google operan con cientos de miles de millones o incluso billones de parámetros, Phi-4 demuestra que las arquitecturas más pequeñas y optimizadas pueden lograr un rendimiento superior en tareas especializadas.

Microsoft atribuye los avances de Phi-4 a la integración de datos sintéticos de alta calidad junto con conjuntos de datos de contenido generado por humanos, así como a mejoras no reveladas realizadas durante la capacitación posterior. Estos esfuerzos reflejan una tendencia más amplia en la industria de la IA , donde los equipos de investigación se centran cada vez más en innovaciones en el uso de datos sintéticos y la optimización posterior al entrenamiento.

El director ejecutivo de Scale AI, Alexandr Wang, destacó recientemente este cambio y señaló que la industria se ha topado con un “muro de datos previo al entrenamiento” y agregó que las empresas ahora se apresurarán hacia el desarrollo de modelos de IA más eficientes.