Las iniciativas surgen como parte de los esfuerzos de la empresa en la creciente competencia de la industria tecnológica contra empresas como Meta, Microsoft y Meta. Pichai también reveló que el último modelo, con capacidades multimodales que se implementarán en todos sus productos, incluida la salida de imagen y audio nativa. El gigante de los motores de búsqueda lanzó Gemini 1.0 en diciembre del año pasado, que según Google era el primer modelo “nativamente multimodal”, lo que sugiere que el modelo podría procesar y responder a consultas de texto, video, imágenes, audio y código. La última versión representa los últimos esfuerzos de Google en la cada vez más competitiva carrera de IA de la industria tecnológica. "Si Gemini 1.0 se trataba de organizar y comprender la información, Gemini 2.0 se trata de hacerla mucho más útil". Pichai. Gemini 2.0 llega casi 10 meses después de que Google lanzara por primera vez 1.5. El modelo todavía se encuentra en una vista previa experimental, según Google, con solo una versión del modelo, el Flash 2.0 más pequeño y de gama baja lanzado. El director ejecutivo de Google DeepMind y jefe de los esfuerzos de inteligencia artificial de la compañía, Demis Hassabis, dijo que este todavía era un gran día para el gigante tecnológico. “Es tan bueno como el modelo Pro actual. Por lo tanto, puede considerarlo como un nivel completamente mejor, con la misma rentabilidad, eficiencia de rendimiento y velocidad. Estamos muy contentos con eso”, explicó Hassabis. Actualmente, sólo los desarrolladores y evaluadores son los primeros en obtener 2.0, mientras que otros usuarios de Gemini tienen acceso al modelo experimental 2.0 Flash, que se basa en 1.5 Flash, que se lanzó como el modelo más rápido y rentable. Según Pichai, la compañía espera agregar las capacidades de razonamiento del nuevo modelo a la función AI Overviews, a la que ahora pueden acceder mil millones de usuarios. Ha indicado que se está convirtiendo en una de las funciones de búsqueda más populares del grupo. Con este nuevo modelo, Pichai destacó además que AI Overviews ahora podrá abordar consultas complejas de varios pasos, por ejemplo, ecuaciones matic y preguntas multimodales. Si bien las pruebas limitadas para el modelo más nuevo comenzaron esta semana, la función de razonamiento solo será accesible para más usuarios a principios del próximo año. Según Google, el modelo de razonamiento se basa en el chip de IA de sexta generación del gigante de los motores de búsqueda, Trillium, que también estuvo disponible para los clientes de Google Cloud el miércoles. En su publicación de blog, Google reveló que el nuevo chip ofrece un rendimiento 4 veces mejor y es un 67% más eficiente energéticamente que su predecesor. Estamos iniciando nuestra era Gemini 2.0 con Gemini 2.0 Flash, que supera a 1.5 Pro en puntos de referencia clave a una velocidad 2X (consulte el cuadro a continuación). Estoy especialmente emocionado de ver el rápido progreso en la codificación, y habrá más por venir. Los desarrolladores pueden probar una versión experimental en IA… pic.twitter.com/iEAV8dzkaW - Sundar Pichai (@sundarpichai) 11 de diciembre de 2024 The Google CEO also announced other features, such as the new Gemini feature known as Deep Research which can act as a research assistant by using advanced reasoning and long context capabilities. This new feature is available in Gemini Advanced and is capable of compiling research reports on behalf of a user. Hassabis said that Gemini 2.0 was laying the foundation for a great 2025. “We really see 2025 as the true start of the agent-based era.” Hassabis. This comes as the company announced the launch of another product, Project Mariner, an experimental new Chrome extension that can literally use a web browser for users. Additionally, Google also announced that Jules – an agent created specifically to help developers find and fix bad code- and a new Gemini 2.0-based agent that can look at users’ screens and help them play video games better. According to Hassabis, the game agent which he calls an “Easter egg” points to it being truly multimodal. A Step-By-Step System To Launching Your Web3 Career and Landing High-Paying Crypto Jobs in 90 Days. Google implementará el modelo en todos los productos
Google anunció una serie de nuevas funciones