Logo Computerhoy.com

Google estrena Gemini, su nueva IA multimodal más potente que GPT-4: comienza una nueva era

Google estrena Gemini, su nueva IA más potente que GPT-4

Olvídate de lo que sabes o has probado hasta ahora de la IA de Google. Gemini es la inteligencia artificial que Google lleva una década desarrollando. La IA que iba a darle el monopolio del mercado, como hizo el buscador de Google hace tres décadas... si no llega ser por la arrolladora irrupción de OpenAI y GPT, que pilló a todos por sorpresa.

Google siempre ha presumido de ser la compañía pionera en el mercado de la inteligencia artificial. Lleva casi una década desarrollando modelos de IA. Seguramente Gemini iba a ser un gran estreno, pero OpenAI se les adelantó con ChatGPT.

Hoy, según ha dicho el CEO de Google, Sundar Pichai, comienza una nueva era: la era de Gemini, la inteligencia artificial multimodal capaz de trabajar con texto, audio, vídeo, imágenes, código, y otro contenido. Y ya está disponible dentro de Bard.

Qué es Gemini, la nueva IA que supera a GPT-4

Compañías como OpenAI, Meta y otras, disponen de modelos de lenguaje especializados para cada tarea. Por ejemplo, ChatGPT se basa en texto, DALL-E en imágenes, y Whisper en el audio. Cada IA se especializa en un "sentido".

Si ChatGPT tiene una petición de imágenes, usa DALL-E para generarla. Colaboran entre sí. El enfoque de Gemini es muy diferente.

Gemini es el nuevo modelo de lenguaje grande (LLM) de Google que, según sus creadores, supera ampliamente a GPT-4. Es más potente en 30 de 32 benchmarks en donde lo han probado. 

ChatGPT ya es tan humano como nosotros: si le das una propina, ofrece mejores respuestas

Gemini es una IA multimodal: puede trabajar al mismo tiempo con texto, vídeo, imágenes, audio, código, etc. Esto, en teoría, hará que sea más rápida y precisa que usar varias IAs especializadas. Google asegura que, con el tiempo, irá añadiendo nuevos "sentidos". Incluyendo el tacto de los robots.

Gemini promete ser también la mejor a la hora de corregir y revisar código. Integra la nueva versión AlphaCode 2, que es el doble de potente que su predecesora. Y, según Google, supera al 85% de la competencia, generando código seguro y estable.

Las tres versiones de Gemini

Otra característica interesante es que existen tres versiones de la IA: Gemini Nano, Gemini Pro, y Gemini Ultra.

Gemini Nano es una versión recortada basada en texto, tipo ChatGPT, que puede funcionar en los móviles en modo local, sin necesidad de acceder a la nube. La acaba de integrar en los Pixel 8 Pro.

Modelos de lenguaje de IA Google Gemini

Google

Gemini Pro será la versión que se integrará en los servicios de Google, con funciones similares a ChatGPT, DALL-E, Whisper, Stable Diffusion, etc. Será la que usen la mayoría de los usuarios individuales en ordenadores, o en móviles conectados a la nube. Gemini Pro acaba de integrarse en Google Bard.

Finalmente, Gemini Ultra, que no estará disponible hasta principios de año, es la versión premium para servidores y empresas.

En su blog, Google se muestra convencida de que Gemini va a marcar un antes y un después en el mercado de la inteligencia artificial, como en su momento hizo con su buscador. La teoría es muy prometedora, pero aún queda por comprobar cómo funciona en la práctica. Como hemos comentado, Gemini Pro ya está disponible a través de Google Bard, aunque solo en inglés, y para países anglosajones.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.