Logo Computerhoy.com

Grok, la IA de Elon Musk, ya tiene ojos

Pasito a pasito, la IA de xAI, Grok, va creciendo. Aún es un bebé comparado con los adolescentes de la competencia, pero ya ha abierto los ojos.

Grok Elon Musk
Foto del redactor Juan Antonio Pascual Estapé

Redactor Colaborador

Poco a poco, Grok se acerca a las IAs generativas de Google, OpenAI y compañía. O al menos, eso dicen sus creadores. Grok 1.5v ha obtenido el sentido de la vista, así que ya puede "ver" fotos e imágenes, e interpretar lo que hay.

Con Elon Musk nunca sabes cuándo va en serio, o en broma, desde los tiempos del lanzallamas. Presentó a Grok como una IA generativa gamberra y mal hablada, capaz de decir que el mayor logro de Elon Musk es... convertir a Twitter en un basurero.

Pero Elon Musk, por supuesto, va muy en serio con la IA. Fundó xAI en 2023 con el objetivo de competir con GPT, Gemini y compañía... a su manera.

Grok ya puede analizar lo que ve

Sabemos también que su objetivo último es crear esa app global, la gran X que lo envuelva todo: red social, banco, sistema de pago, asistente, plataformas de compras, etc. Y para eso necesita a la inteligencia artificial.

Grok 1.0, lanzada el pasado mes de noviembre, era un chatbot con bastantes limitaciones, casi un GPT-1, si fuesen comparables. Está disponible para los suscriptores de X Premium Plus.

El pasado mes de marzo estrenó Grok 1.5, con bastante mejoras. Grok ya conversa bastante decentemente, escribe códigos, hace resúmenes, etc.

Build 2024 de Microsoft: Team Copilot, agentes de IA, doblaje de vídeos de YouTube, y más

Según los benchmark de xAI, está al nivel de GPT-4 y Gemini 1.5 Pro en resolución de ciertos problemas matemáticos y otras tareas. Pero como dice The Verge, los benchmark de IA hay que cogerlos con alfileres, porque si las entrenan con sus datos, se vuelven muy buenas con ellos. Es un poco como saber las respuestas del examen, antes de hacerlo.

Ahora xAI está a punto de lanzar Grok 1.5v (la "v" es de visión), una actualización que otorga unos ojos a Grok.

La IA generativa de Elon Musk ya puede interpretar documentos, diagramas, gráficos, capturas de pantalla y fotografías.

Grok 1.5v

xAI

Como vemos en esta captura, enseñándole un diagrama de flujo, Grok es capaz de escribir el código que lo simula.

xAI pone otros ejemplos en su blog. Por ejemplo, puede contar las calorías de los ingredientes de una etiqueta, inventarse un cuento partiendo del dibujo de un niño, explicar el humor de un meme, explicar cómo arreglar un objeto estropeado que se ve en una foto, etc.

Grok 1.5v es un paso en la buena dirección, pero aún le falta muchas maratones para estar a la altura de GPT o Gemini. xAI asegura que, en los próximos meses, Grok también será capaz de trabajar con audio y vídeo.

Conoce cómo trabajamos en Computerhoy.

Etiquetas: Inteligencia artificial, Elon Musk