Logo Computerhoy.com

He probado Gemini y GPT-4 en Copilot: hay una IA que gana por su reconocimiento de imágenes

Copilot en Bing vs Google Gemini IA

Computer Hoy

Foto del redactor Abraham AndreuFoto del redactor Abraham Andreu

Redactor Tecnología

  • Tanto Google como Microsoft permiten acceder a sus chatbot impulsados por inteligencia artificial de forma totalmente gratuita, con los últimos modelos.
  • He probado Google Gemini Pro y Copilot en Microsoft Bing, este último impulsado por GPT-4 de OpenAI, y creo que hay un ganador claro, sobre todo por el reconocimiento de imágenes.

Si has seguido las últimas actualizaciones en inteligencia artificial de los últimos meses, habrás notado que casi todos los nombres han cambiado.

A la par que Microsoft llevó Copilot a casi todos sus servicios, Google cambió a Bard por Gemini, el modelo de aprendizaje que reside en el núcleo mismo del chatbot, pasando a tener Gemini Pro disponible en la versión gratuita.

En resumen: mientras que Copilot en Bing utiliza el modelo de GPT-4, desarrollado por OpenAI, Google tiene detrás a Gemini, con el modelo Ultra 1.5 para Gemini Advanced, el más avanzado de todos los presentados por la multinacional.

Tanto en GPT como en Gemini, podrás acceder a las opciones gratuitas que ofrecen, disponibles en otros servicios en el caso de Microsoft, ya que integra GPT-4 para el buscador de Copilot en Bing.

¿Quieres usar ChatGPT en tu día a día? El chatbot es perfecto para estas tres tareas, según Sam Altman

Así, he probado el modelo de GPT-4 de Copilot a la vez que Gemini Pro, ya que de otra forma la IA de Google superaría considerablemente al modelo 3.5 de GPT que ofrece OpenAI a quienes no quieran pagar, por contar con funciones adicionales, como imágenes, voz, etc.

 

Tras poner a prueba ambos modelos, creo que tengo un claro vencedor, aunque en ambos casos aún queda mucho margen de mejora.

Misma consulta, diferentes respuestas

Google Gemini vs Copilot en Bing

Computer Hoy

Una de las cuestiones más importantes para estos chatbots de IA preparados para responder en lenguaje natural consiste en ofrecerles un prompt o indicación lo más ajustado posible.

En mi caso, he pedido a ambos lo siguiente: "¿Cuál es el chatbot que ofrece las respuestas más precisas? Enumera las ventajas y desventajas de Gemini Pro de Google en comparación con Copilot en Microsoft Bing, como si fueras experto en inteligencia artificial".

Las 2 plataformas han ofrecido respuestas muy bien organizadas en ventajas y desventajas, de forma bastante objetiva, en base a la información que han encontrado en internet.

No obstante, mientras que Copilot no ha respondido atendiendo a la solicitud "como si fueras experto en inteligencia artificial", Gemini sí ha tenido esta indicación en cuenta y, adicionalmente, ofrece 3 versiones de la misma respuesta.

Por si fuera poco, permite acceder a la comprobación de Google, un botón directo que evalúa las respuestas según las fuentes que ha encontrado en su propio buscador, algo que Copilot en Bing no tiene.

Google Gemini vs Copilot en Bing

Computer Hoy

A esto se suma que, aunque ambos no se meten en terrenos pantanosos al responder (más aún cuando se trata de competencia directa), Gemini sí se moja al recomendar cuál es el mejor chatbot.

"Si busca un chatbot con respuestas precisas y actualizadas sobre una amplia gama de temas, Gemini Pro es una buena opción. Si necesita asistencia para tareas específicas como la generación de código o la búsqueda de información, Copilot puede ser más útil", responde Gemini.

Y, en el párrafo inmediatamente posterior, se aventura también a recomendar lo que hago en este análisis: probar ambas herramientas para comprobar cuál se adapta mejor al tipo de usuario que seas.

"Para obtener la mejor experiencia, se recomienda probar ambos chatbots y evaluar cuál se adapta mejor a sus necesidades", recomienda Gemini.

Ahora bien, ambos modelos permiten buscar imágenes. En este sentido, Gemini parece ser mucho más rápido y concreto que Copilot.

Gemini reconoce imágenes mucho más rápido

Hace unos días, visité la plaza de Santa Ana en Madrid, la que cuenta con una estatua del gran Federico García Lorca, cuya mirada se posa directamente en el Teatro Español, uno de los más emblemáticos de la capital.

Aprovechando que es una fotografía propia, he preguntado a ambos modelos mediante la búsqueda de imágenes, con el objetivo de que identifiquen el lugar de la foto, sin dar ninguna pista.

Como puedes ver, existen varias pistas en la fotografía, como la placa inferior de la propia estatua, pero tampoco hay más indicaciones.

Google Gemini vs Copilot en Bing

Computer Hoy

Por su lado, Copilot ha tardado mucho en cargar la información del lugar y, en su primera respuesta, no ha ofrecido el lugar concreto; por el contrario, Gemini ha descrito a la perfección la plaza de Santa Ana y los lugares icónicos en derredor

En este sentido, Copilot da varios pasos para ofrecer la respuesta final, mientras que Gemini borda el reconocimiento de imágenes, un punto muy positivo para el chatbot de Google.

Google Gemini vs Copilot en Bing

Computer Hoy

Pero aún hay más, ya que ambas permiten acceder a funcionalidades relacionadas con la accesibilidad, como la búsqueda por voz o la lectura en voz alta de las respuestas. En este apartado, la batalla está muy igualada.

Copilot vence en accesibilidad

Ya sea por elección personal o por tener algún tipo de discapacidad visual, el reconocimiento de voz y la lectura de la respuesta, es esencial para muchos usuarios que prefieren contar con esta opción.

Tanto en Copilot como en Gemini tienes a tu disposición poder preguntar en voz alta a los chatbots, aunque con ligeras diferencias.

Las entradas de voz son iguales en los 2, ya que solo tendrás que dar permisos en tu navegador y dictar lo que quieras pedirles, aunque el modo de ofrecer la respuesta no es la misma.

Google Gemini vs Copilot en Bing

Computer Hoy

Mientras que Copilot te dictará automáticamente el contenido de la respuesta, sin que tengas que seleccionar manualmente esta funcionalidad, en Gemini tendrás que elegir este modo de forma manual.

No es una gran diferencia, pero al tratarse de una cuestión de accesibilidad, el modus operandi de Copilot es mucho mejor en este caso.

Conclusión: ¿Es mejor Copilot o Gemini?

Tras tratar a ambos modelos por igual, creo que Gemini me ha parecido mucho más acertado en las respuestas, aunque Copilot ofrece las fuentes directamente; en el de Google, tendrás que optar por la doble comprobación.

Aunque los prompts y las respuestas son realmente parecidas, Gemini parece algo menos "vago" que GPT-4 en Copilot, al que le cuesta concretizar la indicación; por ejemplo, con responder cuestiones como un "experto", como has podido ver aquí.

En esta misma línea, Google Gemini afina muchísimo más las respuestas en torno a las imágenes que le ofrezcas: no es lo mismo describir simplemente la imagen que ofrecer la ubicación exacta ya de primeras.

Así, Google Gemini parece reconocer mucho mejor las fotografías que Copilot. 

Sin embargo, creo que en accesibilidad el claro vencedor es Copilot en Bing, ya que lee las respuestas en voz alta, un plus para aquellas personas con problemas de accesibilidad relacionados con esto.

En definitiva, no hay gran diferencia entre ambos, pero en mi caso el punto que más me ha convencido es el de las imágenes y, en ese ámbito, Google Gemini vence claramente a Copilot en Bing.

Foto del redactor Abraham AndreuFoto del redactor Abraham Andreu

Redactor Tecnología

Soy redactor de Tecnología en Axel Springer España. Me encontrarás analizando productos, en vídeos y escribiendo reportajes del sector tecnológico.

Conoce cómo trabajamos en Computerhoy.