Logo Computerhoy.com

ChatGPT, Bing, Bard... esta votación con más de 40.000 personas decide cuál es el mejor chatbot

Transformers El despertar de las bestias
Foto del redactor Carolina González ValenzuelaFoto del redactor Carolina González Valenzuela

Redactora de Tecnología

Una web está poniendo a prueba 20 modelos de lenguaje para que las personas hablen con ellos desconociendo con cuál lo hacen y así decidir el chatbot ganador.

Es innegable afirmar que la actualidad está llena de numerosos chatbots como ChatGPT, Bard o Bing que buscan hacerte la vida más fácil. El problema es que cada persona tiene una opinión y nunca se ha podido decidir cuál es todos es el mejor.

Eso ahora ha cambiado gracias a Chatbot Arena, un nuevo campo de pruebas de inteligencia artificial diseñado por UC Berkeley para tratar de descubrir el mejor de todos. Este campo de batalla de la IA enfrenta a 2 modelos de aleatorios entre sí, y luego debes votar cuál te dio la mejor respuesta. Todo, lógicamente, desconociendo cuál de todos responde.

Chatbot Arena alberga actualmente 20 modelos de lenguaje diferentes, incluidos modelos de código abierto de toda la web. En una conversación con PC Mag, el creador, Hao Zhang, dijo que 40.000 personas ya han participado en las votaciones. Zhang considera que la validación por parte de los humanos es fundamental en el desarrollo de modelos de lenguaje e inteligencia artificial generativa.

"Mide principalmente la preferencia humana y su capacidad para seguir instrucciones y hacer la tarea que el humano quiere, lo cual es un factor muy importante para que un modelo sea útil", explica.

inteligencia artificial

La victoria, por el momento, parece más que asegurada para este chatbot

Tras ir poco a poco evaluando los resultados y viendo qué chatbot elige la gente que participa, parece que el ganador está más que claro: GPT-4, que impulsa la versión más pro de ChatGPT, aunque hay que mencionar que el modelo 3.5 que se emplea en el ChatGPT que muchos usan está en cuarta posición.

Según el sistema de puntuación Elo, un método matemático basado en cálculo estadístico, ChatGPT Plus ha obtenido 1.225 puntos. A continuación se encuentran dos versiones de Claude, realizadas por Anthropic, que ocupan el segundo lugar con 1.195 puntos y el tercero con 1.153 puntos. Ni rastro ni mención a Bard, por ejemplo.

"Esta es un área activa de investigación ya que las personas están descubriendo cómo evaluar estos modelos. En 3 meses o 6 meses, la tabla de clasificación de Chatbot Arena probablemente se verá diferente", añade Federico Pascual, quien trabajó anteriormente en Hugging Face.

Foto del redactor Carolina González ValenzuelaFoto del redactor Carolina González Valenzuela

Redactora de Tecnología

Redactora de Tecnología, especializada en inteligencia artificial y ciberseguridad.

Conoce cómo trabajamos en Computerhoy.