Logo Computerhoy.com

¿Qué es GPT-4 y qué novedades traerá esta inteligencia artificial tan avanzada?

El último modelo de lenguaje de OpenAI, GPT-4, se ha anunciado oficialmente, pero ¿qué es? ¿qué diferencias existen con respecto a la versión anterior? ¿es realmente toda una revolución en el campo de la inteligencia artificial?

El último lanzamiento de OpenAI, GPT-4, es el modelo de inteligencia artificial más poderoso e impresionante hasta el momento de la compañía detrás de ChatGPT y DALL-E. 

Ya disponible para algunos usuarios de ChatGPT, GPT-4 ha sido entrenado en una red de supercomputación en la nube masiva que vincula miles de GPU, diseñadas a medida y construidas en conjunto con Microsoft Azure.

La compañía ha dado a conocer los poderes del modelo de lenguaje en su blog diciendo que es más creativo y colaborativo que nunca. Mientras que ChatGPT con tecnología GPT-3.5 solo aceptaba entradas de texto, GPT-4 también puede usar imágenes para generar subtítulos y análisis. Pero eso es solo la punta del iceberg.

Es por eso que en este reportaje aprenderás qué es GPT y por supuesto qué es GPT-4, cuáles son las mejoras con su anterior versión y cómo acceder a él.

¿Qué es GPT-4? ¿Es lo mismo que ChatGPT?

Para explica correctamente qué es GPT-4, es necesario antes de nada explicar qué es GPT. Generative Pre-trained Transformers (GPT) o traducido como Transformers Preentrenados Generativos son un tipo de modelo de aprendizaje profundo que se utiliza para generar texto similar al humano. Los usos comunes incluyen:

  • Responder preguntas
  • Realizar resúmenes
  • Traducir texto a otros idiomas
  • Genera código
  • Crear publicaciones de blog, guiones, historias, conversaciones y otros tipos de contenido

Existen infinitas aplicaciones para los modelos GPT, e incluso puede ajustarlos en datos específicos para crear resultados aún mejores y ahí es donde entra en juego GPT-4.

El efecto ChatGPT: las redes sociales también se beneficiarán de la inteligencia artificial

Esta es la cuarta versión de estos modelos desarrollados por OpenAI, la empresa de inteligencia artificial más potente en la actualidad. Este es un gran modelo multimodal y fue anunciado el 14 de marzo de 2023

Los modelos multimodales pueden abarcar más que solo texto: GPT-4 también acepta imágenes como entrada. Mientras tanto, GPT-3 y GPT-3.5 solo operaban en una modalidad, texto, lo que significaba que los usuarios solo podían hacer preguntas escribiéndolas.

GPT-4: el nuevo modelo de lenguaje de IA que quiere romper todos los esquemas y mejorar ChatGPT

Además de la nueva capacidad para procesar imágenes, OpenAI dice que GPT-4 también "exhibe un rendimiento a nivel humano en varios puntos de referencia académicos y profesionales".

Por supuesto, si te preguntas si es lo mismo que el famoso ChatGPT, no exactamente. Si ChatGPT es el coche, entonces GPT-4 es el motor: una poderosa tecnología general que puede adaptarse a varios usos diferentes. 

¿Qué hace que este modelo sea mejor que la versión anterior?

Ahora funciona también con imágenes

El cambio más notable de GPT-4 es que es multimodal, lo que le permite comprender más de una modalidad de información. GPT-3 y GPT-3.5 de ChatGPT estaban limitados a la entrada y salida de texto, lo que significa que solo podían leer y escribir. Sin embargo, GPT-4 puede recibir imágenes y pedirle que comprenda esta información.

Por ejemplo, en el informe de OpenAI mostrando la herramienta enseñaron a GPT-4 una imagen con ingredientes y le preguntaron qué recetas se podían hacer con ellos. En un principio respondió con los elementos que aparecen en la imagen, osea los reconoce y luego empezó a dar multitud de recetas.

GPT-4

Parámetros: más no es sinónimo de mejor

En cuanto a las diferencias con los anteriores modelos, una que hay que recalcar desde un comienzo se basa en el concepto de “Más poder en una escala más pequeña”. OpenAI, tal y como acostumbra, es muy cautelosa a la hora de ofrecer toda la información y los parámetros utilizados para entrenar en este caso a GPT-4.

Por el momento se sabe que GPT-3 cuenta con 175.000 millones de parámetros y se estima que GPT-4 lo supere pero no con una abismal diferencia como ha circulado por redes sociales.

Con respecto a las suposiciones que muchos medios hacen sobre los parámetros con los que GPT-4 está entrenado, comentar que OpenAI ya ha confirmado que se está guardado esta información con el objetivo de protegerse de la competencia. Es decir, prefiere no decirla para evitar que otras empresas como Google, que desarrollan también grandes modelos de lenguaje, tengan una referencia a batir.

Con herramientas como ChatGPT ya se ha demostrado que el número de parámetros no lo es todo, sino que la arquitectura, y la calidad también desempeñan un papel importante en el entrenamiento.

Los modelos lingüísticos más pequeños, como Gopher (280.000 millones de parámetros) y Chinchilla (70.000 millones de parámetros), ya han demostrado que pueden seguir el ritmo de los modelos de lenguaje natural más grandes, como Megatron-Turing (que ostenta el título de la mayor red neuronal, con 530.000 millones de parámetros).

Es más difícil de engañar

Uno de los mayores inconvenientes de los modelos generativos como ChatGPT y Bing es su propensión a salirse del camino de vez en cuando, generando información tóxica que alarma a las personas. También pueden confundir los hechos y generar información errónea.

OpenAI dice que pasó 6 meses entrenando a GPT-4 usando lecciones de su "programa de pruebas adversarias" así como también de ChatGPT, lo que resultó en los "mejores resultados de la compañía en cuanto a factualidad, capacidad de dirección y rechazo a salirse de las barreras de seguridad".

Cómo revolucionará ChatGPT el mundo de la educación (con expertos)

Puede procesar mucha más información a la vez

Los modelos de lenguaje grande (LLM) pueden haber sido entrenados en miles de millones de parámetros, lo que significa innumerables cantidades de datos, pero hay límites en la cantidad de información que pueden procesar en una conversación. 

El modelo GPT-3.5 de ChatGPT podría manejar 4.096 tokens o alrededor de 8.000 palabras, pero GPT-4 bate esos números hasta 32.768 tokens o alrededor de 64.000 palabras.

Este aumento significa que mientras que ChatGPT podía procesar 8.000 palabras a la vez antes de que comenzara a perder la noción de las cosas, GPT-4 puede mantener su integridad durante conversaciones mucho más largas. También puede procesar documentos largos y generar contenido de formato grande, algo que estaba mucho más limitado en GPT-3.5.

Más allá de ChatGPT: 15 herramientas de inteligencia artificial de gran utilidad

Una precisión mejorada

OpenAI admite que GPT-4 tiene limitaciones similares a las versiones anteriores, afirmando que todavía no es completamente confiable y comete errores de razonamiento. 

Sin embargo, GPT-4 reduce significativamente las alucinaciones (invenciones) en relación con los modelos anteriores y obtiene una puntuación un 40% más alta que GPT-3.5 en las evaluaciones de factualidad. Será mucho más difícil engañar a GPT-4 para que produzca resultados no deseados, como discursos de odio e información errónea.

GPT-4

Más idiomas

Si bien el inglés sigue siendo su primer idioma, GPT-4 da otro gran paso adelante con sus capacidades multilingües. Es casi tan preciso en mandarín, japonés, anfricano, indonesio, ruso y otros idiomas como lo es en su lengua materna. De hecho, es más precisa en punjabi, tailandés, árabe, galés y urdu que la versión 3.5 en inglés. 

Por lo tanto, es verdaderamente internacional y su aparente comprensión de los conceptos, combinada con habilidades de comunicación sobresalientes, podría convertirlo en una herramienta de traducción verdaderamente de siguiente nivel.

Ya se está utilizando en productos convencionales

Como parte del anuncio de GPT-4, OpenAI compartió varias organizaciones que actualmente ya está usando el modelo.

Estos incluyen una función de tutor de IA desarrollada por Kahn Academy que está destinada a ayudar a los estudiantes con los trabajos y ofrecerles a los profesores ideas para las lecciones, y una integración con Duolingo que promete una experiencia de aprendizaje interactivo similar.

La oferta de Duolingo se llama Duolingo Max y agrega dos nuevas funciones. Uno te dará una "explicación simple" sobre por qué tu respuesta para un ejercicio fue correcta o incorrecta y te permitirá pedir otros ejemplos o aclaraciones. 

Duolingo

El otro es un modo de "juego de roles" que te permite practicar el uso de un idioma en diferentes escenarios, como pedir café en francés o hacer planes para ir de excursión en español (actualmente, esos son los únicos dos idiomas disponibles para la función). 

Intercom, por otro lado, anunció recientemente que está actualizando su bot de atención al cliente utilizando el modelo, prometiendo que el sistema se conectará a los documentos de soporte de una empresa para responder preguntas, mientras que el procesador de pagos Stripe está usando el sistema para responder las preguntas de los empleados.

Finalmente, en la actualidad solo se puede acceder a las capacidades de imagen de GPT-4 a través de una sola aplicación: Be My Eyes Virtual Volunteer. Esta app para personas ciegas y con problemas de visión, les permite tomar fotos del mundo que les rodea y solicitar información útil a GPT. 

Cómo obtener acceso a GPT-4

OpenAI aún tiene que hacer que las capacidades de entrada de imágenes de GPT-4 estén disponibles a través de cualquier plataforma porque la empresa de investigación está colaborando con un solo socio para comenzar. Sin embargo, hay formas de acceder a las capacidades de entrada de texto de GPT-4.

La mejor forma de acceder es con una suscripción a ChatGPT Plus, que garantiza a los suscriptores acceso al modelo al precio de 20 dólares al mes. Sin embargo, incluso a través de esta suscripción, habrá un límite de usuarios, lo que significa que es posible que no puedas acceder a él cuando lo desees, algo que debes considerar antes de realizar la inversión.

Eso sí, hay una forma gratuita de acceder a la capacidad de texto de GPT-4 y es usando Bing Chat. El día en que OpenAI presentó GPT-4, Microsoft compartió que su propio chatbot, se había estado ejecutando en una versión algo más light de GPT-4 desde su lanzamiento hace cinco semanas. Es de uso gratuito, pero requiere registrarse a través de una lista de espera.

Conoce cómo trabajamos en ComputerHoy.

Etiquetas: Inteligencia artificialVídeo, Programación, Software