Logo Computerhoy.com

Google, Meta y OpenAI se quedan sin datos para entrenar a sus modelos de IA, ¿qué alternativas existen?

Enrique Luque de Gregorio

Google, Meta y OpenAI se quedan sin datos para entrenar a sus modelos de IA, ¿qué alternativas existen?
  • ¿Cómo conseguirán las grandes tecnológicas entrenar sus herramientas de IA en el futuro?
  • Google, OpenAI o Meta ya están buscando alternativas para cuando la información que manejan ahora se agoten. 

Como si se tratase de una mente humana, las inteligencias artificiales deben entrenarse. Es decir, que el conocimiento de esta tecnología se “alimenta” utilizando grandes conjuntos de datos y algoritmos de aprendizaje automático. Estos pueden tener diferentes procedencias, pero todos tienen algo en común: que antes o después se agotarán. 

Ese no es solo un escenario inevitable, sino que las grandes compañías tecnológicas que se quieren llevar el gato al agua con la IA, Google, Meta y OpenAI, lo contemplan con cierta preocupación. 

Sin embargo, lejos de quedarse inmóviles, ya piensan en soluciones posibles a este inconveniente. Algunas más sorprendentes que otras, todo sea dicho. 

¿Cómo se entrena realmente la IA con datos? 

A pesar de las polémicas que se han dado a raíz de supuestas violaciones legales, lo cierto es que la inteligencia artificial se entrena a través de diversos procesos. Pero, sin duda, el más importante de ellos tiene que ver con la adquisición de datos, si bien luego hay un complejo trabajo para que la herramienta sea capaz de validar y ajustar los mismos.

En cualquier caso, lo primero que las compañías hacen consiste en llevar a cabo una recopilación con grandes cantidades de datos relevantes para la tarea que se quiera que la inteligencia artificial realice. Estos datos pueden ser textos, imágenes, vídeos, registros de transacciones, datos de sensores, o casi cualquier tipo de información que se puede imaginar, y que resulte útil de alguna manera.

Teniendo en cuenta esta forma de funcionar, ¿qué sucederá cuando ya no haya datos para entrenar a la inteligencia artificial? ¿Es posible que algo así suceda? En realidad, sí. Así lo ha puesto de manifiesto Epoch, una firma de investigación que se especializa precisamente en todo lo relacionado con la inteligencia artificial. E incluso ha puesto fecha al suceso: pasará en 2026

Entonces, si para entonces la IA ya habrá “exprimido” toda la información existente de la que puede aprender, y con la que entrenarse, ¿qué sucederá a partir de ese momento? La respuesta a esa pregunta podría variar dependiendo de la compañía a la que se lo preguntases. Cada una de ellas ya contempla posibles soluciones al respecto. 

Nuevos tiempos, nuevos datos para la inteligencia artificial

Inteligencia artificial

DepositPhotos

Las grandes potencias tecnológicas ya están pensando de dónde sacar contenidos para seguir alimentando a sus insaciables inteligencias artificiales. En el caso de Google, el plan a seguir podría ser claro: tirar de sus muchas herramientas, como Google Docs, Google Sheets, Google Slides o Google Maps. Algo que ya contempló, aunque después no hizo… al menos de momento. 

Distinto es el caso de Meta, que parece haber recordado aquello de que el conocimiento se encuentra en los libros. Los responsables de Facebook o WhatsApp pensaron en comprar Simon & Schuster, una importante editorial que trabaja con autores como Stephen King. Tampoco descartan simplemente pagarle para poder acceder directamente a sus trabajos. 

Más compleja es la opción que contempla OpenAI, los padres de ChatGPT. Sam Altman ya ha comentado en alguna ocasión que podrían acudir a la información sintética; es decir, datos que son generados por los propios sistemas de inteligencia artificial. Una posibilidad sumamente práctica, pero que aún estaría en desarrollo. 

Así pues, es difícil saber cómo se podrá seguir entrenando a la IA en el futuro, lo que está claro es que, de una forma u otra, se seguirá haciendo. Siempre y cuando, por supuesto, esta tecnología no provoque el fin del mundo antes, como algunos temen

Conoce cómo trabajamos en Computerhoy.