Logo Computerhoy.com

The Internet Archive está colapsado y la culpa la tiene una IA en proceso de entrenamiento

La inteligencia artificial como arma de doble filo: ciberataques sofisticados pero sistemas mejorados

La IA se ha convertido en un problema para las páginas web que cuentan con una enorme cantidad de información como es el caso de The Internet Archive.

Entrenar una IA no es algo fácil y, de hecho, se necesita una ingente cantidad de información para hacer que tenga la suficiente inteligencia como para conseguir que sea útil. La información de la que se alimenta la IA suele llegar de fuentes accesibles para todo el mundo como es el caso de The Internet Archive.

Sí, hablamos de la página que cuenta con una enorme cantidad de información relacionada con innumerables ámbitos y que es de dominio público. The Internet Archive es uno de los pocos oasis de información que se encuentran dentro de internet y que se nutre de una comunidad de lo más activad en la red.

En el día de hoy, The Internet Archive se ha visto obligada a comunicar a los usuarios que su funcionamiento no está siendo el adecuado y el principal culpable detrás de esto es una IA que se encuentra en entrenamiento y que, por desgracia, está accediendo a toda la información de la página web de forma incesante.

Al acceder de tal manera lo que está causando es que The Internet Archive sufra caídas de forma continúa y, sobre todo, que los usuarios no puedan visitar el enorme archivo de Internet que se almacena dentro de esta página web. Es un grave problema tanto para los usuarios como para la organización sin ánimo de lucro.

The Internet Archive está siendo utilizada para entrenar a una IA

Lo que ha comunicado la propia página web es que se ha detectado un tráfico totalmente irracional y abusivo que llega de la mano de AWS, también conocido, como los servicios de nube de Amazon destinados a la computación. Estos servicios estarían solicitando acceso a la web de forma masiva y constante.

The Internet Archive ha sido la que ofrecido información y conjeturas acerca de lo que está ocurriendo. Según lo comentado alguna empresa estaría recopilando textos de la página web de forma extremadamente incesante que la página se ha caído ya que no ha podido soportar el tráfico generado por todas estas solicitudes.

Está claro que los avances en IA son necesarios y que las empresas necesitan datos, pero resulta cuestionable el poder que tienen las empresas para hacer que, en un momento cualquier, una página web deje de estar disponible debido a que necesitan acceder a datos de forma tan intensiva que los usuarios no pueden disfrutar del contenido ellos mismos han aportado.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.