Logo Computerhoy.com

Más Allá del Test de Turing : ¿la IA actual cumple las expectativas de esta antigua prueba?

Más Allá del Test de Turing : ¿la IA actual cumple las expectativas de esta antigua prueba?

Desde que Alan Turing propuso el famoso Test de Turing en 1950, se ha buscado incansablemente una forma de evaluar y medir la verdadera inteligencia de las máquinas. En la actualidad muchos tratan de poner a prueba a ChatGPT precisamente con este test, aunque ¿sigue siendo viable o está realmente obsoleto?

La sociedad y muchos medios están continuamente haciéndose eco de que la inteligencia artificial —o en concreto ChatGPT—, han conseguido pasar el codiciado Test de Turing, lo que ha llevado a algunos a declarar que la era de la IA superior al humano finalmente está aquí, cuando eso realmente tiene poco sentido.

Para contextualizar, esta prueba es una medida de la capacidad de una máquina para exhibir un comportamiento inteligente que no se puede distinguir del de un humano. La prueba fue propuesta por el matemático e informático británico Alan Turing en 1950 e involucra a un evaluador humano que entabla una conversación en lenguaje natural con una máquina y un humano.

El evaluador no sabe cuál es cuál y debe determinar quién es la máquina y quién el humano basándose únicamente en sus respuestas a las preguntas y afirmaciones. Si el evaluador no puede distinguir de forma fiable entre la máquina y el ser humano, se dice que la máquina ha superado el test de Turing.

"Si bien el Test de Turing ha sido una referencia importante en el campo de la inteligencia artificial durante décadas, su utilidad actual como una medida definitiva de las capacidades de la IA es bastante discutible. Se considera que es limitado y no proporciona una evaluación completa de las capacidades de la IA", explica para Computer Hoy Óscar Castillo, Responsable global de la práctica de BigData & IA.

Una prueba subjetiva con una lógica bastante acertada

Una de las razones por las que no se puede llevar a cabo una prueba de Turing con ChatGPT es que  está programado específicamente para no pasarla: afirma fácilmente que es un modelo de lenguaje. Esta peculiaridad podría evitarse, ya sea mediante ingeniería o editando manualmente dichas afirmaciones, pero no es necesario/no es su objetivo final.

Con esta aclaración dada, es importante recordar que Turing estaba especulando sobre estas cosas en un momento en que la inteligencia artificial estaba emergiendo por primera vez.

El 'boom' de la inteligencia artificial, una montaña rusa de éxitos y fracasos: ¿qué le depara el futuro?

Lo cierto es que pese a que es una prueba bastante antigua, la base del concepto que se esconde detrás es muy acertado aún estando en 2023. Turing pensó que la conversación humana se encontraba entre las cosas más "inteligentes" que podía hacer una máquina, de ahí esta prueba. 

Mucha gente— entonces y ahora— argumenta que la interacción similar a la humana es un componente esencial de la inteligencia de las personas. Una inteligencia artificial no es buena si su inteligencia está atrapada en un programa que no responde.

Sentada esta base, aclarar que al ser una prueba subjetiva basada en la capacidad de una máquina para imitar respuestas humanas en una conversación, no se centra en principios matemáticos o en una definición precisa de la inteligencia. 

"La inteligencia es un concepto complejo y multifacético que abarca una amplia gama de habilidades y capacidades, incluida la inteligencia emocional, la creatividad, la adaptabilidad y muchas otras dimensiones", añade el experto entrevistado.

El Test de Turing se centra principalmente en la capacidad de una máquina para imitar respuestas humanas en un contexto limitado de conversación, lo que deja de lado muchas otras facetas de la inteligencia. No puede capturar la profundidad y la complejidad de la inteligencia humana en su totalidad con tan solo esto.

Los nuevos y grandes retos en ciberseguridad: inteligencia artificial, 'ransomware' o 'hacktivismo'

Además, la subjetividad de este test —idea de Alan Turing—plantea problemas. La determinación de si una máquina lo ha pasado recae en la percepción y juicio del juez humano, lo que puede variar de uno a otro. Esto puede llevar a resultados sin sentido y, por supuesto, subjetivos.

Dado que la inteligencia es un concepto tan amplio y complejo, evaluar completamente las capacidades de la IA requiere un enfoque más holístico —como un todo— y considerar una variedad de pruebas y métricas que aborden diferentes matices de la inteligencia. 

No existe una prueba definitiva que mida la inteligencia de estas máquinas

Las pruebas y métricas especializadas de la actualidad pueden evaluar habilidades específicas de la IA en aspectos muy particulares, como el reconocimiento de voz, el procesamiento del lenguaje natural o la toma de decisiones.

Por ejemplo, en el campo del procesamiento del lenguaje natural, existen pruebas y desafíos como el Machine Reading Comprehension o el Automatic Machine Translation Evaluation Task que se utilizan para evaluar el rendimiento de los sistemas de IA en esas tareas específicas.

¿Qué es GPT-4 y qué novedades traerá esta inteligencia artificial tan avanzada?

Es por todo esto que se puede afirmar que no hay una prueba definitiva o única que pueda evaluar completamente las capacidades de la inteligencia artificial en todos sus aspectos. Al final ocurre igual que con los miles de test de inteligencia humana que encuentras en Internet: no hay uno solo que englobe todo o sea "el definitivo", tan solo hay diferentes puntos de vista.

"Si bien es posible que nunca exista una prueba definitiva que pueda abarcar todos los aspectos de la inteligencia, los investigadores y científicos de la IA continúan trabajando en el desarrollo de métricas y enfoques más sofisticados para evaluar y comprender mejor las capacidades de esta en diversos contextos y aplicaciones", finaliza Óscar Castillo.

Pese a toda esta crítica, el Test de Turing ha sido un hito importante en el desarrollo de la inteligencia artificial. Sin embargo, hay que tener claro que una IA muy inteligente en un campo determinado puede tener limitaciones enormes en otro.

Desde luego, la evaluación de la inteligencia artificial es un desafío continuo y en evolución aunque está claro que es esencial para impulsar un desarrollo responsable y beneficioso de esta tecnología en la sociedad.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.