Home >
Life

Estudiante resuelve un misterioso algoritmo con 2.500 años que permitirá llevar el sánscrito a los ordenadores

1 ago. 2023 18:30h.

Depositphotos

Un estudiante de doctorado de Cambridge consigue descifrar un antiguo enigma gramatical. Su hallazgo permitirá a los ordenadores poder transcribir uno de los idiomas más antiguos del mundo: el sánscrito.

El sánscrito es la más antigua de las lenguas indoeuropeas. Se trata de una lengua ancestral asociada a la cultura, la religión y la literatura de la India. Sin embargo, hasta ahora contaba con problemas para ser generada por ordenadores correctamente. Hoy, 2.500 años después, un estudiante de doctorado de la Universidad de Cambridge lo ha hecho posible.

El idioma sánscrito que significa “refinado” o “cultivado” proviene del año 2000 a. C. Eran tiempos de algunas de las obras más antiguas de la humanidad como los Vedas, himnos religiosos, o posteriormente poemas épicos como el Mahabarata o el Ramayana. Su riqueza es totalmente incalculable en términos culturales.

Bajo el océano de la India hay un agujero gravitacional 10 veces más grande que España, y ya han descubierto su origen

Bajo el océano de la India hay un agujero gravitacional, y ya han descubierto su origen

Siendo uno de los idiomas más ricos, extensos y antiguos del mundo, también fue el primer idioma en tener reglas gramaticales plasmadas. Teniendo en cuenta la prevalencia de la tradición oral en India, Pāṇini, considerado por muchos el padre de la lingüística, creó una “máquina de lenguaje” en el 360 a. C.

Su intención era que los textos no se pervirtieran con el tiempo y mantuvieran su forma perfecta, que todos pudieran escribir bien y con facilidad, memorizando sus reglas y aplicándolas de una manera pragmática.

Su sistema, Aṣṭādhyāyī, es el ejemplo más antiguo que se conserva de un texto lingüístico completo y se compone de hasta 4.000 reglas o sutras que se aplican a cada palabra que se escribe en el texto. Es necesario puntualizar que esta gramática “perfecta” era una cuestión importante en la India, pues se trataba de una cuestión religiosa en sus textos sagrados.

El problema del sánscrito: las meta-reglas

Cuando Rishi Rajpopat decidió comenzar su doctorado en Cambridge encontró que no existía una convención universal sobre qué términos se supone que deben o pueden convertirse en una cierta regla. La intención de la “máquina de lenguaje” de Pāṇini era que fuera autoreferencial y sencillo, para ser rápido de memorizar.

Solo hay una meta regla dada por Pāṇini: “En caso de conflicto entre dos reglas de igual fuerza, gana la regla que viene después en el orden serial de Aṣṭādhyāyī”. O al menos esta era la interpretación que se daba hasta hoy. El problema radica en que se necesitaban más y más meta reglas en cada conflicto.

Meta entrena su IA con la Biblia, y no es por motivos religiosos

Rajpopat sospechaba que la clave debía ser mucho más sencilla, puesto que el sistema de lenguaje era para facilitar la escritura. El hecho de que tuvieran que escribir nuevas reglas sobre las de Pāṇini era algo extraño.

“Pāṇini tenía una mente extraordinaria y construyó una máquina sin igual en la historia humana. No esperaba que agregáramos nuevas ideas a sus reglas. Cuanto más jugueteamos con la gramática de Pāṇini, más nos elude”, dijo Rajpopat en un comunicado de prensa recogido por FreeThink.

Un error desde el principio, hace 2.500 años

Durante nueve meses trabajó intentando encontrar la clave sin éxito. Una y otra vez revisaba las 4.000 sutras en Cambridge, pero la solución se le escapa, y el tiempo se le agotaba. Después, como si se tratara de una lección antigua, un cuento de enseñanzas escrito en sánscrito, decidió marcharse de vacaciones, meditar, disfrutar, viajar. Un mes después dio con la clave.

Al regresar, una frase llamó su atención y probó una alternativa, debía confiar en la genialidad del lingüista que quiso crear un sistema perfecto, elegante, sencillo y fácil de memorizar y no una sucesión de normas una tras otra. Así llegó al error.

El primer estudiante del Aṣṭādhyāyī había malinterpretado la única meta regla que les había dado el maestro. Durante 2.500 años habían estado usando mal la “máquina del lenguaje” y ese primer paso en falso había complicado desde entonces.

Rajpopat reinterpretó la regla dentro del propio evento. En lugar de dar preferencia a la última regla en orden de serie, se remitió a la palabra siguiente en la oración. Debido a que el sánscrito se escribe de izquierda a derecha, eso significaba aplicar la regla correspondiente a la palabra de la derecha.

Ejemplo: “devāḥ prasannāḥ mantraiḥ” (“Los mantras complacen a los dioses”). Rajpopat señala que surge un conflicto de reglas cuando se trata de derivar la palabra mantraih (“por los mantras”). Una regla se aplica a la palabra de la izquierda, mantra, y otra a la palabra de la derecha, bhis. Al aplicar su interpretación de la meta-regla, siguió la regla para bhis y llegó a la forma correcta.

El avance permitirá la inclusión del sánscrito en ordenadores

Después comenzó a comprobar una y otra vez los errores gramaticales que se solucionaban con meta-reglas y encontró que su fórmula, una y otra vez, daba lugar a la forma gramatical perfecta. Su redescubrimiento permitirá utilizar este algoritmo para introducir el sánscrito, con toda la cultura que ello conlleva, a los ordenadores.

Los avances lingüísticos, en este caso en el sánscrito, como ya sucedió con la inclusión de inteligencia artificial para la traducción del lenguaje cuneiforme acadio, suponen un avance cultural sin precedentes que puede desvelarnos más de nuestra historia, cultura y quien sabe qué más misterios. Después de todo, la India siempre ha sido una fuente de inspiración en cientos de sectores.

Otros artículos interesantes:

Descubre más sobre Raúl Barrón, autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.

Etiquetas: India