04 de Diciembre de 2020 | La Realidad Política
El Discurso - La realidad política  El Discurso - FacebookEl Discurso - Twitter

Algoritmo descifra de forma automatica lenguas perdidas

El Discurso
Jueves, 22 de Octubre de 2020

Con el nuevo sistema, el algoritmo infiere la relacin entre los idiomas. Esta pregunta es uno de los mayores desafos del desciframiento.       ver galería

Un nuevo algoritmo demostr ser capaz de descifrar automticamente una lengua perdida, sin necesidad de conocimientos avanzados de su relacin con otras.

El objetivo del equipo de investigadores del Laboratorio de Ciencias de la Computacin e Inteligencia Artificial del Instituto Tecnolgico de Massachusetts (MIT, por sus siglas en ingls) es que el sistema pueda descifrar idiomas perdidos que han eludido a los lingistas durante dcadas, utilizando slo unos pocos miles de palabras.

Encabezado por la profesora Regina Barzilay, el sistema se basa en varios principios sustentados en conocimientos de la lingstica histrica, como el hecho de que los idiomas por lo general slo evolucionan de ciertas formas predecibles. Por ejemplo, si bien un idioma determinado rara vez agrega o elimina un sonido completo, es probable que se produzcan ciertas sustituciones de sonido. Una palabra con una p en el idioma principal puede cambiar a una b en el descendiente, pero el cambio a una k es menos probable debido a la brecha significativa de pronunciacin.

Al incorporar stas y otras limitaciones lingsticas, Barzilay y el estudiante de doctorado del MIT Jiaming Luo desarrollaron un algoritmo de descifrado que puede manejar el vasto espacio de posibles transformaciones y la escasez de una seal de gua en la entrada.

Incrusta sonidos

El algoritmo aprende a incrustar los sonidos del lenguaje en un espacio multidimensional donde las diferencias en la pronunciacin se reflejan en la distancia entre los vectores correspondientes. Este diseo les permite captar pautas pertinentes de cambio de lenguaje y expresarlos como restricciones computacionales. El modelo resultante puede segmentar palabras en un idioma antiguo y asignarlas a sus contrapartes en otro relacionado.

El proyecto se basa en un documento que Barzilay y Luo escribieron el ao pasado donde descifraron las lenguas muertas ugartico (lengua semtica) y lineal B (sistema de escritura usado para escribir el griego micnico) la ltima de las cuales ha tradado dcadas en ser decodificada. Sin embargo, una diferencia clave con ese proyecto fue que el equipo saba que estos idiomas estaban relacionados con las primeras formas del hebreo y el griego, respectivamente.

Con el nuevo sistema, el algoritmo infiere la relacin entre los idiomas. Esta pregunta es uno de los mayores desafos del desciframiento. En el caso de lineal B, se necesitaron varias dcadas para descubrir el descendiente conocido correcto. Para el bero, los estudiosos an no pueden ponerse de acuerdo sobre el idioma relacionado: algunos defienden el euskera, mientras otros refutan esta hiptesis y afirman que el bero no se relaciona con ningn idioma conocido.

El algoritmo propuesto puede evaluar la proximidad entre dos idiomas; de hecho, cuando se prueba en idiomas conocidos, incluso puede identificar con precisin familias de ellos. El equipo aplic su algoritmo al bero considerando al vasco, as como a los candidatos menos probables de las familias romance, germnica, turca y urlica.

Si bien el vasco y el latn estaban ms cerca del bero que otros, todava eran demasiado diferentes para considerarlos relacionados.

Copyright © 2020 El Discurso · eldiscurso.com.mx
powered by

Visitas: 7157004