Tecnología para acercarse a la lengua purépecha

La tesis de Miguel Soriano, egresado de Ingeniería Mecatrónica, desarrolló un proyecto conjunto con la UNAM para traducir del español al purépecha

Miguel Salvador Soriano García es egresado de Ingeniería Mecatrónica del CULagos. Recientemente presentó su tesis Traductor automático español – purépecha mediante OpenNMT, con la cual se tituló a nivel pregrado. Miguel decidió este proyecto gracias a una experiencia en el Verano de la Investigación Tecnológica y del Pacífico, mejor conocido como Programa Delfín; durante esta estancia trabajó en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), de la UNAM, con el doctor Iván Vladimir Meza Ruiz. En dicha oportunidad, la colaboración de Miguel con el doctor Iván estuvo enfocada a chat bot conversacionales: programas montados, por ejemplo en Facebook, que responden cual si fueran personas. A partir de este vínculo surgió la propuesta de continuar colaborando, ahora para desarrollar un traductor purépecha - español, considerando que en la UNAM ya se ha trabajado anteriormente en un traductor del wixárika al español y se busca abarcar más lenguas de nuestro país.
 
El objetivo de este trabajo es propiciar el acercamiento entre los hablantes de purépecha y español, además de contribuir a la conservación de esta lengua originaria del territorio mexicano. Esta herramienta está diseñada para la traducción de textos simples, como primera interacción entre ambos idiomas. Para desarrollarla, Miguel trabajó con diferentes disciplinas: desde algunos aspectos lingüísticos básicos, como la morfología y la sintaxis; el entrenamiento de redes neuronales para reconocer y recordar patrones; el empleo estadístico de datos que alimentan una red; hasta llegar al desarrollo de una página web para el uso del público. Una de las herramientas principales fue el libro Purépecha de Jarácuaro, Michoacán, de Claudine Chamoreau, elegido por su cualidad de documentar 805 frases emparejadas entre el español y el purépecha, las cuales fueron utilizadas para entrenar la red neuronal, con la posibilidad de conjugar los verbos de la frase en pasado, presente o futuro. La otra herramienta básica que utilizó fue la del Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés), que es un tipo de inteligencia artificial basada en la forma en la que los humanos nos comunicamos.
 
El desarrollo de este proyecto contribuyó principalmente al aprendizaje de Miguel acerca del funcionamiento de las redes neuronales; además de la experiencia directa en el conocimiento de las expresiones en la lengua purépecha. Considera que el trabajo por hacer para afinar el traductor aún es mucho, es necesario documentar más frases emparejadas y conseguir mejores traducciones. Estas iniciativas buscan facilitar la comunicación entre los hablantes de español y los hablantes de lenguas indígenas, así como promover el mutuo conocimiento entre ellos. Tecnologías como el OpenNMT contribuyen a que estos objetivos sean cada vez más asequibles.
 
A t e n t a m e n t e
"Piensa y Trabaja"

Guadalajara, Jalisco,11 de julio de 2018
 
Redacción y fotografías: Marina Ortiz