Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Xataka Mexico

Publicado en: 20/09/2016 13:09

Escrito por: Tania Campos

Axolotl es un repositorio náhuatl - español que busca generar traducciones automáticas

Cuando hablamos de Procesamiento del Lenguaje Natural, hablamos de esa capacidad que tiene una máquina de entablar una conversación con nosotros, entender lo que decimos y emitir una respuesta ante ello, para lograrlo, se requieren diversas disciplinas trabajando en conjunto, entre ellas la lingüística, computación, estadística y matemáticas por citar algunas. El sueño de las creadoras de Axolotl es lograr un corpus paralelo náhuatl - español con la idea de crear un traductor automático entre ambas lenguas.

Un corpus es una gran colección de documentos que se alimentan a una base de datos en la búsqueda de patrones del lenguaje humano, esto permite conocer el lenguaje y desarrollar la tecnología necesaria para poder realizar la interacción humano - máquina. Dentro de los corpus destacan los corpus paralelos, en tecnologías digitales, estos se utilizan principalmente para hacer traducciones de una lengua a otra. El trabajo que se hace con Axolotl es crear un corpus paralelo náhuatl - español.

Ximena Gutiérrez, Elena Vilchis y Rocío Cerbón son las ingenieras detrás de este corpus lingüístico. Un corpus recoge aspectos de la realidad pero debe ser amplio y relevante para conformar un modelo al cual recurrir en un entorno en que se demande la traducción.

Para la creación de Axolotl se obtuvieron diversas fuentes entre textos históricos, didácticos, cuentos, recetarios, musicales suman un total de 38 libros, que presentan una variación dialectal y diacrónica, lo que le dá más riqueza ya que no todos los textos pertenecen a la misma variante ni a …

Top noticias del 20 de Septiembre de 2016