- Activismo Digital de Lenguas Indígenas - https://rising.globalvoices.org/lenguas -

Programa de Conversión de Texto a Voz Enseña a Pronunciar la Palabra del Día en Quechua

Categorías: Perú, Podcast de Audio, Redes Sociales, Twitter, Video Digital
Logo del proyecto, usado con autorización.

Logo del proyecto de Hinantin para fomentar el uso del quechua que va perdiendo hablantes. Usado con autorización.

Un grupo de investigación [1] peruano ha desarrollado un software conversor de texto a voz [2] que puede transformar una frase en quechua y con el uso de un reproductor de sonido hacer sonora la palabra del día para difundirla en la lengua indígena a través de las redes sociales, como YouTube [3]Twitter [4] y Facebook [5].

Hinantin, [6] con sede en Cusco, Perú, se dedica a la investigación y desarrollo de software en el área de lingüística computacional y promueve el uso de las lenguas autóctonas del Perú, pues poco a poco van perdiendo hablantes [7].

Conversamos con Richard Castro, uno de los miembros fundadores de Hinantin, quien nos explicó que lo que hacen primero es desarrollar software relacionado de algún modo con quechua, como el conversor de texto a voz [2] para el quechua cusqueño, que puede transformar el texto en habla automáticamente; el corrector ortográfico [8] en línea y para LibreOffice [9].

Específicamente, el proyecto de conversión de texto a voz [2] toma una frase en quechua y con el uso de un reproductor de sonido hace sonora la palabra del día y la difunde a través de las redes sociales. La cuenta en Instagram [10] también contiene imágenes con la palabra del día y su significado en diferentes idiomas. Los podcasts se pueden escuchar en SoundCloud [11], como se puede apreciar en este audio con la palabra wayra, ‘viento':

En este video de YouTube [12], enseñan a pronunciar la palabra wayma, morado:

El proceso de elaboración consiste de un corpus o colección de texto y audio para el quechua. El proyecto se concentra en el quechua cusqueño, puneño y limeño pues los traductores encargados de esta etapa del proceso provienen de esas regiones. Quienes prestan su voz en audios usan sus respectivas formas de hablar, aunque el sistema de escritura utilizado para presentar los audios en los videos y podcasts es el quechua sureño unificado [13].

Cada uno de los traductores puede usar el sistema de escritura de su elección, pues los textos que introducen en el sistema son normalizados automáticamente al quechua sureño [14]. Miembros del proyecto comparan las traducciones con los traductores automáticos [15] para el quechua que tienen disponibles para verificar sus defectos o ventajas.

Uno de los objetivos del corpus o colección de texto y audio es que sea utilizado en la enseñanza electrónica del quechua a través de la plataforma llamada RunaSimi [16]. Con ese fin, se ha destinado específicamente un subgrupo [17] del corpus de texto y audio.

El grupo también coopera en el desarrollo de otros programas relacionados con el quechua, asháninka y aymara.

Dado que las lenguas indígenas conforman el patrimonio cultural [18] del Peru, su valoración y uso forman parte de las políticas de promoción de la diversidad e interculturalidad. Se calcula que en el país existen más de 50 lenguas nativas vivas [19] y otras varias ya extintas. El Ministerio de Cultura ha elaborado [20] el Documento Nacional de Lenguas Indígenas que contiene datos oficiales sobre lenguas y sus hablantes. Asimismo, contiene la cantidad de lugares para aprender atenderlas y un mapa sonoro estadístico [21] de las lenguas indígenas u originarias.