Más cerca de la versión catalana de Siri y Alexa
El Govern de la Generalitat invertirá 3 millones de euros en el proyecto AINA, la iniciativa basada en inteligencia artificial, para lanzar este 2022 el primer corpus de voz en catalán. Al final, esto permitirá la creación de datos masivos que harán posibles los asistentes de voz en catalán.
Además de la inversión, lo que hace falta ahora es potenciar la recaudación de voces para el corpus de Common Voice, que ya supera las 1.000 horas grabadas en catalán. A la voz se le suman los 1.770 millones de palabras del corpus de texto que la iniciativa ya presentó en 2020.
El objetivo del proyecto AINA es generar un volumen de datos de voz masivo, que cubra los dialectos, registros y temáticas de la lengua catalana.