Disponible el Sistema de Reconocimiento de Habla en Euskera

09-05-24

Desde el Grupo Aholab y el centro HiTZ presentamos al público el nuevo sistema de reconocimiento de habla en euskera. Este avance tecnológico tiene el potencial de transformar la interacción entre las personas y la tecnología, especialmente en el ámbito del idioma vasco.

El sistema ha sido entrenado con 548 horas de voz en euskera procedentes de distintas fuentes públicas (Mozilla Common Voice 16.1, Basque Parliament, OpenSLR), lo que le permite reconocer con precisión las palabras y frases habladas por los usuarios, alcanzando niveles de calidad de WER menores al 5%.

Se han creado dos modelos diferentes basados en modelos preentrenados de NVIDIA. Uno de ellos se ha creado utilizando un modelo de lenguaje con técnicas más clásicas, y el otro utilizando tecnologías más emergentes como los transducers. El entrenamiento de los modelos se ha llevado a cabo en el sistema Hyperion de los servidores del DIPC.

Potencialmente, el sistema puede integrarse en asistentes virtuales para realizar tareas como enviar mensajes, buscar información o establecer recordatorios. También podría posibilitar la automatización de respuestas en llamadas telefónicas, mejorando la eficiencia y la atención al cliente. Y, sin duda, facilitará la transcripción de grabaciones de audio en euskera.

En este enlace está disponible una demo del sistema y los modelos pueden descargarse de Gaitu-Data. El equipo invita a la comunidad a utilizarlo y proporcionar comentarios para seguir mejorando la tecnología. Esperamos que sea una herramienta valiosa para la comunidad vasca y contribuya al fortalecimiento de nuestro idioma.