Inicio   >   Demostradores   >   EUROPARL-ST: A MULTILINGUAL CORPUS FOR SPEECH TRANSLATION OF PARLIAMENTARY DEBATES

Europarl-ST: A Multilingual Corpus for Speech Translation of Parliamentary Debates

Demostrador|vrain

Descripción
Europarl-ST: Corpus multilingüe para traducción del habla de debates parlamentarios
Miembro
dirección
Camino de Vera S/N
Provincia
Valencia

INFORMACIÓN DEL DEMOSTRADOR

DESCRIPCIÓN

Europarl-ST es un corpus multilingüe de traducción del habla compuesto por muestras de audio-texto emparejadas, basado en las grabaciones de debates del Parlamento Europeo en el período comprendido entre 2008 y 2012. Contiene tripletas de audio-transcripción-traducción desde y hacia 9 idiomas europeos, lo que supone un total de 72 direcciones de traducción diferentes. El corpus se publica bajo licencia Creative Commons y es de libre acceso y descarga. Los detalles completos del corpus están disponibles en el artículo “Europarl-ST: A Multilingual Corpus For Speech Translation Of Parliamentary Debates” (Iranzo-Sánchez et al., ICASSP 2020).

POSIBILIDADES

Desarrollo de sistemas de traducción del habla. Desarrollo de sistemas de traducción automática. Desarrollo de sistemas de reconocimiento de voz.

HABILITADOR TECNOLOGICO

Inteligencia Artificial y Computación
Natural language processing and text mining

* Reconocimiento automático del habla (ASR)* Traducción automática (MT) * Síntesis del habla.