Meta ha anunciado esta semana que ha creado un sistema de traducción de voz a voz basado en la inteligencia artificial (IA) que puede traducir (al inglés) principalmente lenguas orales que no tienen un sistema de escritura ampliamente utilizado, empezando por el hokkien, una lengua taiwanesa que carece de una forma escrita estándar.
El sistema es el resultado de una profunda investigación realizada por los equipos de IA de Meta en todo el mundo, incluso en Israel, donde Meta construyó una importante operación de I&D, la mayor fuera de Estados Unidos.
El titán tecnológico de Silicon Valley, propietario de Facebook, Instagram y WhatsApp, presentó el trabajo de su proyecto Traductor Universal de Voz como un esfuerzo para permitir a los usuarios de todo el mundo socializar independientemente de los idiomas que hablen. El proyecto fue uno de los dos anunciados por primera vez en febrero.
El segundo proyecto, relacionado con el anterior, se denomina “No Language Left Behind”, en el que Meta afirma que está construyendo un nuevo modelo avanzado de IA que “puede aprender de idiomas con menos ejemplos para entrenar, y lo utilizaremos para permitir traducciones de calidad experta en cientos de idiomas, desde el asturiano hasta el luganda o el urdu”.
Estos dos proyectos forman parte del esfuerzo declarado por Meta a largo plazo para construir herramientas lingüísticas y sistemas de traducción automática que se aplicarán a “la mayoría de las lenguas del mundo”.
Cuando Facebook cambió su nombre por el de Meta hace un año, su cofundador y jefe, Mark Zuckerberg, dijo que la empresa se centraba en un cambio hacia la vida en línea que se desarrolla en reinos virtuales, un concepto denominado metaverso.
“Las comunicaciones habladas pueden ayudar a romper las barreras y unir a las personas dondequiera que se encuentren, incluso en el metaverso”, dijo Meta en una entrada de su blog.
El incipiente sistema de traducción del hokkien ha sido calificado por Meta como el primer “sistema de traducción de voz a voz desarrollado para una lengua no escrita”.
La tecnología de traducción, que según la empresa tecnológica se compartirá para que otros la utilicen, permite a alguien que habla hokkien conversar con alguien que habla inglés, pero sólo con una frase completa cada vez, según Meta.
El gigante tecnológico dijo que para construir el sistema, utilizó una variedad de métodos para superar el hecho de que la mayoría de los sistemas de traducción de voz se basan en transcripciones.
Como el hokiien no tiene un sistema de escritura, Meta dijo que utilizó traducciones de voz a voz que se basan en algún texto de un idioma relacionado, en este caso, el mandarín, y traducciones de voz a unidad que producen sonidos acústicos.
“Nuestro equipo tradujo primero el habla inglesa o hokkien al texto mandarín, y luego lo tradujo al hokkien o al inglés”, explicó a VentureBeat Juan Pino, uno de los investigadores de IA de Meta. “Luego añadieron las frases emparejadas a los datos utilizados para entrenar el modelo de IA”.
Meta dijo que el trabajo era un “paso hacia un futuro en el que sea posible la traducción simultánea entre idiomas.”
“Las técnicas en las que fuimos pioneros con el hokkien pueden extenderse a muchas otras lenguas no escritas y, con el tiempo, funcionarán en tiempo real”.
El hokkien se habla mucho en la diáspora china. Lo utilizan 16 millones de personas en toda Asia y lo hablan tres cuartas partes de la población de Taiwán, según el Instituto Nacional de Lenguas y Civilizaciones Orientales.
Pero el idioma carece de una forma escrita estándar, lo que hace que sea un reto entrenar a los modelos de IA para que interpreten lo que se dice, según Meta.
Más del 40% de las 7.000 lenguas existentes en el mundo son principalmente habladas, sin una forma escrita estándar o ampliamente conocida, dijo la empresa tecnológica.
“En el futuro, todas las lenguas, escritas o no, podrían dejar de ser un obstáculo para el entendimiento mutuo”, dijo Meta.