La inteligencia artificial no para. Por mucho que alucinemos con los últimos avances, siempre hay algo nuevo detrás de la esquina preparado para dejarnos con la boca abierta de nuevo. Uno de los campos en los que más se está aprovechando de cara al usuario medio es las herramientas que nos facilitan la vida, como por ejemplo los traductores, ahora que se viaja tanto al extranjero. Hasta ahora, si usabas el traductor de Google, uno de los más completos, a partir de tu voz, sabrás que esta se transcribía y una vez en formato texto se traducía al idioma que tú le solicitaras. No es que estuviera ni mal ni mucho menos, pero era evidente que había una posibilidad de mejora todavía sustancial, sobre en lo que al ahorro de pasos se refiere, y esa mejora está a punto de caramelo. Se llama Google Translatotron.
El gigante californiano está desarrollando este nuevo sistema de traducción único en el mundo, que promete darle otro salto cualitativo de calidad a la empresa, la reina de las herramientas tecnológicas virales, utilizadas por la gran mayoría de usuarios no expertos pero que recurren a la tecnología habitualmente.
Las novedades de Google Translatotron
A grandes rasgos, lo que este nuevo ‘juguete’ es capaz de hacer es saltar el paso intermedio en el proceso de traducción de voz de un idioma a otro. Ahora, gracias a Translatotron, podrás ir de un extremo a otro de la operación de un solo salto, sin paradas intermedias, ya que la herramienta puede convertir un idioma a otro en formato voz incluso salvando los problemas derivados de las particularidades de la voz, como por ejemplo la cadencias del emisor o su tono.
El resultado no solo es mucho más rápido y cómo para el usuario, sino que además reduce las probabilidades de que se pierda la identidad del mismo, la intención del emisor, dado que no existe el paso obligatorio hasta ahora de tener que traducirlo primero por escrito.
En el blog oficial de inteligencia artificial, Google ha explicado todos los detalles (que se puedan contar) sobre esta nueva herramienta de traducción, introduciéndola de esta forma en la esfera pública. Ha contado, entre otras cosas, que utiliza un modelo de red secuencia a secuencia que toma una entrada de voz que es procesada como espectograma antes de generar uno nuevo ya en el idioma final de la traducción en cuestión.
Además, Google ha explicado que funciona también con un componente de codificador de altavoz opcional, de ahí que permita mantener la voz de un hablante. Esto quiere decir, efectivamente, que tal y como te estás imaginando, podrás escucharte a ti mismo hablando en otro idioma, aunque suene tirando a robótico.
Las reacciones a este gran avance
Pero Translatotron no es algo que aparezca en cosa de un día, ni de un mes, ni tan siquiera de un año. Google lleva trabajando en este tipo de sistemas de 2016, y ya en 2017 demostró que este sistema -secuencia a secuencia- era mejor que el modelo “en cascada”, mucho más utilizado. Desde entonces se han dedicado esfuerzos humanos y económicos a su desarrollo y el resultado está cerca de convertirse en realidad, demostrando que no eran casualidad los grandes avances que se habían producido en Google Translate desde el año pasado, cuando se incluyeron acentos para diferenciar pronunciaciones dentro del mismo idioma y también nuevas lenguas.
Las reacciones dentro de la comunidad no se han hecho esperar, y todas han sido exultantes, aplaudiendo la nueva creación de Google y su funcionamiento. Expertos en inteligencia artificial, prensa especializada, y todos aquellos amantes de la tecnología que han seguido las novedades al respecto han llenado de mensajes positivos sus respectivos timelines de Twitter comentando la llegada de Translatotron.
Translatotron: end-to-end Speech-to-Speech translation!!
This is insane, amazed how well this works. Then again, maintaining a rich latent code rather than forcing it through a «written language» bottleneck does feel like an infinitely scalable approach.. https://t.co/LKRI08foZr
— Xander Steenbrugge (@xsteenbrugge) May 16, 2019
—-
Translatotron: a single sequence-to-sequence model can directly translate speech from one language into speech in another language, without relying on an intermediate text representation in either language https://t.co/x9HnqK0Eug
— Peter Skomoroch (@peteskomoroch) May 16, 2019
Estas opiniones expertas no hacen más que afianzarnos en algo de lo que ya nosotros también nos percatamos al conocer de cerca a Translatotron: tenemos la certeza de que asistimos a un nuevo golpe de autoridad y demostración de fuerza de Google en el ámbito de la inteligencia artificial. Tan solo nos queda conocer cuándo verá la luz, porque de momento el proyecto está en fase de pruebas.
Últimos posts de Geek Jedi Girl (ver todo)
- Quiero estudiar Data Science, ¿por dónde empiezo? - 26/02/2021
- Por qué Indra es un destino laboral atractivo y de prestigio - 24/02/2021
- Clubhouse, ¿qué es y cómo funciona? - 10/02/2021