¿Quién puede traducir mejor un mensaje del chino al inglés: un humano o una máquina? Los investigadores de Microsoft [VIDEO] Research dicen que el #sistema de ##traducción que han desarrollado es tan bueno como un ser humano.

El sistema usa #inteligencia #artificial [VIDEO] y aprende con la ayuda de Deep Neural Networks. Para revisar y mejorar los resultados del sistema, los investigadores utilizaron una variedad de técnicas, incluido el aprendizaje dual. Esto significa que, si el sistema tradujo un texto del chino al inglés, los investigadores lo tradujeron al inglés. Entonces el sistema aprendió de sus propios errores.

Los expertos compararon las traducciones humanas y automáticas

Los investigadores de Microsoft entrenaron el sistema sobre la base de un conjunto de datos llamado Newstest2017, que consta de alrededor de 2.000 oraciones de las ediciones en línea de diversos medios chinos. Como prueba, tenían dos #traducciones hechas por humanos. Posteriormente, los #expertos que hablan chino e inglés compararon las tres traducciones.

El sistema ha entregado una traducción tan buena como la de traductores humanos profesionales, escriben los investigadores de Microsoft en un ensayo científico. Este es un paso importante en el procesamiento del lenguaje natural.

El sistema integra varias tareas:

Reconocimiento de voz, traducción y síntesis de voz, de las cuales las dos primeras son particularmente difíciles.

Fue desarrollado por #Microsoft #Research. El jefe de investigación de Microsoft, Rick Rashid, lo presentó recientemente en una conferencia en China.

Cerebro imitado

El sistema primero reconoce el texto en inglés hablado. Esa es una tarea difícil ya. Se han realizado mejoras gracias a Deep Neural Networks. La técnica fue desarrollada hace dos años por investigadores de la Universidad de Toronto y Microsoft Research e #imita la forma en que funciona el #cerebro #humano. Por lo tanto, la tasa de error en el reconocimiento de voz, que era previamente de aproximadamente 20 a 25 por ciento, puede reducirse a aproximadamente 15 por ciento. Esto significa que la cuota se redujo de un error en cuatro a cinco palabras a un error en siete a ocho palabras.

Entonces la traducción sigue. Primero, el texto en inglés se traduce palabra por palabra al chino. Luego, las palabras se ordenan de modo que el texto cumpla con los requisitos de la gramática china. La traducción automática ha sido revolucionada en los últimos años por la combinación de #métodos #estadísticos y el procesamiento de grandes cantidades de datos, los llamados big data , explica Rashid en el blog Next At Microsoft.

Chino con la voz de Rashid

Finalmente, en el último paso, el texto en chino se emite desde un #software de #síntesis de voz con la voz del hablante. Primero, varias horas de material fueron grabadas por hablantes nativos chinos. Además, el sistema fue alimentado con registros de conferencias mantenidas por Rashid. El sistema de síntesis de voz combinó esta información para dar salida al texto chino en la voz de Rashid.

El resultado se puede escuchar: el acento y el sonido suenan bien. La voz es mucho más humana que algunos #sistemas de salida de #voz, que anuncian conexiones de trenes en las estaciones, por ejemplo. En cualquier caso, Rashid recibió aplausos con su presentación de los oyentes principalmente chinos.

El sistema no es perfecto todavía, escribe Rashid. "Por supuesto, es probable que todavía haya errores tanto en el texto en inglés como en la traducción al chino; los resultados a veces pueden ser divertidos". Pero incluso si la tecnología no es perfecta y todavía hay mucho trabajo por hacer, es "prometedora, y esperamos que dentro de unos años tengamos un sistema que elimine las #barreras del ##idioma". #Inteligencia