El Traductor de Google ha estado recibiendo interesantes cambios últimamente. Hace unos días os hablábamos de la llegada de una función de ‘historial’ para acceder a nuestras traducciones de manera automática en cualquier dispositivo. Ahora la herramienta ha obtenido 24 nuevos idiomas, y lo ha hecho de una manera muy peculiar.
Google ha utilizado su modelo de machine learning Zero-Shot, el cual ha aprendido los idiomas sin haber visto un ejemplo antes. Si bien desde la compañía reconocen que no es perfecto, la técnica empleada ha sido todo un hito para Google Translate.
Una IA que traduce sin haber estudiado el idioma antes
La firma lo ha anunciado a través de una nueva entrada en su blog oficial. En ella han especificado los idiomas, los cuales suman ya un total de 133. Según Google, estos nuevos idiomas son hablados por más de 300 millones de personas en todo el mundo. El lingala, por ejemplo, es hablado por más de 45 millones de personas en África central. También se han incluido los idiomas indígenas como el quechua, guaraní o aimara de las Américas, entre otros.
Entre los idiomas añadidos también se encuentra el sánscrito, una antigua lengua de la india que, según Google, la hablan apenas 20.000 personas en todo el mundo. El hecho de que se añadan este tipo de lenguas clásicas ayudará en gran medida a traducir textos y escrituras de cientos o miles de años atrás.
Muchos de ellos son hablados en las regiones del norte de la India, Sudamérica, Maldivas, Sudáfrica, y más. Podéis ver la lista completa de idiomas en la web proporcionada por Google.
Lo realmente interesante de estos idiomas agregados es la utilización de Zero-Shot, una IA que no ha necesitado entrenarse en los idiomas descritos para añadirlos al completo en el Traductor de Google. Este modelo de machine learning sólo está siendo entrenado mediante texto monolingüe. La traducción no es perfecta, avisan desde la compañía, pero trabajarán para asegurar una traducción al nivel de la que existe actualmente para los idiomas más comunes.