La compañía Meta dio a conocer un innovador sistema de inteligencia artificial (IA) que realiza traducciones y transcripciones de casi cien idiomas.

Este avance forma parte de sus esfuerzos para crear un traductor universal y abarca un amplio espectro de idiomas.

Meta presentó un nuevo traductor y transcriptor con inteligencia artificial

Bajo el nombre de "SeamlessM4T", adopta un enfoque de sistema integral con el propósito de minimizar tanto los errores como los tiempos de espera inherentes a los procedimientos de traducción.

Asimismo, aprovecha los progresos logrados en otros desarrollos de la firma, incluyendo No Language Left Behind, el traductor universal de voz, y los extensos modelos de voz en múltiples idiomas.

El nuevo modelo multimodal y multilingüe tiene la capacidad de identificar el habla en casi cien idiomas y llevar a cabo la conversión de voz a texto en aproximadamente cien lenguajes, según informó la agencia ADP. 

Entre sus habilidades se incluye: 

Meta presentó un nuevo sistema de IA que realiza traducciones y transcripciones de casi cien idiomas.

Meta resaltó en su blog de inteligencia artificial que construir un traductor de idiomas universal, comparable al ficticio Pez de Babel de la novela "Guía del autoestopista galáctico", representa un desafío. 

Precisaron que esto se debe a que los sistemas actuales de traducción de voz a voz y de voz a texto solo abarcan una porción limitada de las lenguas del mundo.

Además, añadieron que consideran que el trabajo anunciado en el día de hoy constituye un paso significativo hacia adelante en este proceso.

Aparte de este modelo, Meta puso a disposición el conjunto de datos abierto denominado SeamlessAlign para traducción multimodal. Este conjunto incluye un total de 270.000 horas de alineaciones entre voz y texto.

CM3leon: la herramienta de Meta con inteligencia artificial

A su vez, la compañía presentó CM3leon, el primer modelo multimodal de IA generativa capaz de crear imágenes a partir de texto y viceversa, con una "receta adaptada" de lenguaje multimodal que, además, se entrena con "cinco veces menos recursos".

En este marco, Meta lanzó su nuevo modelo de IA CM3leon -denominado "camaleón"- capaz de ofrecer "el más alto rendimiento" en la conversión de texto a imagen y viceversa que, además, se entrena con cinco veces menos recursos que los modelos anteriores y genera secuencias de texto e imágenes en base a "secuencias arbitrarias de otro contenido de imagen y texto".

Meta lanzó CM3leon, su propia IA

Tal y como expresó la compañía en un comunicado, se trata de una solución innovadora porque es el "primer modelo multimodal" que está entrenado con una adaptación de modelos de lenguaje de solo texto. Es decir, los modelos generativos de solo texto se ajustan a instrucciones multitarea, comprendiendo distintas gamas de acciones a la hora de seguir indicaciones. 

Sin embargo, los modelos de generación de imágenes están especializados, por norma general, solo en tareas concretas.

 

Te puede interesar