La compañía liderada por Mark Zuckerberg hizo público un nuevo sistema de IA que traducirá y transcribirá en casi 100 idiomas. Los detalles
01.09.2023 • 15:40hs • Inteligencia aritifical
Inteligencia aritifical
Meta lanza su propio sistema de inteligencia artificial: sus diferenciales
La compañía Meta dio a conocer un innovador sistema de inteligencia artificial (IA) que realiza traducciones y transcripciones de casi cien idiomas.
Este avance forma parte de sus esfuerzos para crear un traductor universal y abarca un amplio espectro de idiomas.
Meta presentó un nuevo traductor y transcriptor con inteligencia artificial
Bajo el nombre de "SeamlessM4T", adopta un enfoque de sistema integral con el propósito de minimizar tanto los errores como los tiempos de espera inherentes a los procedimientos de traducción.
Asimismo, aprovecha los progresos logrados en otros desarrollos de la firma, incluyendo No Language Left Behind, el traductor universal de voz, y los extensos modelos de voz en múltiples idiomas.
El nuevo modelo multimodal y multilingüe tiene la capacidad de identificar el habla en casi cien idiomas y llevar a cabo la conversión de voz a texto en aproximadamente cien lenguajes, según informó la agencia ADP.
Entre sus habilidades se incluye:
- La traducción de voz a voz en cerca de cien idiomas de origen y treinta y seis de salida
- La traducción textual en cerca de cien idiomas
- La transformación de texto a voz en cien idiomas de origen y treinta y cinco de salida
Meta presentó un nuevo sistema de IA que realiza traducciones y transcripciones de casi cien idiomas.
Meta resaltó en su blog de inteligencia artificial que construir un traductor de idiomas universal, comparable al ficticio Pez de Babel de la novela "Guía del autoestopista galáctico", representa un desafío.
Precisaron que esto se debe a que los sistemas actuales de traducción de voz a voz y de voz a texto solo abarcan una porción limitada de las lenguas del mundo.
Además, añadieron que consideran que el trabajo anunciado en el día de hoy constituye un paso significativo hacia adelante en este proceso.
Aparte de este modelo, Meta puso a disposición el conjunto de datos abierto denominado SeamlessAlign para traducción multimodal. Este conjunto incluye un total de 270.000 horas de alineaciones entre voz y texto.
CM3leon: la herramienta de Meta con inteligencia artificial
A su vez, la compañía presentó CM3leon, el primer modelo multimodal de IA generativa capaz de crear imágenes a partir de texto y viceversa, con una "receta adaptada" de lenguaje multimodal que, además, se entrena con "cinco veces menos recursos".
En este marco, Meta lanzó su nuevo modelo de IA CM3leon -denominado "camaleón"- capaz de ofrecer "el más alto rendimiento" en la conversión de texto a imagen y viceversa que, además, se entrena con cinco veces menos recursos que los modelos anteriores y genera secuencias de texto e imágenes en base a "secuencias arbitrarias de otro contenido de imagen y texto".
Meta lanzó CM3leon, su propia IA
Tal y como expresó la compañía en un comunicado, se trata de una solución innovadora porque es el "primer modelo multimodal" que está entrenado con una adaptación de modelos de lenguaje de solo texto. Es decir, los modelos generativos de solo texto se ajustan a instrucciones multitarea, comprendiendo distintas gamas de acciones a la hora de seguir indicaciones.
Sin embargo, los modelos de generación de imágenes están especializados, por norma general, solo en tareas concretas.