Dólar cripto

(0,91%)

$ 1.391,26

Bitcoin

(-4,81%)

u$s 75.982,00

Ethereum

(-8,81%)

u$s 1.447,60

Solana

(-7,13%)

u$s 103,38

Ripple

(-8,52%)

u$s 1,77

Cardano

(-7,14%)

u$s 0,56

Avalanche

(-3,00%)

u$s 16,16

Polkadot

(-7,22%)

u$s 3,38

Chainlink

(-2,59%)

u$s 11,15

Arbitrum

(-0,83%)

u$s 0,27

Bitcoin

(-4,81%)

u$s 75.982,00

Ethereum

(-8,81%)

u$s 1.447,60

Solana

(-7,13%)

u$s 103,38

Ripple

(-8,52%)

u$s 1,77

Cardano

(-7,14%)

u$s 0,56

Avalanche

(-3,00%)

u$s 16,16

Polkadot

(-7,22%)

u$s 3,38

Chainlink

(-2,59%)

u$s 11,15

Arbitrum

(-0,83%)

u$s 0,27

Fuente

Innovación

CM3leon es la nueva IA de Meta para crear imágenes a partir de texto y viceversa utilizando menos recursos. A continuación, todos los detalles

Por iProUP

17.07.2023 • 09:12hs • Innovación

Innovación

Meta lanzó CM3leon: cómo funciona esta herramienta de inteligencia artificial

Meta presentó este viernes CM3leon, el primer modelo multimodal de IA generativa capaz de crear imágenes a partir de texto y viceversa, con una "receta adaptada" de lenguaje multimodal que, además, se entrena con "cinco veces menos recursos".

La compañía liderada por Mark Zuckerberg investiga en modelos generativos de IA, e introduce avances en el procesamiento del lenguaje natural, en este caso, para permitir que las páginas entiendan y expresen lenguaje, así como sistemas que pueden generar imágenes basadas en entradas de texto.

En este marco, Meta lanzó su nuevo modelo de IA CM3leon -denominado "camaleón"- capaz de ofrecer "el más alto rendimiento" en la conversión de texto a imagen y viceversa que, además, se entrena con cinco veces menos recursos que los modelos anteriores y genera secuencias de texto e imágenes en base a "secuencias arbitrarias de otro contenido de imagen y texto".

Tal y como expresó la compañía en un comunicado, se trata de una solución innovadora porque es el "primer modelo multimodal" que está entrenado con una adaptación de modelos de lenguaje de solo texto. Es decir, los modelos generativos de solo texto se ajustan a instrucciones multitarea, comprendiendo distintas gamas de acciones a la hora de seguir indicaciones.

Sin embargo, los modelos de generación de imágenes están especializados, por norma general, solo en tareas concretas.

Meta presentó CM3leon

Al aplicar las multitareas a gran escala de los modelos de solo texto para la generación de imágenes y texto, se mejoró el rendimiento en otras tareas como, por ejemplo, la generación de texto a partir de imágenes para escribir una leyenda de estas.

Meta lanzó CM3leon, su propia IA

Además, aunque es un modelo entrenado con una cantidad de recursos cinco veces menor que los modelos anteriores, CM3leon es capaz de ofrecer un rendimiento "de última generación" para crear imágenes a partir de texto y viceversa. De hecho, Meta ha subrayado que CM3leon tiene la "versatilidad y efectividad de los modelos autorregresivos".

Como consecuencia, es un modelo que mantiene bajos costos de entrenamiento y es eficiente.

Con todo ello, la compañía explicó que se trata de un modelo causal enmascarado mixto-modal (CM3) ya que puede generar secuencias de texto e imágenes condicionadas a "secuencias arbitrarias de otro contenido de imagen y texto". Tal y como indicó la empresa, "esto amplía enormemente la funcionalidad de los modelos anteriores que eran solo de texto a imagen o solo de imagen a texto".

En esta línea, CM3Leon también muestra una capacidad "impresionante" para generar objetos compositivos complejos, es decir, imágenes con distintos componentes que no tienen que ver entre sí o que son complicados de encajar juntos.

De todas formas, la empresa matriz de Instagram destacó que CM3leon se desempeña bien en una "amplia variedad de tareas de visión y lenguaje", incluida la respuesta visual a preguntas y subtítulos de formato largo.

Capacidades de CM3leon

Gracias a todas sus características, CM3leon puede proceder a la generación y edición de imágenes guiadas por texto. En concreto, la edición modificada por texto es "un desafío" ya que es necesario que el modelo comprenda tanto las instrucciones de texto como la propia imagen generada para editarla posteriormente.

La inteligencia artificial crece día a día

Al hilo, este nuevo modelo de Meta también puede editar imágenes siguiendo instrucciones de estructura. Esto es una opción que permite crear ediciones "visualmente coherentes y contextualmente apropiadas" para una imagen que se adhieren a las pautas de diseño ya descritas previamente.

Otra de las capacidades que desempeña CM3leon es la de generar una imagen a partir de un texto con descripciones. Pero, en concreto, a partir de un texto que describa una imagen "potencialmente muy compositiva", lo que pone a prueba al modelo para seguir de forma coherente las indicaciones del texto.

CM3leon también es capaz de llevar a cabo tareas de texto. En este sentido, puede seguir distintas indicaciones para, a partir de una imagen, generar subtítulos cortos o largos, incluso, puede responder preguntas sobre una imagen.

Dentro de sus habilidades para generar imágenes, el usuario puede redactar una descripción que incluya la localización exacta de dónde se han de situar los objetos que se hayan incluido en la descripción, dentro de un espacio delimitado.

Te puede interesar

Onlyfans sigue creciendo en usuarios: cómo ganar en dólares con el "Instagram hot" desde la Argentina

CM3leon también es capaz de ofrecer resultados de "súper resolución", esta opción agrega una etapa entrenada por separado para introducir imágenes de mayor resolución a los resultados del modelo original.

Temas relacionados

Hoy escribe

Por Heidy Bauer*

Meta lanzó su último modelo de inteligencia artificial que revoluciona el mundo: cómo funciona Llama 4

Microsoft lanza subagentes de inteligencia artificial para Copilot: en qué consisten

Midjourney no quiere quedarse atrás y presenta su nueva inteligencia artificial creadora imágenes

Llamadas fraudulentas: Google amplía la protección con IA a los smartwatches

Bybit, Coinbase y Gemini: tres casos de estafas y hackeos cripto que preocupan al ecosistema

Bitcoin baja en todos lados, menos en Argentina: por qué el precio en pesos "resiste" el efecto Trump

No es el dólar: qué moneda puede disparar el precio del Bitcoin y de otras criptomonedas

MELANIA mueve u$s30 millones en tokens de manera silenciosa y genera sospechas

Cuál es el salario promedio pretendido por los argentinos y qué sectores tienen las mayores diferencias

Bill Gates, apocalíptico: reveló que la IA desplazará a los principales trabajos humanos

Cómo mejorar el rendimiento de los equipos con tecnología

Hoy escribe

Te puede interesar

Las predicciones de los especialistas sobre la crisis económica con los aranceles de Trump

La nueva inversión que recomiendan los expertos tras los aranceles de EEUU: de cuál se trata

Banco argentino demanda a Google por publicitar sitios de estafas

Optimizar los servicios en la nube: ¿la mayor preocupación de los profesionales IT?

Hoy escribe

ChatGPT revoluciona con su generador de imágenes con más de 700 millones creadas en una semana

Milei anunció que Argentina readecuará su legislación comercial para atenuar impacto de aranceles

Paso a paso para colocar música en los estados de WhatsApp

¿Cómo crear fotos de "action figure" con ChatGPT?

La IA llega al rubro petrolero: cómo funciona el chatbot de esta firma y cómo mejora la actividad

Ualá revela ahora cómo podés hacer rendir mucho mejor tu Cuenta Remunerada para ganar más

¿Por qué la ciberseguridad y las nuevas herramientas IT son los grandes retos del sector empresarial?

¿Un médico en tu iPhone?: Apple trabaja en una IA entrenada en salud

Switch 2: Nintendo frena la preventa de la consola en EE.UU. por impuestos de Trump

Pymes argentinas apuestan a la inteligencia artificial: el 80% invertirá este año para tareas clave

Caen los mercados y el inversor se pregunta: ¿cuál es la fórmula para recuperarse de una mala apuesta?