Google Cloud, el servicio de tecnología en la nube del gigante de internet, lanzó nuevos modelos de lenguaje para la generación de contenido en video e imagen. Uno de ellos es Veo, un modelo que permite generar imágenes a partir de prompts (instrucciones) de texto. También, se suma Imagen 3 permite para crear imágenes en alta calidad.

Imagen 3 y Veo: cuándo estarán disponibles 

Veo esta disponible desde este martes e imagen 3 a partir de la semana que viene. Ambos lanzamientos son exclusivos para los clientes de Google Cloud en Vertex AI, la plataforma diseñada para implementar y evaluar modelos de lenguajede manera sencilla y personalizada.

Estos modelos de inteligencia artificial generativa son herramientas clave para las organizaciones, debido a que ayudan a generar contenido creativo y de calidad, de forma simple y rápida.

Marcel Silva, jefe de ventas de Inteligencia Artificial para América Latina de Google Cloud, destacó que estar "muy entusiasmados de poner Veo e Imagen 3 a disposición de nuestros clientes".

Y añadió: "Creemos que estos modelos tienen el potencial de revolucionar la forma en que las empresas crean y utilizan el contenido de video e imagen".

"Con Veo e Imagen 3, las organizaciones pueden generar videos e imágenes de alta calidad de forma rápida y sencilla, sin necesidad de tener experiencia en producción de video o imágenes", resaltó.

Imagen 3 y Veo: cómo funcionan 

Veo, desarrollado por Google DeepMind, permite generar videos en alta calidad y definición en base prompts de texto o imagen, con una amplia escala de estilos visuales y a alta velocidad.

Esta herramienta posee una comprensión avanzada de lenguaje natural y de semántica visual, algo que permite generar videos que se ajustan de manera muy precisa a lo solicitado, logrando que personas, animales y objetos se muevan y funcionen de manera realista.

Veo tiene la capacidad de genera videos en base a imágenes preexistentes o generadas por IA utilizando Imagen 3 y también de imágenes del mundo real para crear, por ejemplo, videoclips cortos.

Por su parte, Imagen 3, es un modelo más avanzado que convierte texto a imagen a partir de prompts simples, pero alcanzando un alto nivel de detalle. Esta herramienta permite producir imágenes fotorrealistas y realistas.

Este modelo permite editar fotos completas a partir de un simple mensaje de texto, editar solo una parte, cambiar el fondo de un producto o aumentar la escala de la imagen.

También es ideal para crear imágenes personalizadas para el desarrollo de una marca propia marca, logo o producto. Ideal para proyectos comerciales y piezas publicitarias y de marketing.

Veo e Imagen 3 son herramientas robustas que se alinean a los principios de seguridad de IA de Google:

-Marca de agua digital: SynthID incorpora marcas de agua invisibles en cada imagen y fotograma generados por Imagen 3 y Veo, contribuyendo a combatir la desinformación.

-Filtros de seguridad: Veo e Imagen 3 integran filtros avanzados diseñados para prevenir la creación de contenido dañino.

-Gobernanza de datos y privacidad: Los datos de los clientes están protegidos y no se utilizan para entrenar modelos, siguiendo las estrictas políticas de privacidad y gobernanza de datos de Google Cloud.

Te puede interesar