Google Cloud, el servicio de tecnología en la nube del gigante de internet, lanzó nuevos modelos de lenguaje para la generación de contenido en video e imagen. Uno de ellos es Veo, un modelo que permite generar imágenes a partir de prompts (instrucciones) de texto. También, se suma Imagen 3 permite para crear imágenes en alta calidad.
Imagen 3 y Veo: cuándo estarán disponibles
Veo esta disponible desde este martes e imagen 3 a partir de la semana que viene. Ambos lanzamientos son exclusivos para los clientes de Google Cloud en Vertex AI, la plataforma diseñada para implementar y evaluar modelos de lenguajede manera sencilla y personalizada.
Estos modelos de inteligencia artificial generativa son herramientas clave para las organizaciones, debido a que ayudan a generar contenido creativo y de calidad, de forma simple y rápida.
Marcel Silva, jefe de ventas de Inteligencia Artificial para América Latina de Google Cloud, destacó que estar "muy entusiasmados de poner Veo e Imagen 3 a disposición de nuestros clientes".
Y añadió: "Creemos que estos modelos tienen el potencial de revolucionar la forma en que las empresas crean y utilizan el contenido de video e imagen".
"Con Veo e Imagen 3, las organizaciones pueden generar videos e imágenes de alta calidad de forma rápida y sencilla, sin necesidad de tener experiencia en producción de video o imágenes", resaltó.
Imagen 3 y Veo: cómo funcionan
Veo, desarrollado por Google DeepMind, permite generar videos en alta calidad y definición en base prompts de texto o imagen, con una amplia escala de estilos visuales y a alta velocidad.
Esta herramienta posee una comprensión avanzada de lenguaje natural y de semántica visual, algo que permite generar videos que se ajustan de manera muy precisa a lo solicitado, logrando que personas, animales y objetos se muevan y funcionen de manera realista.
Veo tiene la capacidad de genera videos en base a imágenes preexistentes o generadas por IA utilizando Imagen 3 y también de imágenes del mundo real para crear, por ejemplo, videoclips cortos.
Por su parte, Imagen 3, es un modelo más avanzado que convierte texto a imagen a partir de prompts simples, pero alcanzando un alto nivel de detalle. Esta herramienta permite producir imágenes fotorrealistas y realistas.
Este modelo permite editar fotos completas a partir de un simple mensaje de texto, editar solo una parte, cambiar el fondo de un producto o aumentar la escala de la imagen.
También es ideal para crear imágenes personalizadas para el desarrollo de una marca propia marca, logo o producto. Ideal para proyectos comerciales y piezas publicitarias y de marketing.
Veo e Imagen 3 son herramientas robustas que se alinean a los principios de seguridad de IA de Google:
-Marca de agua digital: SynthID incorpora marcas de agua invisibles en cada imagen y fotograma generados por Imagen 3 y Veo, contribuyendo a combatir la desinformación.
-Filtros de seguridad: Veo e Imagen 3 integran filtros avanzados diseñados para prevenir la creación de contenido dañino.
-Gobernanza de datos y privacidad: Los datos de los clientes están protegidos y no se utilizan para entrenar modelos, siguiendo las estrictas políticas de privacidad y gobernanza de datos de Google Cloud.