Las herramientas son exclusivas para clientes de Google Cloud en Vertex AI y permiten generar contenido de video e imagen a nivel empresarial
03.12.2024 • 18:05hs • Innovación
Innovación
Google Cloud lanzó dos modelos para crear imágenes y videos en segundos vía inteligencia artificial
Google Cloud, el servicio de tecnología en la nube del gigante de internet, lanzó nuevos modelos de lenguaje para la generación de contenido en video e imagen. Uno de ellos es Veo, un modelo que permite generar imágenes a partir de prompts (instrucciones) de texto. También, se suma Imagen 3 permite para crear imágenes en alta calidad.
Imagen 3 y Veo: cuándo estarán disponibles
Veo esta disponible desde este martes e imagen 3 a partir de la semana que viene. Ambos lanzamientos son exclusivos para los clientes de Google Cloud en Vertex AI, la plataforma diseñada para implementar y evaluar modelos de lenguajede manera sencilla y personalizada.
Estos modelos de inteligencia artificial generativa son herramientas clave para las organizaciones, debido a que ayudan a generar contenido creativo y de calidad, de forma simple y rápida.
Marcel Silva, jefe de ventas de Inteligencia Artificial para América Latina de Google Cloud, destacó que estar "muy entusiasmados de poner Veo e Imagen 3 a disposición de nuestros clientes".
Y añadió: "Creemos que estos modelos tienen el potencial de revolucionar la forma en que las empresas crean y utilizan el contenido de video e imagen".
"Con Veo e Imagen 3, las organizaciones pueden generar videos e imágenes de alta calidad de forma rápida y sencilla, sin necesidad de tener experiencia en producción de video o imágenes", resaltó.
Imagen 3 y Veo: cómo funcionan
Veo, desarrollado por Google DeepMind, permite generar videos en alta calidad y definición en base prompts de texto o imagen, con una amplia escala de estilos visuales y a alta velocidad.
Esta herramienta posee una comprensión avanzada de lenguaje natural y de semántica visual, algo que permite generar videos que se ajustan de manera muy precisa a lo solicitado, logrando que personas, animales y objetos se muevan y funcionen de manera realista.
Veo tiene la capacidad de genera videos en base a imágenes preexistentes o generadas por IA utilizando Imagen 3 y también de imágenes del mundo real para crear, por ejemplo, videoclips cortos.
Por su parte, Imagen 3, es un modelo más avanzado que convierte texto a imagen a partir de prompts simples, pero alcanzando un alto nivel de detalle. Esta herramienta permite producir imágenes fotorrealistas y realistas.
Este modelo permite editar fotos completas a partir de un simple mensaje de texto, editar solo una parte, cambiar el fondo de un producto o aumentar la escala de la imagen.
También es ideal para crear imágenes personalizadas para el desarrollo de una marca propia marca, logo o producto. Ideal para proyectos comerciales y piezas publicitarias y de marketing.
Veo e Imagen 3 son herramientas robustas que se alinean a los principios de seguridad de IA de Google:
-Marca de agua digital: SynthID incorpora marcas de agua invisibles en cada imagen y fotograma generados por Imagen 3 y Veo, contribuyendo a combatir la desinformación.
-Filtros de seguridad: Veo e Imagen 3 integran filtros avanzados diseñados para prevenir la creación de contenido dañino.
-Gobernanza de datos y privacidad: Los datos de los clientes están protegidos y no se utilizan para entrenar modelos, siguiendo las estrictas políticas de privacidad y gobernanza de datos de Google Cloud.