Dólar cripto

(0,32%)

$ 1.380,99

Bitcoin

(-2,36%)

u$s 77.307,00

Ethereum

(-5,82%)

u$s 1.479,50

Solana

(-2,43%)

u$s 105,16

Ripple

(-3,42%)

u$s 1,85

Cardano

(-1,07%)

u$s 0,57

Avalanche

(-3,96%)

u$s 16,32

Polkadot

(-3,58%)

u$s 3,48

Chainlink

(-2,78%)

u$s 11,04

Arbitrum

(-4,00%)

u$s 0,27

Fuente

Innovación

OpenAI presenta Sora, un modelo de IA que convierte texto en videos realistas, avanzando en la resolución de problemas del mundo real

Por iProUP

18.02.2024 • 11:25hs • Innovación

Innovación

OpenAI presenta un modelo de inteligencia artificial para crear videos realistas: cómo funciona

OpenAI ha revelado su última creación, Sora, un innovador modelo basado en inteligencia artificial generativa capaz de transformar instrucciones de texto en vídeos realistas de hasta 60 segundos.

Esta nueva tecnología de la compañía busca avanzar en la capacidad de la inteligencia artificial para resolver problemas del mundo real, incluyendo la simulación de entornos físicos en movimiento.

Sora representa un gran avance en esta dirección, permitiendo a los usuarios generar vídeos detallados con movimientos de cámara complejos y múltiples personajes expresando emociones.

Sora de OpenAI: innovación en la generación de vídeo

OpenAI ha presentado su última creación, Sora, a través de una publicación en X (ex Twitter), destacando su capacidad para generar vídeos altamente detallados y realistas.

Este nuevo modelo de inteligencia artificial permite a los usuarios crear escenas específicas detalladas mediante simples indicaciones de texto, abriendo un nuevo mundo de posibilidades en la producción de contenido visual.

Por ejemplo, puede interpretar instrucciones como "primer plano del parpadeo del ojo de una mujer de 24 años, de pie en Marrakech durante el atardecer", dando lugar a resultados extremamente realistas.

Sora permite a los usuarios generar vídeos detallados con movimientos de cámara complejos y múltiples personajes expresando emociones

Además, Sora no solo comprende las indicaciones de texto, sino que también tiene un profundo entendimiento del mundo físico, lo que le permite recrear escenas con precisión y realismo.

Esto se refleja en su capacidad para generar personajes con emociones vibrantes y animar imágenes estáticas con detalle y precisión, así como extender la duración de vídeos existentes o completar fotogramas.

Sora transforma el ruido en video

Sora opera transformando progresivamente vídeos que inicialmente parecen ser ruido estático en imágenes realistas, mediante múltiples etapas de eliminación de ruido.

Utilizando una arquitectura de transformador similar a los modelos GPT, Sora representa las imágenes del vídeo como colecciones de unidades de datos más pequeñas, denominadas parches, para lograr un rendimiento de escalado superior.

Actualmente, su uso está limitado al equipo de investigación interno de OpenAI, quienes lo están probando para identificar posibles fallos y riesgos.

Además, se encuentra en fase de prueba por parte de un grupo de artistas visuales, diseñadores y cineastas para mejorar su utilidad en el ámbito creativo.

Sora tiene un profundo entendimiento del mundo físico, lo que le permite recrear escenas con precisión y realismo

Aunque el modelo ha demostrado habilidades prometedoras, aún enfrenta desafíos para representar adecuadamente conceptos relacionados con el espacio, la física y las acciones de causa y efecto, lo que puede llevar a errores como la falta de consistencia en la representación de objetos o la confusión en la orientación espacial.

OpenAI refuerza la seguridad de Sora

OpenAI está implementando diversas medidas de seguridad en su nuevo modelo Sora para prevenir la difusión de contenido engañoso o perjudicial.

Trabajando en colaboración con el equipo rojo, que cuenta con expertos en áreas como esinformación y contenido nocivo, la compañía está desarrollando herramientas para detectar y clasificar automáticamente los vídeos generados por Sora.

Una de estas herramientas incluye la implementación de metadatos de C2PA, un estándar que verifica el origen y la autenticidad del contenido.

Además, OpenAI está aplicando métodos de seguridad similares a los utilizados en otros productos de la compañía, como DALL·E 3, para verificar y rechazar solicitudes de ingreso de texto que infrinjan las políticas de uso, como contenido violento, sexual o de odio.

Te puede interesar

Disney apuesta por el Metaverso: Invierte u$s1.400 millones en Epic Games

Asimismo, disponen de clasificadores de imágenes que analizan los fotogramas de cada vídeo para garantizar el cumplimiento de las políticas de la compañía antes de mostrarlos al usuario.

Temas relacionados

Hoy escribe

Por Heidy Bauer*

Midjourney no quiere quedarse atrás y presenta su nueva inteligencia artificial creadora imágenes

Llamadas fraudulentas: Google amplía la protección con IA a los smartwatches

Las DAO ganan terreno en la región: así son las organizaciones que reparten poder con tokens y blockchain

El futuro del marketing de afiliación: la exclusiva oferta de CPA de Exness adaptada a Latinoamérica

Billeteras virtuales, en riesgo: un decreto de Javier Milei puede salvar o hundir a varias fintech

Las remesas en la era de la migración: desafíos y soluciones

JP Morgan eleva a 60% la probabilidad de recesión global por la guerra comercial

¿Qué hizo Warren Buffett para ser millonario?

Precio de XRP: cuánto vale en Argentina y a nivel global hoy, 8 de abril de 2025

Cuál es el salario promedio pretendido por los argentinos y qué sectores tienen las mayores diferencias

Bill Gates, apocalíptico: reveló que la IA desplazará a los principales trabajos humanos

Cómo mejorar el rendimiento de los equipos con tecnología

Hoy escribe

Te puede interesar

Las predicciones de los especialistas sobre la crisis económica con los aranceles de Trump

La nueva inversión que recomiendan los expertos tras los aranceles de EEUU: de cuál se trata

Banco argentino demanda a Google por publicitar sitios de estafas

Optimizar los servicios en la nube: ¿la mayor preocupación de los profesionales IT?

Hoy escribe

ChatGPT revoluciona con su generador de imágenes con más de 700 millones creadas en una semana

Milei anunció que Argentina readecuará su legislación comercial para atenuar impacto de aranceles

Paso a paso para colocar música en los estados de WhatsApp

¿Cómo crear fotos de "action figure" con ChatGPT?

La IA llega al rubro petrolero: cómo funciona el chatbot de esta firma y cómo mejora la actividad

Ualá revela ahora cómo podés hacer rendir mucho mejor tu Cuenta Remunerada para ganar más

¿Por qué la ciberseguridad y las nuevas herramientas IT son los grandes retos del sector empresarial?

¿Un médico en tu iPhone?: Apple trabaja en una IA entrenada en salud

Bill Gates sorprendió con la cantidad de fortuna que dejará a sus hijos

Las predicciones de los especialistas sobre la crisis económica con los aranceles de Trump

La nueva inversión que recomiendan los expertos tras los aranceles de EEUU: de cuál se trata