OpenAI lanzó una inteligencia artificial que automatiza tareas en la web
/https://assets.iproup.com/assets/jpg/2024/02/37757.jpg)
OpenAI lanzó Operator, un agente de inteligencia artificial que puede navegar por la web y ejecutar tareas en línea por el usuario, como escribir, hacer clic y desplazarse en diversas páginas web de manera autónoma.
Este agente utiliza el modelo GPT-4, combinado con capacidades de visión computacional y aprendizaje por refuerzo, lo que le permite interactuar con interfaces gráficas de usuario (GUI) y realizar acciones de manera eficiente y precisa en sitios web.
Inicialmente disponible para suscriptores de ChatGPT Pro en Estados Unidos, Operator abre nuevas posibilidades de automatización y mejora de la experiencia de navegación digital.
OpenAI ha lanzado Operator, un agente de inteligencia artificial capaz de interactuar con páginas web, permitiendo al usuario realizar acciones como escribir, hacer clic y desplazarse, todo sin necesidad de integraciones API.
Según OpenAI, "El operador puede ver (a través de capturas de pantalla) e interactuar (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite realizar acciones en la web sin necesidad de integraciones API personalizadas."
Además, el operador emplea algoritmo avanzado para "autocorregirse" y, si encuentra un problema, cede el control al usuario.
En situaciones donde se requiera información sensible, como contraseñas, Operator solicitará aprobación al usuario antes de proceder, garantizando mayor seguridad. También requerirá confirmación cuando se intente enviar correos electrónicos.
La herramienta está diseñada para rechazar solicitudes dañinas y bloquear contenido inapropiado, con un enfoque en la seguridad.
En colaboración con empresas como DoorDash, Instacart y Uber, OpenAI asegura que Operator "abordará las necesidades del mundo real respetando las normas establecidas".
No obstante, la herramienta aún presenta dificultades con interfaces complejas, como la creación de presentaciones o la gestión de calendarios.
La empresa planea expandir esta función a usuarios Plus, Team y Enterprise e integrarla completamente en ChatGPT.
Operator, la nueva herramienta de OpenAI, destaca por su capacidad para interactuar de manera avanzada con páginas web, utilizando un navegador para realizar tareas sin necesidad de integraciones API personalizadas.
A continuación, se detallan algunas de sus características principales:
Sora es la primera herramienta de la empresa que puede crear vídeos a partir de una instrucción y que además combina tecnologías de procesamiento de lenguaje natural y renderizado visual.
Según sus creadores, el funcionamiento es muy sencillo. Los usuarios deben proporcionar textos, guiones o descripciones detalladas sobre el video que quieren inventar.
Sora ofrece una variedad de configuraciones estéticas, desde presentaciones corporativas hasta videos animados.
Luego de procesar los datos ingresados, la herramienta generará un video en HD y los usuarios podrán ajustar los detalles como transiciones o la música de fondo.
Sora ya se encuentra disponible en la web de OpenIA. Para acceder hay que realizar los siguientes pasos:
Esta plataforma no es de uso gratuito. Los usuarios requieren una membresía premium para acceder.
OpenIA posee dos planes para poder ingresar a Sora:
Cada plan posee sus limitaciones en la cantidad de contenido que se puede generar, en la resolución y en la duración de los videos.