OpenAI lanzó Operator, un agente de inteligencia artificial que puede navegar por la web y ejecutar tareas en línea por el usuario, como escribir, hacer clic y desplazarse en diversas páginas web de manera autónoma.
Este agente utiliza el modelo GPT-4, combinado con capacidades de visión computacional y aprendizaje por refuerzo, lo que le permite interactuar con interfaces gráficas de usuario (GUI) y realizar acciones de manera eficiente y precisa en sitios web.
Inicialmente disponible para suscriptores de ChatGPT Pro en Estados Unidos, Operator abre nuevas posibilidades de automatización y mejora de la experiencia de navegación digital.
Operator: la nueva IA que interactúa en la web
OpenAI ha lanzado Operator, un agente de inteligencia artificial capaz de interactuar con páginas web, permitiendo al usuario realizar acciones como escribir, hacer clic y desplazarse, todo sin necesidad de integraciones API.
Según OpenAI, "El operador puede ver (a través de capturas de pantalla) e interactuar (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite realizar acciones en la web sin necesidad de integraciones API personalizadas."
Además, el operador emplea algoritmo avanzado para "autocorregirse" y, si encuentra un problema, cede el control al usuario.
En situaciones donde se requiera información sensible, como contraseñas, Operator solicitará aprobación al usuario antes de proceder, garantizando mayor seguridad. También requerirá confirmación cuando se intente enviar correos electrónicos.
La herramienta está diseñada para rechazar solicitudes dañinas y bloquear contenido inapropiado, con un enfoque en la seguridad.
En colaboración con empresas como DoorDash, Instacart y Uber, OpenAI asegura que Operator "abordará las necesidades del mundo real respetando las normas establecidas".
No obstante, la herramienta aún presenta dificultades con interfaces complejas, como la creación de presentaciones o la gestión de calendarios.
La empresa planea expandir esta función a usuarios Plus, Team y Enterprise e integrarla completamente en ChatGPT.
Características clave de Operator de OpenAI
Operator, la nueva herramienta de OpenAI, destaca por su capacidad para interactuar de manera avanzada con páginas web, utilizando un navegador para realizar tareas sin necesidad de integraciones API personalizadas.
A continuación, se detallan algunas de sus características principales:
- Interacción web: Operator puede ver y realizar acciones dentro de un navegador, como desplazarse, hacer clic y escribir, sin requerir integraciones API personalizadas. Utiliza por visión computadora para interactuar con interfaces gráficas de usuario.
- Razonamiento autónomo: La herramienta tiene la capacidad de autocorregirse mediante razonamiento avanzado. Si se encuentra bloqueada, ceda el control al usuario para que pueda completar la tarea.
- Seguridad y privacidad: Cuando un sitio web solicita información confidencial, como credenciales de inicio de sesión, Operator solicita al usuario que tome el control y apruebe acciones, garantizando seguridad en los procesos.
- Filtrado de contenido: Operator fue diseñado para rechazar solicitudes dañinas y bloquear contenido no permitido, ayudando a proteger al usuario de interacciones peligrosas en línea.
- Colaboración con plataformas: OpenAI está trabajando con empresas como Uber, DoorDash y Thumbtack para adaptar Operator a las necesidades prácticas del mundo real, respetando siempre las normas establecidas.
De que se trata la Sora, la nueva herramienta de OpenAI
Sora es la primera herramienta de la empresa que puede crear vídeos a partir de una instrucción y que además combina tecnologías de procesamiento de lenguaje natural y renderizado visual.
Según sus creadores, el funcionamiento es muy sencillo. Los usuarios deben proporcionar textos, guiones o descripciones detalladas sobre el video que quieren inventar.
Sora ofrece una variedad de configuraciones estéticas, desde presentaciones corporativas hasta videos animados.
Luego de procesar los datos ingresados, la herramienta generará un video en HD y los usuarios podrán ajustar los detalles como transiciones o la música de fondo.
Sora ya se encuentra disponible en la web de OpenIA. Para acceder hay que realizar los siguientes pasos:
- Ingresar al sitio web
- Entrar a la cuenta de OpenIA
- Ingresar a la plataforma y escribir una descripción de lo que se busca.
- Esperar a que la plataforma cree los videos
- Ajustar detalles
Esta plataforma no es de uso gratuito. Los usuarios requieren una membresía premium para acceder.
OpenIA posee dos planes para poder ingresar a Sora:
- ChatGPT Plus, que posee un valor de u$s20
- ChatGPT Pro, que posee un valor de u$s200
Cada plan posee sus limitaciones en la cantidad de contenido que se puede generar, en la resolución y en la duración de los videos.