Skip to main content

Su ChatGPT arrivano gli Operator che controllano il browser al posto nostro

ChatGPT Operator, agente ai che naviga il web per noi
24 Gennaio 2025, 10:32 | Lorenzo Ricciutelli Lorenzo Ricciutelli

OpenAI ha presentato Operator, un agente intelligente in grado di navigare su internet e compiere azioni concrete: clicca, scrive e scrolla.

L’annuncio è stato accolto con entusiasmo, ma anche con una sana dose di curiosità: l’idea di un software che, al posto nostro, interagisce con i siti web senza richiedere API personalizzate fa intravedere scenari d’uso interessanti.

Come funziona Operator di ChatGPT

La tecnologia si basa su un modello denominato “Computer-Using Agent” che sfrutta le capacità visive di GPT-4o e un raffinato sistema di ragionamento, messo a punto tramite il reinforcement learning. In pratica, Operator “vede” le schermate tramite screenshot e può agire come farebbe un utente: clicca con il mouse, scrolla, inserisce dati. L’idea è di semplificare attività ripetitive o complesse, senza dover attendere l’implementazione di API specifiche per ogni servizio web.

Ecco una dimostrazione pratica:

Funzioni e limiti

Operator nasce con l’obiettivo di facilitare operazioni del tipo: compilare form online o eseguire procedure ripetitive. Se, però, la piattaforma web richiede credenziali di accesso o dati sensibili, l’AI chiede all’utente di prendere il controllo in prima persona. OpenAI spiega inoltre che Operator è in grado di “auto-correggersi” nei processi che richiedono un certo grado di ragionamento, ma se dovesse incagliarsi, cederà il passo a chi sta davanti allo schermo.

Un altro aspetto delicato è la questione della sicurezza e della gestione dei dati. OpenAI rassicura che Operator è stato progettato per bloccare i contenuti non consentiti e rifiutare richieste potenzialmente dannose, ma la complessità degli scenari reali potrebbe comunque presentare incognite. Speriamo che per il mondo AI la lezione di Microsoft con Recall sia stata d’insegnamento.

Per rendere Operator davvero utile OpenAI ha già avviato collaborazioni con aziende come DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack e Uber: società che potrebbero trarre vantaggio da un AI capace di gestire pagine e processi web in modo rapido e automatizzato. Va detto, tuttavia, che OpenAI stessa ammette la presenza di limiti tecnici: per esempio, gestire interfacce particolarmente complesse come la creazione di slideshow o la sincronizzazione dei calendari è ancora un’impresa non del tutto risolta.

Disponibilità e costi

Al momento, Operator è proposto come “research preview” negli Stati Uniti, riservato agli utenti che sottoscrivono il piano ChatGPT Pro di OpenAI, dal costo di 200 dollari al mese. Non è chiaro quando e se arriverà nelle altre fasce di abbonamento (Plus, Team ed Enterprise) o in altri mercati, ma l’azienda ha già dichiarato che intende includerlo in ChatGPT in futuro.

Tag: | |

Lorenzo Ricciutelli
Fondatore e autore di Techdot. Vivo da sempre con un’amore sfrenato per l’informatica e la tecnologia. Homo sanza lettere, discepolo della esperienza. Imprenditore digitale.