Skip to main content

OpenAI presenta o3, il nuovo modello che ragiona, ma non sarà disponibile subito

Il logo ufficiale di OpenAI su illustrazione con immagine
23 Dicembre 2024, 11:57 | Lorenzo Ricciutelli Lorenzo Ricciutelli

OpenAI ha introdotto i nuovi modelli di intelligenza artificiale o3 e o3-mini nell’ultimo giorno dell’evento ship-mas. Questi modelli non saranno rilasciati immediatamente al pubblico, poiché l’azienda sta lavorando a ulteriori ottimizzazioni prima di renderli disponibili.

Per ora, la compagnia invita la comunità di ricerca a testare e analizzare i nuovi sistemi, rimandando il rilascio a una data ancora non definita. La presentazione segue il lancio del modello o1, conosciuto con il nome in codice Strawberry, avvenuto a settembre. È probabile che OpenAI abbia deciso di saltare il nome o2 per evitare sovrapposizioni con il marchio della compagnia di telecomunicazioni britannica O2.

Al centro dell’innovazione è il concetto di “ragionamento”. In ambito AI, il termine si riferisce alla capacità di un modello di scomporre compiti complessi in passaggi più piccoli e spiegare il percorso logico seguito per arrivare a una risposta. Questo approccio rende le risposte dell’intelligenza artificiale più trasparenti, anziché limitarsi a fornire un risultato senza contesto.

Secondo OpenAI, il modello o3 ha raggiunto risultati straordinari. Ha superato del 22,8% il modello precedente nel test di programmazione SWE-Bench Verified e ha ottenuto prestazioni superiori persino a quelle del Chief Scientist di OpenAI in ambito di programmazione. Nel campo della matematica, o3 ha completato quasi alla perfezione una delle sfide più difficili, l’AIME 2024, e ha raggiunto l’87,7% nel benchmark GPQA Diamond per quanto riguarda la risoluzione di problemi scientifici complessi. In test estremamente difficili di matematica e ragionamento, il modello ha risolto il 25,2% dei problemi, un traguardo mai raggiunto da nessun altro sistema, che si fermavano al 2%.

Sicurezza e allineamento deliberativo

OpenAI sta esplorando anche dei nuovi paradigmi di sicurezza con l’introduzione dell’allineamento deliberativo, una metodologia che richiede ai modelli di ragionare attivamente su richieste potenzialmente problematiche. Invece di rispondere con regole rigide, il modello valuta passo dopo passo se la richiesta è conforme alle politiche di OpenAI. Durante i test sul modello o1, questo approccio ha mostrato un miglioramento netto rispetto ai modelli precedenti, incluso GPT-4, nel rispettare le linee guida di sicurezza.

Tag: | |

Lorenzo Ricciutelli
Fondatore e autore di Techdot. Vivo da sempre con un’amore sfrenato per l’informatica e la tecnologia. Homo sanza lettere, discepolo della esperienza. Imprenditore digitale.