Skip to main content

OpenAI: Sora crea video realistici con input testuale

strumento sora di openai che genera video fotorealistici
  • Pubblicato:
    19 Febbraio 2024, 09:19
  • Aggiornato:
    19 Febbraio 2024, 09:20
Lorenzo Ricciutelli

OpenAI, azienda dietro ChatGPT, ha svelato giovedì un’incredibile novità: Sora, uno strumento capace di generare video partendo da semplici istruzioni testuali.

Il nome Sora, che in giapponese significa “cielo”, ben si adatta a questo modello innovativo, in grado di produrre filmati realistici fino a un minuto, seguendo fedelmente le indicazioni dell’utente – in forma testuale – relative a tematica e stile.

Il blog dell’azienda rivela che Sora non solo può generare video a partire da un’immagine fissa, ma è anche in grado di ampliare sequenze esistenti con nuovo materiale. “Stiamo insegnando all’intelligenza artificiale a interpretare e replicare il mondo fisico in movimento”, afferma il post, “con l’obiettivo di formare modelli utili alla risoluzione di problemi che implicano interazioni nel mondo reale”.

Un esempio, presentato dall’azienda, riguarda un video creato da Sora in risposta al prompt: “Un trailer cinematografico che racconta le avventure di un astronauta trentenne, con un casco da moto in lana rossa, cielo azzurro, deserto salino, stile cinematografico, girato in pellicola 35mm, colori vivaci”.

Ecco il risultato:

sora video astronauta

OpenAI ha reso noto di aver concesso l’accesso a Sora a un selezionato gruppo di ricercatori e creatori di video, incaricati di “testare” il prodotto per identificare eventuali punti deboli che potrebbero eludere i termini di servizio dell’azienda.

Questi ultimi vietano “violenza estrema, contenuti sessuali, immagini d’odio, somiglianze con celebrità o la proprietà intellettuale di terzi”, come specificato nel blog. Attualmente, l’accesso è limitato a ricercatori, artisti visivi e cineasti. Il CEO Sam Altman, in risposta ai prompt degli utenti su Twitter, ha condiviso alcune clip video realizzate da Sora, contraddistinte da un watermark che ne attesta la produzione AI.

Dopo il debutto nel 2021 del generatore di immagini fisse Dall-E e del chatbot AI generativo ChatGPT nel novembre 2022, che ha rapidamente raggiunto i 100 milioni di utenti, Sora rappresenta un ulteriore passo avanti per OpenAI nel campo dell’intelligenza artificiale.

Altre aziende del settore hanno introdotto strumenti di generazione video, ma questi hanno prodotto solo brevi sequenze spesso poco correlate ai prompt iniziali. Google e Meta hanno annunciato di essere al lavoro su strumenti video generativi, ancora non disponibili al pubblico. Mercoledì, OpenAI ha inoltre annunciato un esperimento per potenziare la memoria di ChatGPT, permettendogli di conservare più dati delle conversazioni degli utenti.

OpenAI non ha fornito dettagli sulla quantità di filmati utilizzati per l’addestramento di Sora né sulle fonti di tali video, se non per dire al New York Times che il materiale comprendeva video sia di pubblico dominio sia acquistati da detentori di diritti d’autore.

L’azienda è stata oggetto di diverse cause per presunta violazione di copyright nell’addestramento dei suoi strumenti AI generativi, che processano enormi quantità di materiale prelevato dalla rete e replicano immagini e testi contenuti in quei dataset.


Lorenzo Ricciutelli
Lorenzo Ricciutelli
Fondatore e autore di Techdot. Vivo da sempre con un’amore sfrenato per l’informatica e la tecnologia. Homo sanza lettere, discepolo della esperienza. Imprenditore digitale.