Whisk è il nuovo strumento AI di Google che genera immagini remixando altre immagini.

Google ha annunciato Whisk, uno strumento innovativo che produce immagini utilizzando altre immagini come suggerimenti, eliminando così la necessità di lunghe descrizioni testuali.
Il sistema è concepito come un esperimento divertente che permette un approccio più intuitivo alla creazione di contenuti visivi, consentendo agli utenti di personalizzare il soggetto, la scena e lo stile delle immagini finali.
Come funziona Whisk
Whisk consente agli utenti di caricare più immagini per ogni elemento della creazione visiva: il soggetto principale, lo sfondo e lo stile artistico desiderato. In assenza di immagini, è possibile utilizzare un’icona a forma di dado che seleziona automaticamente suggerimenti visivi generati dall’IA.
Durante il processo, è possibile aggiungere ulteriori dettagli testuali opzionali per perfezionare il risultato. Una volta completata la richiesta, Whisk genera l’immagine accompagnata da un prompt testuale modificabile per ulteriori miglioramenti.
Secondo Google, Whisk è progettato per un’esplorazione visiva rapida, piuttosto che per modifiche pixel-perfect. La compagnia riconosce che l’IA potrebbe non ottenere sempre il risultato desiderato, offrendo quindi la possibilità di intervenire direttamente sui prompt generati.
Whisk si basa sull’ultima versione del modello Imagen 3 per la generazione di immagini, presentata in contemporanea da Google. Nel frattempo la compagnia ha annunciato Veo 2, l’evoluzione del suo modello per la generazione video. Veo 2 è stato progettato per comprendere meglio “il linguaggio unico della cinematografia” e per ridurre errori comuni, come la creazione di dita extra sulle mani dei soggetti.
Veo 2 sarà inizialmente integrato in VideoFX, accessibile tramite lista d’attesa su Google Labs, per poi essere esteso a YouTube Shorts e ad altri prodotti entro il prossimo anno.