Skip to main content

Google libera SynthID: che scopre se un testo è stato scritto da un’IA

Google Synthid
24 Ottobre 2024, 11:25 | Lorenzo Ricciutelli Lorenzo Ricciutelli

Google ha reso open-source SynthID, lo strumento di watermarking che riconosce i testi generati dall’intelligenza artificiale. Ora, grazie al Google Responsible Generative AI Toolkit, gli sviluppatori possono verificare se i testi provengono da un modello IA, favorendo un uso più responsabile di queste tecnologie.

Quello di Google è da intendersi come un passo importante per contrastare l’uso improprio degli LLM, i Large Language Model, la tecnologia dietro alla generazione dei testi con l’IA. I testi generati con l’intelligenza artificiale possono essere utilizzati per scopi preoccupanti, come disinformazione e fake news, creazione di contenuti non consensuali e altre attività poco raccomandabili.

Come funziona SynthID

Il processo è semplice ma sofisticato. Durante la generazione di testo, il modello IA prevede la sequenza di token, ossia parole o parti di frasi, basandosi sul calcolo delle probabilità. SynthID interviene modificando leggermente queste probabilità, in modo da inserire un watermark invisibile senza alterare la qualità o la coerenza del contenuto.

Per esempio, se il modello deve completare la frase “I miei frutti tropicali preferiti sono __”, SynthID può regolare le probabilità di scelta tra opzioni come “mango”, “lychee” o “papaya”, senza che la frase finale risulti compromessa. Questo processo si ripete attraverso tutto il testo, creando un pattern unico che permette di identificare se un contenuto è stato generato da un’IA.

Google ha già integrato SynthID nel suo chatbot Gemini e ha testato la sua capacità di funzionare su testi di varie lunghezze e formati, compresi quelli parafrasati o leggermente modificati; purtroppo la tecnologia mostra grandi limitazioni con testi molto brevi o profondamente riscritti, nonché con risposte a domande dirette basate su fatti.

Nonostante non rappresenti una soluzione definitiva al problema, Google vede SynthID come un passo importante per lo sviluppo di strumenti più affidabili e avanzati nel campo dell’identificazione dei contenuti IA. “Abbiamo reso questa tecnologia disponibile a tutti gli sviluppatori per facilitare la costruzione di IA responsabile” ha dichiarato Pushmeet Kohli, vicepresidente della ricerca di Google DeepMind.

Regolamentazioni e futuro del watermarking IA

L’importanza del watermarking si riflette anche nelle recenti iniziative di regolamentazione a livello globale. In California, le autorità stanno considerando di rendere obbligatorio il watermarking per i contenuti IA, mentre la Cina ha già implementato una normativa simile.

FonteVia


Lorenzo Ricciutelli
Fondatore e autore di Techdot. Vivo da sempre con un’amore sfrenato per l’informatica e la tecnologia. Homo sanza lettere, discepolo della esperienza. Imprenditore digitale.