Skip to main content

Meta migliora la sua Suite AI per traduzioni vocali più naturali ed immediate

AI di Meta SeamlessExpressive
04 Dicembre 2023, 09:46 | Lorenzo Ricciutelli Lorenzo Ricciutelli

Meta, nel mese di agosto, ha svelato il suo nuovo modello di traduzione AI multimodale, chiamato SeamlessM4T.

Questo strumento, che supporta quasi 100 lingue per i testi e 36 per la voce, è stato ora potenziato con un’architettura “v2” aggiornata. L’obiettivo è rendere le traduzioni conversazionali più spontanee ed espressive, elementi finora mancanti in una conversazione autentica tra lingue diverse.

La prima delle due nuove funzionalità è “SeamlessExpressive”. Come suggerisce il nome, questa funzione trasferisce le espressioni dell’utente nella traduzione vocale. Queste espressioni includono tono di voce, volume, tono emotivo (come eccitazione, tristezza o sussurri), velocità del parlato e pause.

Fino ad oggi, le traduzioni vocali tendevano a suonare robotiche, ma questa innovazione potrebbe essere una svolta sia nella vita quotidiana che nella produzione di contenuti. Le lingue supportate includono inglese, spagnolo, tedesco, francese, italiano e cinese, sebbene al momento della stesura di questo articolo la pagina dimostrativa non include ancora l’italiano e il cinese.

La seconda funzione è “SeamlessStreaming“, che inizia a tradurre un discorso mentre il parlante sta ancora parlando. Ciò consente agli altri di ascoltare la traduzione più rapidamente. C’è ancora una breve latenza di poco meno di due secondi, ma non è necessario attendere che qualcuno finisca una frase per ascoltare la traduzione. Meta ha dovuto sviluppare un algoritmo specifico per analizzare l’input audio parziale e decidere se c’è abbastanza contesto per iniziare a generare una traduzione, o se continuare ad ascoltare.

L’ultimo sviluppo di Meta in questa suite “Seamless Communication” sembra essere notevole, forse anche più delle soluzioni di interpretariato mobile offerte da aziende come Google e Samsung. Non è ancora chiaro quando il pubblico potrà utilizzare queste nuove funzionalità, ma è facile immaginare che Meta le integri nei suoi occhiali intelligenti, rendendoli ancora più pratici di prima.

La ricerca di MetaFonte


Lorenzo Ricciutelli
Lorenzo Ricciutelli
Fondatore e autore di Techdot. Vivo da sempre con un’amore sfrenato per l’informatica e la tecnologia. Homo sanza lettere, discepolo della esperienza. Imprenditore digitale.