Nel corso della sua conferenza Adobe MAX a San Diego, l’azienda Adobe ha presentato Project VoCo, l’ultima tecnologia software descritta dalla società come di un “motore di conversione vocale”, un vero e proprio Photoshop per i file audio, dato che il software è in grado di modificare a piacimento elementi provenienti dalla realtà.
VoCo è stato sviluppato in collaborazione con l’Università di Princeton. Il nuovo software è stato presentato da Zeyu Jin, uno degli sviluppatori del team, che ne ha mostrato le funzioni principali, ossia quelle di modificare, aggiungere o eliminare parole dall’audio come se fosse un testo.
Per poter funzionare correttamente, Project VoCo necessita di circa 20 minuti complessivi di registrazione di campioni audio. Gli algoritmi ne analizzano il parlato e frammentano le parole in singoli fonemi. In questo modo il modello vocale è pronto e VoCo acquisisce il timbro di voce del soggetto originale mentre il testo del discorso può essere modificato a piacimento come in un programma di videoscrittura.
Project VoCo è ancora un software in fase di sviluppo, e dovrà essere ancora perfezionato. Se si ascolta attentamente, difatti, è possibile individuare i punti dove la voce è stata modificata.
Come sottolinea The Verge, la demo mostrata è solamente un prototipo e la dimostrazione è solo un assaggio di quello che Adobe ha in serbo per il futuro. Non è stato reso noto se e quando il programma verrà rilasciato per scopi commerciali.
Il software fa certamente sorgere alcuni dubbi sull’etica delle azioni che si potrebbero svolgere con l’uso del software, ma potrebbe essere molto utile in compiti di editing come correggere errori di pronuncia o ripulire registrazioni e podcast.
Di seguito la clip dimostrativa di Adobe VoCo