Voice Engine di OpenAI è certamente un tool potente e innovativo, che può essere utilizzato per diversi scopi legittimi e socialmente vantaggiosi.
Si tratta di un nuovo tool di sintesi vocale che permette di clonare una voce partendo da un campione audio di soli 15 secondi. Le capacità del modello AI di generare voci sintetiche a partire da un input testuale sono dimostrate da alcuni esempi pubblicati da OpenAI. L’azienda ha riferito che lo ha già impiegato nelle API text-to-speech e nella funzione “Leggi ad alta voce” di ChatGPT
Tuttavia, come evidenziato anche da OpenAI stessa, ci sono seri rischi legati a un possibile uso improprio, come la manipolazione delle voci per fini ingannevoli o dannosi.
È importante che l’azienda continui a collaborare con partner provenienti da vari settori per mettere in atto misure di sicurezza e prevenzione, e che mantenga la massima trasparenza riguardo alle politiche di utilizzo e ai possibili rischi associati alla tecnologia.
Il rilascio pubblico di Voice Engine potrebbe avvenire in futuro, ma è chiaro che OpenAI sta procedendo con estrema cautela per garantire che la tecnologia venga utilizzata in modo responsabile e etico.
Per il momento Voice Engine sarà distribuito a una decina di sviluppatori e sarà data la precedenza al suo utilizzo in attività considerate «a basso rischio» e «socialmente vantaggiose». Tra coloro che stanno testando Voice Engine c’è Spotify, che lo utilizza dall’inizio di settembre per doppiare i podcast di conduttori di primo livello in svariate lingue.