Clona qualsiasi voce AI gratuitamente a livello locale con un solo clic! Crea voci personalizzate

Usa l'AI per clonare qualsiasi voce localmente in 1 clic! Crea facilmente voci personalizzate da clip audio. Scopri come accedere a migliaia di modelli vocali pre-addestrati e integrarli nei tuoi progetti in modo senza soluzione di continuità.

20 febbraio 2025

party-gif

Scopri il potere della clonazione di qualsiasi voce AI con solo pochi clip audio sul tuo computer. Sblocca infinite possibilità, da Morgan Freeman che ti legge una storia della buonanotte a Gordon Ramsay che urla insulti mentre cucini la cena. Questo post di blog ti mostrerà come utilizzare il fantastico programma open-source RVC per creare i tuoi modelli vocali e convertire qualsiasi audio nella voce della tua scelta, tutto gratuitamente e localmente sulla tua macchina.

Clona facilmente qualsiasi voce AI gratuitamente usando RVC

Per installare RVC, hai due opzioni:

  1. Installatore One-Click: Se sei un sostenitore di Patreon, puoi scaricare l'installatore one-click e semplicemente fare doppio clic sul file per installare RVC.

  2. Installazione manuale:

    • Assicurati di avere Python e Git for Windows installati.
    • Crea una nuova cartella sul tuo computer e apri il prompt dei comandi (CMD) in quella cartella.
    • Clona il repository RVC eseguendo git clone <repository-link> nel CMD.
    • Determina la tua versione di PyTorch eseguendo il comando fornito.
    • Crea un nuovo ambiente Python e attivalo.
    • Installa le dipendenze richieste.
    • Scarica i modelli e i file necessari.
    • Avvia il file go_webui.bat per avviare l'interfaccia web di RVC.

Installazione manuale di RVC per utenti avanzati

Per installare manualmente RVC, segui questi passaggi:

  1. Assicurati di avere Python e Git for Windows installati sul tuo computer.
  2. Crea una nuova cartella sul tuo computer e assegnale un nome a tua scelta.
  3. Apri il prompt dei comandi (CMD) digitando CMD nel percorso della cartella e premendo Invio.
  4. Sulla pagina GitHub, fai clic su "Code", quindi fai clic sull'icona di copia per copiare il link del repository.
  5. Nel prompt dei comandi, digita git clone e incolla il link copiato, quindi premi Invio per clonare il repository sul tuo computer.
  6. Naviga nella cartella clonata digitando cd seguito dal nome della cartella e premendo Invio.
  7. Determina la tua versione di PyTorch copiando e incollando il comando fornito nella descrizione e premendo Invio. Annota la versione "CU", ne avrai bisogno in seguito.
  8. Crea un nuovo ambiente Python digitando python -m venv env e premendo Invio.
  9. Attiva l'ambiente utilizzando il comando fornito nella descrizione, ma assicurati di sostituire "CU118" con la corretta versione "CU" che hai annotato in precedenza.
  10. Installa i requisiti eseguendo il comando fornito.
  11. Se si verifica un errore relativo al modulo NumPy, disinstallalo con pip uninstall numpy, quindi reinstallalo con la versione 1.23.5.
  12. Scarica i modelli eseguendo il comando python tools/download_models.py.
  13. Scarica i file ffmpeg.exe e ff.exe dal link fornito e posizionali nella cartella principale.
  14. Scarica i quattro file di lancio dal link fornito e posizionali nella cartella principale, sovrascrivendo i file esistenti.
  15. Avvia il file go_webui.bat per avviare l'interfaccia web di RVC.

Allena il tuo modello vocale personalizzato con RVC

Per addestrare il tuo modello vocale personalizzato con RVC, segui questi passaggi:

  1. Prepara i tuoi dati vocali:

    • Hai bisogno di almeno 10 minuti di registrazioni audio di alta qualità e pulite della tua voce.
    • Se stai clonando la voce di qualcun altro, scarica i video di interviste di quella persona e isola la sua voce utilizzando uno strumento come Audacity.
  2. Installa RVC:

    • Utilizza l'installatore one-click se sei un sostenitore di Patreon, oppure segui i passaggi di installazione manuale.
    • Assicurati di avere la versione CUDA corretta installata.
  3. Imposta l'addestramento:

    • Nell'interfaccia web di RVC, vai alla scheda "Train".
    • Inserisci un nome per il tuo nuovo clone vocale e imposta la frequenza di campionamento target.
    • Specifica il percorso della cartella dei tuoi dati vocali.
    • Seleziona le impostazioni di addestramento appropriate, come il numero di epoche di addestramento.
  4. Avvia l'addestramento:

    • Fai clic su "One Click Training" per iniziare l'addestramento del modello vocale.
    • Il processo di addestramento può richiedere circa 1-1,5 ore, a seconda della quantità di dati e dell'hardware.
  5. Utilizza il modello addestrato:

    • Una volta completato l'addestramento, puoi trovare i file del modello addestrato nelle cartelle "Assets" e "Logs".
    • Nella scheda "Model Inference", seleziona il tuo modello addestrato e regola il valore di trasposizione per abbinarlo all'audio di origine.
    • Converti qualsiasi file audio nella tua voce clonata fornendo il percorso del file audio e facendo clic su "Convert".
  6. (Opzionale) Utilizza modelli vocali pre-addestrati:

    • Visita voicemodels.com per scaricare modelli vocali pre-addestrati creati dalla community.
    • Estrai i file del modello e posizionali nelle cartelle appropriate, quindi utilizzali nell'interfaccia web di RVC.

Utilizza modelli vocali pre-addestrati con RVC

La community di RVC ha una vasta collezione di modelli vocali pre-addestrati che puoi scaricare e utilizzare direttamente, senza dover addestrare il tuo modello. Per trovare questi modelli, puoi visitare il sito web voicemodels.com.

Su questo sito web, puoi cercare qualsiasi modello vocale che desideri, come un personaggio o una celebrità specifici. Ad esempio, se vuoi utilizzare un modello vocale di SpongeBob, puoi semplicemente fare clic sul link per scaricare l'archivio pre-addestrato.

Una volta scaricato l'archivio, devi estrarre i due file in esso contenuti: un file .pth e un file di indice. Il file .pth deve essere posizionato nella cartella assets/wavs, mentre il file di indice deve essere posizionato nella cartella logs.

Dopodiché, puoi tornare all'interfaccia web di RVC, fare clic sul pulsante "Refresh voice list" e selezionare il modello vocale che hai appena aggiunto. Puoi quindi regolare il livello di ottava come necessario e fare clic su "Convert" per applicare il modello vocale al tuo audio.

Combina RVC con il text-to-speech per conversioni senza soluzione di continuità

Per combinare RVC con la sintesi vocale da testo, segui questi passaggi:

  1. Utilizza l'estensione Cooked TTS nell'interfaccia web di Text Generation per generare un file audio iniziale dal testo desiderato.
  2. Nell'estensione Cooked TTS, assicurati che il primo messaggio nella chat sia il testo che vuoi convertire in audio.
  3. Una volta generato il file audio, scaricalo e utilizzalo come input per il processo di conversione RVC.
  4. Nell'interfaccia web di RVC, seleziona il modello vocale che vuoi utilizzare per la conversione.
  5. Regola il valore di pitch/trasposizione come necessario per abbinarlo alla voce target.
  6. Fai clic su "Convert" per generare il file audio finale con la voce clonata.

Conclusione

In questa guida completa, abbiamo esplorato le potenti capacità di RVC (Real Voice Cloning), un programma open-source che ti permette di clonare qualsiasi voce e convertire i file audio in quella nuova voce. Abbiamo coperto il processo dettagliato di installazione di RVC, sia attraverso l'installatore one-click che il metodo di installazione manuale.

Hai imparato come preparare campioni audio di alta qualità, addestrare il tuo modello vocale personalizzato e persino sfruttare i modelli pre-addestrati dalla community di RVC. La capacità di clonare le voci apre un mondo di possibilità, dal far leggere una storia della buonanotte da Morgan Freeman all'avere Gordon Ramsay che ti insulta mentre cucini.

Inoltre, abbiamo discusso come integrare RVC con gli strumenti di sintesi vocale da testo, consentendoti di generare audio con la tua voce clonata senza la necessità di estese registrazioni audio. Questa integrazione senza soluzione di continuità consente applicazioni ancora più creative, come il role-playing in ambienti virtuali.

Ricorda che, sebbene le capacità di RVC siano impressionanti, è importante utilizzare questa tecnologia in modo responsabile ed etico. Rispetta la privacy e i diritti degli individui ed evita qualsiasi uso malevolo o ingannevole della clonazione vocale.

Abbraccia il potere di RVC e lascia che la tua creatività spicchi il volo. Le possibilità sono infinite e il futuro della tecnologia vocale è nelle tue mani.

FAQ