Clonez n'importe quelle voix IA GRATUITEMENT localement en 1 clic ! Créez des voix personnalisées

Utilisez l'IA pour cloner n'importe quelle voix localement en 1 clic ! Créez facilement des voix personnalisées à partir de clips audio. Découvrez comment accéder à des milliers de modèles vocaux pré-entraînés et les intégrer parfaitement à vos projets.

24 février 2025

party-gif

Découvrez la puissance du clonage de n'importe quelle voix d'IA avec seulement quelques clips audio sur votre ordinateur. Déverrouillez des possibilités infinies, de Morgan Freeman vous lisant une histoire du soir à Gordon Ramsay vous criant des insultes pendant que vous cuisinez le dîner. Cet article de blog vous montrera comment utiliser le programme open-source incroyable RVC pour créer vos propres modèles vocaux et convertir n'importe quel audio dans la voix de votre choix, le tout gratuitement et localement sur votre machine.

Clonez facilement n'importe quelle voix IA gratuitement avec RVC

Pour installer RVC, vous avez deux options :

  1. Installateur en un clic : Si vous êtes un supporter Patreon, vous pouvez télécharger l'installateur en un clic et double-cliquer simplement sur le fichier pour installer RVC.

  2. Installation manuelle :

    • Assurez-vous d'avoir Python et Git for Windows installés.
    • Créez un nouveau dossier sur votre ordinateur et ouvrez l'invite de commande (CMD) dans ce dossier.
    • Clonez le dépôt RVC en exécutant git clone <lien-du-dépôt> dans la CMD.
    • Déterminez votre version de PyTorch en exécutant la commande fournie.
    • Créez un nouvel environnement Python et activez-le.
    • Installez les dépendances requises.
    • Téléchargez les modèles et fichiers nécessaires.
    • Lancez le fichier go_webui.bat pour démarrer l'interface Web de RVC.

Pour cloner une voix :

  1. Dans l'onglet "Train", entrez un nom pour votre nouveau clone vocal et définissez le taux d'échantillonnage cible.
  2. Fournissez le chemin de vos fichiers audio d'entraînement (au moins 10 minutes d'audio de haute qualité).
  3. Configurez les paramètres d'entraînement, tels que le nombre d'époques d'entraînement, la taille du lot et la fréquence de sauvegarde.
  4. Cliquez sur "One-Click Training" pour démarrer le processus d'entraînement.

Une fois l'entraînement terminé, vous pouvez utiliser la voix clonée dans l'onglet "Model Inference". Ajustez la valeur de transposition pour correspondre à la hauteur de l'audio source, sélectionnez le chemin du fichier audio que vous souhaitez convertir et cliquez sur "Convert" pour générer le nouvel audio avec la voix clonée.

Alternativement, vous pouvez télécharger des modèles de voix préentraînés depuis la communauté sur des sites Web comme voicemodels.com et les utiliser directement sans avoir besoin d'entraînement.

Pour utiliser la synthèse vocale avec la voix clonée, vous pouvez exploiter l'extension Cooked TTS dans l'interface Web de Text Generation. Générez l'audio initial à l'aide de Cooked TTS, puis convertissez-le dans la voix clonée à l'aide de RVC.

N'oubliez pas que, bien que RVC vous permette de cloner n'importe quelle voix, il est important d'utiliser cette technologie de manière responsable et éthique.

Installation manuelle de RVC pour les utilisateurs avancés

Pour installer manuellement RVC, suivez ces étapes :

  1. Assurez-vous d'avoir Python et Git for Windows installés sur votre ordinateur.
  2. Créez un nouveau dossier sur votre ordinateur et donnez-lui le nom de votre choix.
  3. Ouvrez l'invite de commande (CMD) en tapant "CMD" dans le chemin du dossier et en appuyant sur Entrée.
  4. Sur la page GitHub, cliquez sur "Code", puis sur l'icône de copie pour copier le lien du dépôt.
  5. Dans l'invite de commande, tapez "git clone" et collez le lien copié, puis appuyez sur Entrée pour cloner le dépôt sur votre ordinateur.
  6. Accédez au dossier cloné en tapant "cd" suivi du nom du dossier et en appuyant sur Entrée.
  7. Déterminez votre version de PyTorch en copiant et en collant la commande fournie dans la description, puis en appuyant sur Entrée. Notez la version "CU", vous en aurez besoin plus tard.
  8. Créez un nouvel environnement Python en tapant "python -m venv env" et en appuyant sur Entrée.
  9. Activez l'environnement à l'aide de la commande fournie dans la description, mais assurez-vous de remplacer "CU118" par la version "CU" correcte que vous avez notée précédemment.
  10. Installez les exigences en exécutant la commande fournie.
  11. Si vous rencontrez une erreur liée au module NumPy, désinstallez-le avec "pip uninstall numpy", puis réinstallez-le avec la version 1.23.5.
  12. Téléchargez les modèles en exécutant la commande "python tools/download_models.py".
  13. Téléchargez les fichiers "ffmpeg.exe" et "ff.exe" à partir du lien fourni et placez-les dans le dossier principal.
  14. Téléchargez les quatre fichiers de lancement à partir du lien fourni et placez-les dans le dossier principal, en écrasant les fichiers existants.
  15. Lancez le fichier "go_webui.bat" pour démarrer l'interface Web de RVC.

Vous êtes maintenant prêt à commencer à cloner des voix à l'aide de RVC !

Entraînez votre propre modèle vocal avec RVC

Pour entraîner votre propre modèle vocal avec RVC, suivez ces étapes :

  1. Préparez vos données vocales :

    • Vous avez besoin d'au moins 10 minutes d'enregistrements audio de haute qualité et propres de votre voix.
    • Si vous clonez la voix de quelqu'un d'autre, téléchargez des vidéos d'interview de cette personne et isolez sa voix à l'aide d'un outil comme Audacity.
  2. Installez RVC :

    • Utilisez l'installateur en un clic si vous êtes un supporter Patreon, ou suivez les étapes d'installation manuelle.
    • Assurez-vous d'avoir la version CUDA correcte installée.
  3. Configurez l'entraînement :

    • Dans l'interface Web de RVC, accédez à l'onglet "Train".
    • Entrez un nom pour votre nouveau clone vocal et définissez le taux d'échantillonnage cible.
    • Spécifiez le chemin du dossier contenant vos données vocales.
    • Sélectionnez les paramètres d'entraînement appropriés, comme le nombre d'époques d'entraînement.
  4. Démarrez l'entraînement :

    • Cliquez sur "One Click Training" pour commencer l'entraînement du modèle vocal.
    • Le processus d'entraînement peut prendre environ 1 à 1,5 heure, selon la quantité de données et votre matériel.
  5. Utilisez le modèle entraîné :

    • Une fois l'entraînement terminé, vous pouvez trouver les fichiers du modèle entraîné dans les dossiers "Assets" et "Logs".
    • Dans l'onglet "Model Inference", sélectionnez votre modèle entraîné et ajustez la valeur de transposition pour correspondre à l'audio source.
    • Convertissez n'importe quel fichier audio dans votre voix clonée en fournissant le chemin du fichier audio et en cliquant sur "Convert".
  6. (Facultatif) Utilisez des modèles de voix préentraînés :

    • Visitez le site voicemodels.com pour télécharger des modèles de voix préentraînés créés par la communauté.
    • Extrayez les fichiers du modèle et placez-les dans les dossiers appropriés, puis utilisez-les dans l'interface Web de RVC.

N'oubliez pas que la qualité de la voix clonée finale dépend de la qualité et de la durée des données audio source. Expérimentez avec différents paramètres et sources audio pour obtenir les meilleurs résultats.

Utilisez des modèles vocaux pré-entraînés avec RVC

La communauté RVC dispose d'une immense collection de modèles de voix préentraînés que vous pouvez télécharger et utiliser directement, sans avoir à entraîner votre propre modèle. Pour trouver ces modèles, vous pouvez visiter le site Web voicemodels.com.

Sur ce site Web, vous pouvez rechercher n'importe quel modèle de voix que vous voulez, comme un personnage ou une célébrité spécifique. Par exemple, si vous voulez utiliser un modèle de voix de Bob l'éponge, vous pouvez simplement cliquer sur le lien pour télécharger l'archive préentraînée.

Une fois que vous avez l'archive téléchargée, vous devez extraire les deux fichiers qu'elle contient : un fichier .pth et un fichier d'index. Le fichier .pth doit être placé dans le dossier assets/wavs, et le fichier d'index doit être placé dans le dossier logs.

Après cela, vous pouvez retourner dans l'interface Web de RVC, cliquer sur le bouton "Refresh voice list", puis sélectionner le modèle de voix que vous venez d'ajouter. Vous pouvez ensuite ajuster le niveau d'octave si nécessaire et cliquer sur "Convert" pour appliquer le modèle de voix à votre audio.

Ce processus vous permet d'utiliser des modèles de voix préentraînés sans avoir à passer par tout le processus d'entraînement vous-même, ce qui le rend beaucoup plus rapide et plus facile pour cloner des voix.

Combinez RVC avec la synthèse vocale pour des conversions fluides

Pour combiner RVC avec la synthèse vocale pour des conversions transparentes, suivez ces étapes :

  1. Utilisez l'extension Cooked TTS dans l'interface Web de Text Generation WebUI pour générer un fichier audio initial à partir du texte souhaité.
  2. Dans l'extension Cooked TTS, assurez-vous que le premier message dans le chat est le texte que vous voulez convertir en audio.
  3. Une fois le fichier audio généré, téléchargez-le et utilisez-le comme entrée pour le processus de conversion RVC.
  4. Dans l'interface Web de RVC, sélectionnez le modèle de voix que vous voulez utiliser pour la conversion.
  5. Ajustez la valeur de hauteur/transposition si nécessaire pour correspondre à la voix cible.
  6. Cliquez sur "Convert" pour générer le fichier audio final avec la voix clonée.

Cette approche vous permet de tirer parti des capacités de synthèse vocale de l'interface Web de Text Generation WebUI pour créer l'audio initial, puis d'utiliser RVC pour convertir cet audio dans la voix clonée souhaitée. Cela offre un flux de travail transparent pour créer de l'audio avec une voix clonée à partir d'entrées textuelles.

Conclusion

Dans ce guide complet, nous avons exploré les puissantes capacités de RVC (Real Voice Cloning), un programme open source qui vous permet de cloner n'importe quelle voix et de convertir des fichiers audio dans cette nouvelle voix. Nous avons couvert le processus étape par étape pour installer RVC, à la fois via l'installateur en un clic et la méthode d'installation manuelle.

Vous avez appris à préparer des échantillons audio de haute qualité, à entraîner votre propre modèle vocal et même à exploiter des modèles préentraînés de la communauté RVC. La capacité de cloner des voix ouvre un monde de possibilités, de la lecture d'une histoire du soir par Morgan Freeman aux insultes de Gordon Ramsay pendant que vous cuisinez.

De plus, nous avons discuté de la façon d'intégrer RVC aux outils de synthèse vocale, vous permettant de générer de l'audio avec votre voix clonée sans avoir besoin d'enregistrements audio étendus. Cette intégration transparente permet des applications encore plus créatives, comme le jeu de rôle dans des environnements virtuels.

N'oubliez pas que, bien que les capacités de RVC soient impressionnantes, il est important d'utiliser cette technologie de manière responsable et éthique. Respectez la vie privée et les droits des individus, et évitez toute utilisation malveillante ou trompeuse du clonage vocal.

Embrassez la puissance de RVC et laissez libre cours à votre créativité. Les possibilités sont infinies, et l'avenir de la technologie vocale est entre vos mains.

FAQ