Klona Vilken AI-röst Som Helst Gratis Lokalt Med 1 Klick! Skapa Anpassade Röster

Använd AI för att klona någon röst lokalt med ett klick! Skapa enkelt anpassade röster från ljudklipp. Upptäck hur du får tillgång till tusentals förtränade röstmodeller och integrerar dem i dina projekt sömlöst.

14 februari 2025

party-gif

Upptäck kraften i att klona vilken AI-röst som helst med bara några få ljudklipp på din dator. Lås upp oändliga möjligheter, från Morgan Freeman som läser en godnattsaga för dig till Gordon Ramsay som skriker förolämpningar när du lagar middag. Det här blogginlägget kommer att visa dig hur du använder det fantastiska öppenkällprogrammet RVC för att skapa dina egna röstmodeller och konvertera all audio till rösten du väljer, allt gratis och lokalt på din dator.

Klona enkelt vilken AI-röst som helst gratis med hjälp av RVC

För att installera RVC har du två alternativ:

  1. Enklick-installerare: Om du är en Patreon-supporter kan du ladda ner enklick-installeraren och dubbelklicka på filen för att installera RVC.

  2. Manuell installation:

    • Se till att du har Python och Git för Windows installerat.
    • Skapa en ny mapp på din dator och öppna kommandotolken (CMD) i den mappen.
    • Klona RVC-databasen genom att köra git clone <repository-länk> i CMD.
    • Ta reda på din PyTorch-version genom att köra det angivna kommandot.
    • Skapa en ny Python-miljö och aktivera den.
    • Installera de nödvändiga beroendena.
    • Ladda ner de nödvändiga modellerna och filerna.
    • Starta go_webui.bat-filen för att starta RVC:s webbgränssnitt.

För att klona en röst:

  1. I fliken "Train" anger du ett namn för din nya röstkloning och ställer in målsamplingsfrekvensen.
  2. Ange sökvägen till dina träningsljudfiler (minst 10 minuter högkvalitativ ljudinspelning).
  3. Konfigurera träningsinställningarna, som antal träningsepokker, batchstorlek och sparfrekvens.
  4. Klicka på "One-Click Training" för att starta träningsprocessen.

När träningen är klar kan du använda den klonade rösten i fliken "Model Inference". Justera transponeringsvärdena för att matcha källljudets tonhöjd, välj sökvägen till ljudfilen du vill konvertera och klicka på "Convert" för att generera det nya ljudet med den klonade rösten.

Alternativt kan du ladda ner färdiga röstmodeller från communityn på webbplatser som voicemodels.com och använda dem direkt utan att behöva träna dem.

För att använda text-till-tal med den klonade rösten kan du använda Cooked TTS-tillägget i Text Generation-webbgränssnittet. Generera den initiala ljudfilen med Cooked TTS och konvertera den sedan till den klonade rösten med RVC.

Tänk på att även om RVC låter dig klona vilken röst som helst är det viktigt att använda den här tekniken ansvarsfullt och etiskt.

Installera RVC manuellt för avancerade användare

För att manuellt installera RVC, följ dessa steg:

  1. Se till att du har Python och Git för Windows installerat på din dator.
  2. Skapa en ny mapp på din dator och ge den ett önskat namn.
  3. Öppna kommandotolken (CMD) genom att skriva "CMD" i mappens sökväg och tryck på Enter.
  4. På GitHub-sidan, klicka på "Code" och sedan på kopierings-ikonen för att kopiera databasens länk.
  5. I kommandotolken, skriv "git clone" och klistra in den kopierade länken, tryck sedan på Enter för att klona databasen till din dator.
  6. Navigera till den klonade mappen genom att skriva "cd" följt av mappnamnet och tryck på Enter.
  7. Ta reda på din PyTorch-version genom att kopiera och klistra in det angivna kommandot och trycka på Enter. Notera "CU"-versionen, du kommer att behöva den senare.
  8. Skapa en ny Python-miljö genom att skriva "python -m venv env" och trycka på Enter.
  9. Aktivera miljön med det angivna kommandot, men se till att ersätta "CU118" med rätt "CU"-version du noterade tidigare.
  10. Installera kraven genom att köra det angivna kommandot.
  11. Om du stöter på ett fel relaterat till NumPy-modulen, avinstallera den med "pip uninstall numpy" och installera sedan om den med version 1.23.5.
  12. Ladda ner modellerna genom att köra kommandot "python tools/download_models.py".
  13. Ladda ner "ffmpeg.exe" och "ff.exe"-filerna från den angivna länken och placera dem i huvudmappen.
  14. Ladda ner de fyra startfilerna från den angivna länken och placera dem i huvudmappen, skriv över eventuella befintliga filer.
  15. Starta "go_webui.bat"-filen för att starta RVC:s webbgränssnitt.

Nu är du redo att börja klona röster med RVC!

Träna din egen röstmodell med RVC

För att träna din egen röstmodell med RVC, följ dessa steg:

  1. Förbered dina röstdata:

    • Du behöver minst 10 minuter högkvalitativ, ren ljudinspelning av din röst.
    • Om du klonar någon annans röst, ladda ner intervjuvideor av dem och isolera deras röst med ett verktyg som Audacity.
  2. Installera RVC:

    • Använd enklick-installeraren om du är en Patreon-supporter, eller följ de manuella installationsstegen.
    • Se till att du har rätt CUDA-version installerad.
  3. Konfigurera träningen:

    • I RVC:s webbgränssnitt, gå till fliken "Train".
    • Ange ett namn för din nya röstkloning och ställ in målsamplingsfrekvensen.
    • Ange sökvägen till din röstdatamapp.
    • Välj lämpliga träningsinställningar, som antal träningsepokker.
  4. Starta träningen:

    • Klicka på "One Click Training" för att påbörja träningen av röstmodellen.
    • Träningsprocessen kan ta runt 1-1,5 timmar, beroende på datamängd och maskinvara.
  5. Använd den tränade modellen:

    • När träningen är klar kan du hitta de tränade modellfilerna i mapparna "Assets" och "Logs".
    • I fliken "Model Inference", välj din tränade modell och justera transponeringsvärdena för att matcha källljudet.
    • Konvertera valfri ljudfil till din klonade röst genom att ange sökvägen till ljudfilen och klicka på "Convert".
  6. (Valfritt) Använd färdiga röstmodeller:

    • Besök voicemodels.com för att ladda ner färdiga röstmodeller skapade av communityn.
    • Extrahera modellfilerna och placera dem i rätt mappar, använd dem sedan i RVC:s webbgränssnitt.

Tänk på att kvaliteten på den slutliga klonade rösten beror på kvaliteten och längden på källljudsdatan. Experimentera med olika inställningar och ljudkällor för att uppnå bästa resultat.

Använd förtränade röstmodeller med RVC

RVC-communityn har en stor samling av färdiga röstmodeller som du kan ladda ner och använda direkt, utan att behöva träna din egen modell. För att hitta dessa modeller kan du besöka webbplatsen voicemodels.com.

På den här webbplatsen kan du söka efter vilken röstmodell du vill, som en specifik karaktär eller kändis. Om du till exempel vill använda en SpongeBob-röstmodell kan du helt enkelt klicka på länken för att ladda ner den färdiga arkivfilen.

När du har laddat ner arkivfilen måste du extrahera de två filer den innehåller: en .pth-fil och en indexfil. .pth-filen måste placeras i mappen assets/wavs och indexfilen måste placeras i mappen logs.

Därefter kan du gå tillbaka till RVC:s webbgränssnitt, klicka på knappen "Refresh voice list" och sedan välja den röstmodell du just lagt till. Du kan sedan justera oktavnivån vid behov och klicka på "Convert" för att applicera röstmodellen på din ljudfil.

Den här processen låter dig använda färdiga röstmodeller utan att behöva gå igenom hela träningsprocessen själv, vilket gör det mycket snabbare och enklare att klona röster.

Kombinera RVC med text-till-tal för sömlösa konverteringar

För att kombinera RVC med text-till-tal för sömlös konvertering, följ dessa steg:

  1. Använd Cooked TTS-tillägget i Text Generation WebUI för att generera en initial ljudfil från önskad text.
  2. I Cooked TTS-tillägget, se till att första meddelandet i chatten är den text du vill konvertera till ljud.
  3. När ljudfilen har genererats, ladda ner den och använd den som indata för RVC-konverteringsprocessen.
  4. I RVC:s webbgränssnitt, välj den röstmodell du vill använda för konverteringen.
  5. Justera tonhöjd/transponering vid behov för att matcha målrösten.
  6. Klicka på "Convert" för att generera den slutliga ljudfilen med den klonade rösten.

Den här metoden låter dig dra nytta av text-till-tal-funktionerna i Text Generation WebUI för att skapa den initiala ljudfilen, och sedan använda RVC för att konvertera den till önskad klonad röst. Detta ger ett sömlöst arbetsflöde för att skapa röstklonande ljud från textindata.

Slutsats

I den här omfattande guiden har vi utforskat de kraftfulla möjligheterna med RVC (Real Voice Cloning), ett öppen källkodsprogram som låter dig klona vilken röst som helst och konvertera ljudfiler till den nya rösten. Vi har täckt steg-för-steg-processen för att installera RVC, både via enklick-installeraren och den manuella installationsmetoden.

Du har lärt dig hur du förbereder högkvalitativa ljudprover, tränar din egen röstmodell och till och med utnyttjar färdiga modeller från RVC-communityn. Möjligheten att klona röster öppnar upp en värld av möjligheter, från att låta Morgan Freeman läsa dig en godnattsaga till att låta Gordon Ramsay skälla ut dig medan du lagar middag.

Dessutom har vi diskuterat hur du integrerar RVC med text-till-tal-verktyg, vilket gör det möjligt att generera ljud med din klonade röst utan att behöva göra omfattande ljudinspelningar. Den här sömlösa integrationen möjliggör ännu fler kreativa tillämpningar, som rollspel i virtuella miljöer.

Tänk på att även om RVC:s möjligheter är imponerande är det viktigt att använda den här tekniken ansvarsfullt och etiskt. Respektera individers integritet och rättigheter, och undvik alla skadliga eller bedrägliga användningar av röstkloning.

Embracera kraften i RVC och låt din kreativitet flyga. Möjligheterna är oändliga, och framtiden för röstteknologi ligger i dina händer.

FAQ