Clone Qualquer Voz de IA GRATUITAMENTE Localmente em 1 Clique! Crie Vozes Personalizadas

Use a IA para clonar qualquer voz localmente em 1 clique! Crie facilmente vozes personalizadas a partir de clipes de áudio. Descubra como acessar milhares de modelos de voz pré-treinados e integrá-los aos seus projetos sem problemas.

19 de fevereiro de 2025

party-gif

Descubra o poder de clonar qualquer voz de IA com apenas alguns clipes de áudio no seu computador. Desbloqueie possibilidades infinitas, desde Morgan Freeman lendo uma história de ninar para você até Gordon Ramsay gritando insultos enquanto você cozinha o jantar. Este post de blog mostrará como usar o incrível programa de código aberto RVC para criar seus próprios modelos de voz e converter qualquer áudio na voz de sua escolha, tudo de graça e localmente em sua máquina.

Clone Facilmente Qualquer Voz de IA Gratuitamente Usando o RVC

Para instalar o RVC, você tem duas opções:

  1. Instalador de um clique: Se você for um apoiador do Patreon, você pode baixar o instalador de um clique e simplesmente clicar duas vezes no arquivo para instalar o RVC.

  2. Instalação manual:

    • Certifique-se de ter o Python e o Git for Windows instalados.
    • Crie uma nova pasta em seu computador e abra o Prompt de Comando (CMD) nessa pasta.
    • Clone o repositório do RVC executando git clone <link-do-repositório> no CMD.
    • Determine sua versão do PyTorch executando o comando fornecido.
    • Crie um novo ambiente Python e ative-o.
    • Instale as dependências necessárias.
    • Baixe os modelos e arquivos necessários.
    • Inicie o arquivo go_webui.bat para iniciar a interface web do RVC.

Para clonar uma voz:

  1. Na guia "Treinar", insira um nome para sua nova clonagem de voz e defina a taxa de amostragem de destino.
  2. Forneça o caminho para seus arquivos de áudio de treinamento (pelo menos 10 minutos de áudio de alta qualidade).
  3. Configure as configurações de treinamento, como o número de épocas de treinamento, tamanho do lote e frequência de salvamento.
  4. Clique em "Treinamento de um clique" para iniciar o processo de treinamento.

Depois que o treinamento estiver concluído, você pode usar a voz clonada na guia "Inferência do Modelo". Ajuste o valor de transposição para corresponder ao tom da fonte de áudio, selecione o caminho do arquivo de áudio que deseja converter e clique em "Converter" para gerar o novo áudio com a voz clonada.

Alternativamente, você pode baixar modelos de voz pré-treinados da comunidade em sites como voicemodels.com e usá-los diretamente, sem a necessidade de treinamento.

Para usar a conversão de texto em fala com a voz clonada, você pode aproveitar a extensão Cooked TTS na interface web de Geração de Texto. Gere o áudio inicial usando o Cooked TTS e, em seguida, converta-o para a voz clonada usando o RVC.

Lembre-se de que, embora o RVC permita que você clone qualquer voz, é importante usar essa tecnologia de forma responsável e ética.

Instalar Manualmente o RVC para Usuários Avançados

Para instalar manualmente o RVC, siga estas etapas:

  1. Certifique-se de ter o Python e o Git for Windows instalados em seu computador.
  2. Crie uma nova pasta em seu computador e dê-lhe o nome desejado.
  3. Abra o prompt de comando (CMD) digitando CMD no caminho da pasta e pressione Enter.
  4. Na página do GitHub, clique em "Code", depois clique no ícone de cópia para copiar o link do repositório.
  5. No prompt de comando, digite git clone e cole o link copiado, depois pressione Enter para clonar o repositório em seu computador.
  6. Navegue até a pasta clonada digitando cd seguido do nome da pasta e pressione Enter.
  7. Determine sua versão do PyTorch copiando e colando o comando fornecido na descrição e pressionando Enter. Anote a versão "CU", pois você precisará dela mais tarde.
  8. Crie um novo ambiente Python digitando python -m venv env e pressione Enter.
  9. Ative o ambiente usando o comando fornecido na descrição, mas certifique-se de substituir "CU118" pela versão "CU" correta que você anotou anteriormente.
  10. Instale os requisitos executando o comando fornecido.
  11. Se você encontrar um erro relacionado ao módulo NumPy, desinstale-o com pip uninstall numpy e, em seguida, reinstale-o com a versão 1.23.5.
  12. Baixe os modelos executando o comando python tools/download_models.py.
  13. Baixe os arquivos ffmpeg.exe e ff.exe no link fornecido e coloque-os na pasta principal.
  14. Baixe os quatro arquivos de inicialização no link fornecido e coloque-os na pasta principal, substituindo quaisquer arquivos existentes.
  15. Inicie o arquivo go_webui.bat para iniciar a interface web do RVC.

Agora você está pronto para começar a clonar vozes usando o RVC!

Treine Seu Próprio Modelo de Voz com o RVC

Para treinar seu próprio modelo de voz com o RVC, siga estas etapas:

  1. Prepare seus dados de voz:

    • Você precisa de pelo menos 10 minutos de gravações de áudio de alta qualidade e limpas da sua voz.
    • Se você estiver clonando a voz de outra pessoa, baixe vídeos de entrevistas dela e isole a voz usando uma ferramenta como o Audacity.
  2. Instale o RVC:

    • Use o instalador de um clique se você for um apoiador do Patreon, ou siga as etapas de instalação manual.
    • Certifique-se de ter a versão correta do CUDA instalada.
  3. Configure o treinamento:

    • Na interface web do RVC, vá para a guia "Treinar".
    • Digite um nome para sua nova clonagem de voz e defina a taxa de amostragem de destino.
    • Especifique o caminho para a pasta de seus dados de voz.
    • Selecione as configurações de treinamento apropriadas, como o número de épocas de treinamento.
  4. Inicie o treinamento:

    • Clique em "Treinamento de um clique" para iniciar o treinamento do modelo de voz.
    • O processo de treinamento pode levar cerca de 1-1,5 horas, dependendo da quantidade de dados e do seu hardware.
  5. Use o modelo treinado:

    • Depois que o treinamento estiver concluído, você pode encontrar os arquivos do modelo treinado nas pastas "Assets" e "Logs".
    • Na guia "Inferência do Modelo", selecione seu modelo treinado e ajuste o valor de transposição para corresponder ao áudio de origem.
    • Converta qualquer arquivo de áudio para sua voz clonada fornecendo o caminho do arquivo de áudio e clicando em "Converter".
  6. (Opcional) Use modelos de voz pré-treinados:

    • Visite voicemodels.com para baixar modelos de voz pré-treinados criados pela comunidade.
    • Extraia os arquivos do modelo e coloque-os nas pastas apropriadas, depois use-os na interface web do RVC.

Lembre-se de que a qualidade da voz clonada final depende da qualidade e duração dos dados de áudio de origem. Experimente diferentes configurações e fontes de áudio para obter os melhores resultados.

Use Modelos de Voz Pré-Treinados com o RVC

A comunidade do RVC possui uma enorme coleção de modelos de voz pré-treinados que você pode baixar e usar diretamente, sem precisar treinar seu próprio modelo. Para encontrar esses modelos, você pode visitar o site voicemodels.com.

Neste site, você pode pesquisar por qualquer modelo de voz que desejar, como um personagem ou celebridade específicos. Por exemplo, se você quiser usar um modelo de voz do SpongeBob, basta clicar no link para baixar o arquivo pré-treinado.

Depois de baixar o arquivo compactado, você precisa extrair os dois arquivos que ele contém: um arquivo .pth e um arquivo de índice. O arquivo .pth precisa ser colocado na pasta assets/wavs, e o arquivo de índice precisa ser colocado na pasta logs.

Depois disso, você pode voltar à interface web do RVC, clicar no botão "Atualizar lista de vozes" e, em seguida, selecionar o modelo de voz que você acabou de adicionar. Você pode então ajustar o nível de oitava conforme necessário e clicar em "Converter" para aplicar o modelo de voz ao seu áudio.

Esse processo permite que você use modelos de voz pré-treinados sem precisar passar por todo o processo de treinamento, tornando muito mais rápido e fácil clonar vozes.

Combine o RVC com Text-to-Speech para Conversões Perfeitas

Para combinar o RVC com a conversão de texto em fala para conversões perfeitas, siga estas etapas:

  1. Use a extensão Cooked TTS na interface web de Geração de Texto para gerar um arquivo de áudio inicial a partir do texto desejado.
  2. Na extensão Cooked TTS, certifique-se de que a primeira mensagem no chat seja o texto que você deseja converter em áudio.
  3. Depois que o arquivo de áudio for gerado, baixe-o e use-o como entrada para o processo de conversão do RVC.
  4. Na interface web do RVC, selecione o modelo de voz que você deseja usar para a conversão.
  5. Ajuste o valor de tom/transposição conforme necessário para corresponder à voz de destino.
  6. Clique em "Converter" para gerar o arquivo de áudio final com a voz clonada.

Essa abordagem permite que você aproveite os recursos de conversão de texto em fala da interface web de Geração de Texto para criar o áudio inicial e, em seguida, use o RVC para converter esse áudio para a voz clonada desejada. Isso fornece um fluxo de trabalho perfeito para criar áudio com voz clonada a partir de entradas de texto.

Conclusão

Neste guia abrangente, exploramos os poderosos recursos do RVC (Real Voice Cloning), um programa de código aberto que permite clonar qualquer voz e converter arquivos de áudio nessa nova voz. Cobrimos o processo passo a passo de instalação do RVC, tanto pelo instalador de um clique quanto pelo método de instalação manual.

Você aprendeu a preparar amostras de áudio de alta qualidade, treinar seu próprio modelo de voz e até mesmo aproveitar os modelos pré-treinados da comunidade do RVC. A capacidade de clonar vozes abre um mundo de possibilidades, desde ter Morgan Freeman lendo uma história de ninar até ter Gordon Ramsay gritando insultos enquanto você cozinha.

Adicionalmente, discutimos como integrar o RVC com ferramentas de conversão de texto em fala, permitindo que você gere áudio com sua voz clonada sem a necessidade de extensas gravações de áudio. Essa integração perfeita permite aplicações ainda mais criativas, como interpretação de papéis em ambientes virtuais.

Lembre-se de que, embora os recursos do RVC sejam impressionantes, é importante usar essa tecnologia de forma responsável e ética. Respeite a privacidade e os direitos dos indivíduos e evite quaisquer usos maliciosos ou enganosos da clonagem de voz.

Abraçe o poder do RVC e deixe sua criatividade voar. As possibilidades são infinitas, e o futuro da tecnologia de voz está em suas mãos.

Perguntas frequentes