¡Clona cualquier voz de IA de forma GRATUITA localmente en 1 clic! Crea voces personalizadas

¡Usa IA para clonar cualquier voz localmente en 1 clic! Crea fácilmente voces personalizadas a partir de clips de audio. Descubre cómo acceder a miles de modelos de voz pre-entrenados e integrarlos en tus proyectos sin problemas.

23 de abril de 2025

Descubre el poder de clonar cualquier voz de IA con solo unos pocos clips de audio en tu computadora. Desbloquea posibilidades infinitas, desde Morgan Freeman leyéndote un cuento de buenas noches hasta Gordon Ramsay gritando insultos mientras cocinas la cena. Esta entrada de blog te mostrará cómo usar el increíble programa de código abierto RVC para crear tus propios modelos de voz y convertir cualquier audio en la voz de tu elección, todo de forma gratuita y local en tu máquina.

Clona fácilmente cualquier voz de IA de forma gratuita usando RVC
Instalar manualmente RVC para usuarios avanzados
Entrena tu propio modelo de voz con RVC
Usa modelos de voz pre-entrenados con RVC
Combina RVC con texto a voz para conversiones sin problemas
Conclusión

Clona fácilmente cualquier voz de IA de forma gratuita usando RVC

Para instalar RVC, tienes dos opciones:

Instalador de un solo clic: Si eres un patrocinador de Patreon, puedes descargar el instalador de un solo clic y simplemente hacer doble clic en el archivo para instalar RVC.
Instalación manual:
- Asegúrate de tener Python y Git for Windows instalados.
- Crea una nueva carpeta en tu computadora y abre el símbolo del sistema (CMD) en esa carpeta.
- Clona el repositorio de RVC ejecutando git clone <enlace-del-repositorio> en el CMD.
- Determina tu versión de PyTorch ejecutando el comando proporcionado.
- Crea un nuevo entorno de Python y actívalo.
- Instala las dependencias requeridas.
- Descarga los modelos y archivos necesarios.
- Ejecuta el archivo go_webui.bat para iniciar la interfaz web de RVC.

Para clonar una voz:

En la pestaña "Train", ingresa un nombre para tu nueva voz clonada y establece la frecuencia de muestreo objetivo.
Proporciona la ruta a tus archivos de audio de entrenamiento (al menos 10 minutos de audio de alta calidad).
Configura los ajustes de entrenamiento, como el número de épocas de entrenamiento, el tamaño del lote y la frecuencia de guardado.
Haz clic en "One-Click Training" para iniciar el proceso de entrenamiento.

Una vez que el entrenamiento esté completo, puedes usar la voz clonada en la pestaña "Model Inference". Ajusta el valor de transposición para que coincida con el tono del audio de origen, selecciona la ruta del archivo de audio que deseas convertir y haz clic en "Convert" para generar el nuevo audio con la voz clonada.

Alternativamente, puedes descargar modelos de voz pre-entrenados de la comunidad en sitios web como voicemodels.com y usarlos directamente sin necesidad de entrenamiento.

Instalar manualmente RVC para usuarios avanzados

Para instalar manualmente RVC, sigue estos pasos:

Asegúrate de tener Python y Git for Windows instalados en tu computadora.
Crea una nueva carpeta en tu computadora y nómbrala como desees.
Abre el símbolo del sistema (CMD) escribiendo CMD en la ruta de la carpeta y presionando Enter.
En la página de GitHub, haz clic en "Code", luego haz clic en el icono de copia para copiar el enlace del repositorio.
En el símbolo del sistema, escribe git clone y pega el enlace copiado, luego presiona Enter para clonar el repositorio en tu computadora.
Navega a la carpeta clonada escribiendo cd seguido del nombre de la carpeta y presionando Enter.
Determina tu versión de PyTorch copiando y pegando el comando proporcionado en la descripción y presionando Enter. Anota la versión "CU", la necesitarás más adelante.
Crea un nuevo entorno de Python escribiendo python -m venv env y presionando Enter.
Activa el entorno usando el comando proporcionado en la descripción, pero asegúrate de reemplazar "CU118" con la versión "CU" correcta que anotaste anteriormente.
Instala los requisitos ejecutando el comando proporcionado.
Si encuentras un error relacionado con el módulo NumPy, desinstálalo con pip uninstall numpy y luego reinstálalo con la versión 1.23.5.
Descarga los modelos ejecutando el comando python tools/download_models.py.
Descarga los archivos ffmpeg.exe y ff.exe del enlace proporcionado y colócalos en la carpeta principal.
Descarga los cuatro archivos de inicio del enlace proporcionado y colócalos en la carpeta principal, sobrescribiendo los archivos existentes.
Ejecuta el archivo go_webui.bat para iniciar la interfaz web de RVC.

¡Ahora estás listo para comenzar a clonar voces usando RVC!

Entrena tu propio modelo de voz con RVC

Para entrenar tu propio modelo de voz con RVC, sigue estos pasos:

Prepara tus datos de voz:
- Necesitas al menos 10 minutos de grabaciones de audio de alta calidad y limpias de tu voz.
- Si estás clonando la voz de otra persona, descarga videos de entrevistas de ellos y aísla su voz usando una herramienta como Audacity.
Instala RVC:
- Usa el instalador de un solo clic si eres un patrocinador de Patrón, o sigue los pasos de instalación manual.
- Asegúrate de tener la versión correcta de CUDA instalada.
Configura el entrenamiento:
- En la interfaz web de RVC, ve a la pestaña "Train".
- Ingresa un nombre para tu nueva voz clonada y establece la frecuencia de muestreo objetivo.
- Especifica la ruta a la carpeta de tus datos de voz.
- Selecciona los ajustes de entrenamiento apropiados, como el número de épocas de entrenamiento.
Inicia el entrenamiento:
- Haz clic en "One Click Training" para comenzar el entrenamiento del modelo de voz.
- El proceso de entrenamiento puede tardar aproximadamente 1-1.5 horas, dependiendo de la cantidad de datos y de tu hardware.
Usa el modelo entrenado:
- Una vez que el entrenamiento esté completo, puedes encontrar los archivos del modelo entrenado en las carpetas "Assets" y "Logs".
- En la pestaña "Model Inference", selecciona tu modelo entrenado y ajusta el valor de transposición para que coincida con el audio de origen.
- Convierte cualquier archivo de audio a tu voz clonada proporcionando la ruta del archivo de audio y haciendo clic en "Convert".
(Opcional) Usa modelos de voz pre-entrenados:
- Visita voicemodels.com para descargar modelos de voz pre-entrenados creados por la comunidad.
- Extrae los archivos del modelo y colócalos en las carpetas apropiadas, luego úsalos en la interfaz web de RVC.

Recuerda, la calidad de la voz clonada final depende de la calidad y duración de los datos de audio de origen. Experimenta con diferentes ajustes y fuentes de audio para obtener los mejores resultados.

Usa modelos de voz pre-entrenados con RVC

La comunidad de RVC tiene una gran colección de modelos de voz pre-entrenados que puedes descargar y usar directamente, sin tener que entrenar tu propio modelo. Para encontrar estos modelos, puedes visitar el sitio web voicemodels.com.

En este sitio web, puedes buscar cualquier modelo de voz que desees, como un personaje o celebridad específicos. Por ejemplo, si quieres usar un modelo de voz de SpongeBob, simplemente puedes hacer clic en el enlace para descargar el archivo pre-entrenado.

Una vez que tengas el archivo descargado, debes extraer los dos archivos que contiene: un archivo .pth y un archivo de índice. El archivo .pth debe colocarse en la carpeta assets/wavs, y el archivo de índice debe colocarse en la carpeta logs.

Después de eso, puedes volver a la interfaz web de RVC, hacer clic en el botón "Refresh voice list" y luego seleccionar el modelo de voz que acabas de agregar. Luego puedes ajustar el nivel de octava según sea necesario y hacer clic en "Convert" para aplicar el modelo de voz a tu audio.

Este proceso te permite usar modelos de voz pre-entrenados sin tener que pasar por todo el proceso de entrenamiento tú mismo, lo que lo hace mucho más rápido y fácil de clonar voces.

Combina RVC con texto a voz para conversiones sin problemas

Para combinar RVC con text-to-speech para conversiones sin problemas, sigue estos pasos:

Usa la extensión Cooked TTS en la interfaz web de Text Generation para generar un archivo de audio inicial a partir del texto deseado.
En la extensión Cooked TTS, asegúrate de que el primer mensaje en el chat sea el texto que quieres convertir a audio.
Una vez que se genere el archivo de audio, descárgalo y úsalo como entrada para el proceso de conversión de RVC.
En la interfaz web de RVC, selecciona el modelo de voz que quieres usar para la conversión.
Ajusta el valor de tono/transposición según sea necesario para que coincida con la voz objetivo.
Haz clic en "Convert" para generar el archivo de audio final con la voz clonada.

Este enfoque te permite aprovechar las capacidades de text-to-speech de la interfaz web de Text Generation para crear el audio inicial, y luego usar RVC para convertir ese audio a la voz clonada deseada. Esto proporciona un flujo de trabajo sin problemas para crear audio con voz clonada a partir de entradas de texto.

Conclusión

En esta guía integral, hemos explorado las poderosas capacidades de RVC (Real Voice Cloning), un programa de código abierto que te permite clonar cualquier voz y convertir archivos de audio en esa nueva voz. Hemos cubierto el proceso paso a paso de instalar RVC, tanto a través del instalador de un solo clic como del método de instalación manual.

Has aprendido cómo preparar muestras de audio de alta calidad, entrenar tu propio modelo de voz e incluso aprovechar los modelos pre-entrenados de la comunidad de RVC. La capacidad de clonar voces abre un mundo de posibilidades, desde tener a Morgan Freeman leyéndote una historia de buenas noches hasta tener a Gordon Ramsay gritando insultos mientras cocinas.

Además, hemos discutido cómo integrar RVC con herramientas de text-to-speech, lo que te permite generar audio con tu voz clonada sin la necesidad de extensas grabaciones de audio. Esta integración sin problemas permite aún más aplicaciones creativas, como el juego de roles en entornos virtuales.

Recuerda, si bien las capacidades de RVC son impresionantes, es importante usar esta tecnología de manera responsable y ética. Respeta la privacidad y los derechos de las personas, y evita cualquier uso malicioso o engañoso de la clonación de voz.

Abraza el poder de RVC y deja que tu creatividad vuele. Las posibilidades son infinitas, y el futuro de la tecnología de voz está en tus manos.

Preguntas más frecuentes

¿Qué es RVC y cómo se puede usar para clonar voces?

¿Cuánto audio se necesita para clonar una voz usando RVC?

¿Cuáles son los pasos para instalar y usar manualmente RVC?

¿Puedo usar modelos de voz pre-entrenados en lugar de entrenar los míos?

¿Cómo puedo usar la voz clonada para la conversión de texto a voz?

Crea tu novia AI

Crea tu compañera ideal con nuestro AI Girlfriend Builder