Клонируйте любой голос AI БЕСПЛАТНО локально в 1 клик! Создавайте пользовательские голоса
Используйте ИИ, чтобы клонировать любой голос локально за 1 клик! Легко создавайте пользовательские голоса из аудиоклипов. Узнайте, как получить доступ к тысячам предварительно обученных голосовых моделей и интегрировать их в свои проекты без проблем.
24 февраля 2025 г.

Откройте для себя силу клонирования любого голоса искусственного интеллекта всего за несколько аудиозаписей на вашем компьютере. Откройте для себя безграничные возможности, от Моргана Фримана, читающего вам сказку на ночь, до Гордона Рамзи, кричащего оскорбления, пока вы готовите ужин. В этой статье блога мы покажем вам, как использовать удивительную бесплатную программу с открытым исходным кодом RVC для создания собственных голосовых моделей и преобразования любого аудио в голос по вашему выбору, все это локально на вашем устройстве.
Легко клонируйте любой голос AI бесплатно с помощью RVC
Ручная установка RVC для опытных пользователей
Обучите свою собственную голосовую модель с помощью RVC
Используйте предварительно обученные голосовые модели с помощью RVC
Сочетайте RVC с преобразованием текста в речь для плавных преобразований
Заключение
Легко клонируйте любой голос AI бесплатно с помощью RVC
Легко клонируйте любой голос AI бесплатно с помощью RVC
Для установки RVC у вас есть два варианта:
-
Однокликовый установщик: Если вы являетесь сторонником Patreon, вы можете скачать однокликовый установщик и просто дважды щелкнуть файл, чтобы установить RVC.
-
Ручная установка:
- Убедитесь, что у вас установлены Python и Git для Windows.
- Создайте новую папку на вашем компьютере и откройте в ней командную строку (CMD).
- Клонируйте репозиторий RVC, выполнив в CMD команду
git clone <ссылка-на-репозиторий>
. - Определите вашу версию PyTorch, выполнив предоставленную команду.
- Создайте новое Python-окружение и активируйте его.
- Установите необходимые зависимости.
- Скачайте необходимые модели и файлы.
- Запустите файл
go_webui.bat
, чтобы запустить веб-интерфейс RVC.
Для клонирования голоса:
- На вкладке "Train" введите имя для нового клона голоса и установите целевую частоту дискретизации.
- Укажите путь к вашим аудиофайлам для обучения (не менее 10 минут высококачественного аудио).
- Настройте параметры обучения, такие как количество эпох обучения, размер пакета и частоту сохранения.
- Нажмите "One-Click Training", чтобы начать процесс обучения.
После завершения обучения вы можете использовать клонированный голос на вкладке "Model Inference". Отрегулируйте значение транспонирования, чтобы оно соответствовало высоте тона исходного аудио, выберите путь к аудиофайлу, который вы хотите преобразовать, и нажмите "Convert" для генерации нового аудио с клонированным голосом.
Альтернативно, вы можете скачать предварительно обученные голосовые модели из сообщества на сайтах, таких как voicemodels.com, и использовать их напрямую без необходимости обучения.
Для использования преобразования текста в речь с клонированным голосом вы можете использовать расширение Cooked TTS в веб-интерфейсе Text Generation. Сначала сгенерируйте исходное аудио с помощью Cooked TTS, а затем преобразуйте его в клонированный голос с помощью RVC.
Помните, что, хотя RVC позволяет клонировать любой голос, важно использовать эту технологию ответственно и этично.
Ручная установка RVC для опытных пользователей
Ручная установка RVC для опытных пользователей
Для ручной установки RVC выполните следующие шаги:
- Убедитесь, что у вас установлены Python и Git для Windows на вашем компьютере.
- Создайте новую папку на вашем компьютере и дайте ей желаемое название.
- Откройте командную строку (CMD), введя "CMD" в пути к папке и нажав Enter.
- На странице GitHub нажмите на "Code", затем нажмите на значок копирования, чтобы скопировать ссылку на репозиторий.
- В командной строке введите "git clone" и вставьте скопированную ссылку, затем нажмите Enter, чтобы клонировать репозиторий на ваш компьютер.
- Перейдите в клонированную папку, введя "cd" и название папки, затем нажмите Enter.
- Определите вашу версию PyTorch, скопировав и вставив предоставленную команду, затем нажмите Enter. Запомните версию "CU", она понадобится вам позже.
- Создайте новое Python-окружение, введя "python -m venv env" и нажав Enter.
- Активируйте окружение, используя команду из описания, но обязательно замените "CU118" на правильную версию "CU", которую вы записали ранее.
- Установите требования, выполнив предоставленную команду.
- Если возникнет ошибка, связанная с модулем NumPy, удалите его с помощью "pip uninstall numpy", затем переустановите версию 1.23.5.
- Скачайте модели, выполнив команду "python tools/download_models.py".
- Скачайте файлы "ffmpeg.exe" и "ff.exe" по предоставленной ссылке и поместите их в главную папку.
- Скачайте четыре файла запуска по предоставленной ссылке и поместите их в главную папку, перезаписав любые существующие файлы.
- Запустите файл "go_webui.bat", чтобы запустить веб-интерфейс RVC.
Теперь вы готовы начать клонировать голоса с помощью RVC!
Обучите свою собственную голосовую модель с помощью RVC
Обучите свою собственную голосовую модель с помощью RVC
Чтобы обучить собственную голосовую модель с помощью RVC, выполните следующие шаги:
-
Подготовьте ваши голосовые данные:
- Вам нужно не менее 10 минут высококачественных, чистых аудиозаписей вашего голоса.
- Если вы клонируете чей-то еще голос, скачайте видео-интервью с этим человеком и изолируйте его голос с помощью инструмента, такого как Audacity.
-
Установите RVC:
- Используйте однокликовый установщик, если вы являетесь сторонником Patreon, или следуйте инструкциям по ручной установке.
- Убедитесь, что у вас установлена правильная версия CUDA.
-
Настройте обучение:
- В веб-интерфейсе RVC перейдите на вкладку "Train".
- Введите имя для нового клона голоса и установите целевую частоту дискретизации.
- Укажите путь к папке с вашими голосовыми данными.
- Выберите соответствующие настройки обучения, такие как количество эпох обучения.
-
Начните обучение:
- Нажмите "One Click Training", чтобы начать обучение модели голоса.
- Процесс обучения может занять около 1-1,5 часов, в зависимости от количества данных и вашего оборудования.
-
Используйте обученную модель:
- После завершения обучения вы можете найти обученные файлы модели в папках "Assets" и "Logs".
- На вкладке "Model Inference" выберите вашу обученную модель и отрегулируйте значение транспонирования, чтобы оно соответствовало исходному аудио.
- Преобразуйте любой аудиофайл в ваш клонированный голос, указав путь к аудиофайлу и нажав "Convert".
-
(Дополнительно) Используйте предварительно обученные голосовые модели:
- Посетите сайт voicemodels.com, чтобы скачать предварительно обученные голосовые модели, созданные сообществом.
- Извлеките файлы модели и поместите их в соответствующие папки, затем используйте их в веб-интерфейсе RVC.
Помните, что качество конечного клонированного голоса зависит от качества и продолжительности исходных аудиоданных. Экспериментируйте с различными настройками и источниками аудио, чтобы добиться наилучших результатов.
Используйте предварительно обученные голосовые модели с помощью RVC
Используйте предварительно обученные голосовые модели с помощью RVC
Сообщество RVC имеет огромную коллекцию предварительно обученных голосовых моделей, которые вы можете скачать и использовать напрямую, без необходимости обучения собственной модели. Чтобы найти эти модели, вы можете посетить сайт voicemodels.com.
На этом сайте вы можете искать любую голосовую модель, которую вы хотите, например, определенного персонажа или знаменитость. Например, если вы хотите использовать голосовую модель Губки Боба, вы можете просто нажать на ссылку, чтобы скачать предварительно обученный архив.
После того, как вы скачали архив, вам нужно извлечь два содержащихся в нем файла: файл .pth
и индексный файл. Файл .pth
нужно поместить в папку assets/wavs
, а индексный файл - в папку logs
.
После этого вы можете вернуться в веб-интерфейс RVC, нажать кнопку "Refresh voice list" и затем выбрать голосовую модель, которую вы только что добавили. Вы можете отрегулировать уровень октавы по мере необходимости и нажать "Convert", чтобы применить голосовую модель к вашему аудио.
Такой подход позволяет использовать предварительно обученные голосовые модели без необходимости проходить весь процесс обучения самостоятельно, что значительно ускоряет и упрощает клонирование голосов.
Сочетайте RVC с преобразованием текста в речь для плавных преобразований
Сочетайте RVC с преобразованием текста в речь для плавных преобразований
Чтобы объединить RVC с преобразованием текста в речь для плавных преобразований, выполните следующие шаги:
- Используйте расширение Cooked TTS в веб-интерфейсе Text Generation WebUI, чтобы сгенерировать исходный аудиофайл из желаемого текста.
- В расширении Cooked TTS убедитесь, что первое сообщение в чате - это текст, который вы хотите преобразовать в аудио.
- После генерации аудиофайла скачайте его и используйте в качестве входных данных для процесса преобразования RVC.
- В веб-интерфейсе RVC выберите голосовую модель, которую вы хотите использовать для преобразования.
- При необходимости отрегулируйте значение высоты тона/транспонирования, чтобы оно соответствовало целевому голосу.
- Нажмите "Convert", чтобы сгенерировать окончательный аудиофайл с клонированным голосом.
Такой подход позволяет использовать возможности преобразования текста в речь в веб-интерфейсе Text Generation WebUI для создания исходного аудио, а затем использовать RVC для преобразования этого аудио в желаемый клонированный голос. Это обеспечивает плавный рабочий процесс для создания аудио с клонированным голосом из текстовых входных данных.
Заключение
Заключение
В этом всеобъемлющем руководстве мы исследовали мощные возможности RVC (Real Voice Cloning), открытого программного обеспечения, которое позволяет клонировать любой голос и преобразовывать аудиофайлы в этот новый голос. Мы рассмотрели пошаговый процесс установки RVC, как через однокликовый установщик, так и через ручную установку.
Вы узнали, как подготовить высококачественные аудиозаписи, обучить собственную голосовую модель и даже использовать предварительно обученные модели из сообщества RVC. Возможность клонирования голосов открывает мир возможностей, от того, чтобы Морган Фриман читал вам сказку на ночь, до того, чтобы Гордон Рамзи кричал оскорбления, пока вы готовите ужин.
Кроме того, мы обсудили, как интегрировать RVC с инструментами преобразования текста в речь, что позволяет вам генерировать аудио с вашим клонированным голосом без необходимости в обширных аудиозаписях. Эта плавная интеграция открывает еще больше творческих возможностей, таких как ролевые игры в виртуальных средах.
Помните, что, хотя возможности RVC впечатляют, важно использовать эту технологию ответственно и этично. Уважайте конфиденциальность и права личности и избегайте любого злонамеренного или обманного использования клонирования голосов.
Обнимите силу RVC, и пусть ваша креативность взлетит ввысь. Возможности безграничны, и будущее голосовых технологий в ваших руках.
Часто задаваемые вопросы
Часто задаваемые вопросы

