지역 텍스트 음성 변환 AI의 힘을 unleash하세요: 무료로 놀라운 음성을 만들어보세요
로컬 텍스트 음성 변환 AI의 힘을 unleash하세요: 무료로 놀라운 음성을 만들어보세요. 고품질의 맞춤형 텍스트 음성 변환 음성을 로컬 컴퓨터에서 생성하는 4가지 방법을 발견하세요. 빠른 복제에서 모델 미세 조정까지, 프로젝트에 완벽한 AI 음성을 만들어보세요.
2025년 2월 15일

이 단계별 가이드를 통해 무료로 사용자 정의 텍스트 음성 변환 음성을 로컬에서 만들 수 있습니다. 비싼 타사 서비스에 의존하지 않고도 간단한 복제 기술과 세부 조정된 모델을 사용하여 고품질 AI 음성을 생성하는 방법을 알아보세요.
텍스트 음성 변환의 가장 쉬운 방법: 10초 오디오로 빠른 복제
텍스트 음성 변환의 가장 쉬운 방법: 10초 오디오로 빠른 복제
10초 오디오를 사용하여 빠른 복제 방법을 사용하려면:
-
xtts-webui
폴더로 이동하여start-xtts-webui.bat
파일을 실행하십시오. 이렇게 하면 필요한 파일이 다운로드되고 웹 UI가 실행됩니다. -
웹 UI에서 음성으로 읽고 싶은 텍스트를 입력하십시오. 문자 수 제한은 없습니다.
-
드롭다운에서 원하는 언어를 선택하십시오.
-
5-10초 길이의 오디오 클립을 업로드하십시오. 이 클립은 음성 복제에 사용됩니다.
-
"Generate"를 클릭하면 몇 초 내에 생성된 오디오 파일을 사용할 수 있습니다.
이것은 로컬 컴퓨터에서 텍스트 음성 변환을 생성하는 가장 쉽고 편한 방법입니다. 완벽하지는 않지만 10초의 오디오만으로 빠른 솔루션을 제공합니다.
중급 텍스트 음성 변환: 자신만의 XTTS 모델 미세 조정
중급 텍스트 음성 변환: 자신만의 XTTS 모델 미세 조정
이제 2분 분량의 오디오만으로 자체 XTTS 모델을 학습하는 중간 수준의 텍스트 음성 변환 방법으로 넘어가겠습니다.
먼저 XTTS 파인 튜닝 웹 UI 폴더로 이동하여 start.bat
파일을 실행하십시오. 이렇게 하면 브라우저에서 열 수 있는 로컬 URL이 제공됩니다.
이 방법에는 2분 분량의 오디오 파일이 필요합니다. 저처럼 게으르다면 Audacity에서 30초 오디오 클립을 반복하여 2분 파일을 만들 수 있습니다.
오디오 파일이 준비되면 웹 UI에 업로드하십시오. 올바른 언어(이 경우 영어)를 선택했는지 확인하십시오. 그런 다음 "Step 1: Create dataset" 버튼을 클릭하십시오. 오디오 길이에 따라 형식 지정 프로세스는 1분 이내 완료될 수 있습니다.
다음 탭으로 이동하십시오. 기본 설정을 그대로 둘 수 있지만 더 나은 결과를 위해 기본 6회 에포크 수를 10회 또는 12회로 늘릴 수 있습니다. 2.0.2 버전을 사용하는 것이 가장 좋습니다.
"Run the training" 버튼을 클릭하면 학습이 시작됩니다. 완료되면 "Optimize the model" 버튼을 클릭하여 최종 파일의 크기를 줄이고 사용하기 쉽게 만드십시오.
마지막으로 "Inference" 탭으로 이동하십시오. "Load parameters for TTS from output folder" 버튼과 "Load model" 버튼을 클릭하십시오. 이제 텍스트를 입력하고 "Inference"를 클릭하여 오디오를 생성할 수 있습니다.
이 맞춤형 모델로 생성된 오디오는 초기 10초 복제 방법보다 훨씬 나을 것입니다. 참조 오디오에 있던 휴지, "uh" 소리 등의 특성이 반영될 것입니다.
이 맞춤형 모델을 이용하면 제한 없이 자유롭게 사용할 수 있습니다. 이 중간 수준의 텍스트 음성 변환 방법은 노력과 품질 사이의 훌륭한 절충안입니다.
최고의 텍스트 음성 변환 조합: XTTS + RVC
최고의 텍스트 음성 변환 조합: XTTS + RVC
이제 필요한 모든 소프트웨어를 설치했으니 XTTS와 RVC를 사용하는 궁극의 텍스트 음성 변환 조합으로 들어가 보겠습니다.
방법 A: 단순 변환
- XTTS 웹 UI 내에서 텍스트와 참조 오디오 파일을 입력하십시오.
- "Generate"를 클릭하여 초기 텍스트 음성 변환 오디오를 얻으십시오.
- 생성된 파일을 다운로드하십시오.
- RVC를 실행하고 참조 음성 모델을 선택하십시오.
- 다운로드한 파일의 경로를 붙여넣고 "Convert"를 클릭하십시오.
- 최종 오디오에는 참조 모델의 음성이 적용됩니다.
방법 B: 자동 XTTS + RVC
- XTTS RVC UI 폴더로 이동하여 RVC 음성 모델(
.pth
및index
파일)을 입력하십시오. - "voices" 폴더에 참조 음성 샘플(10초 오디오 클립)을 입력하십시오.
.bat
파일을 실행하고 브라우저에서 로컬 URL을 여십시오.- 언어, RVC 모델, 음성 샘플을 선택하십시오.
- 텍스트를 입력하고 "Submit"을 클릭하십시오.
- 최종 오디오가 XTTS와 RVC를 결합하여 자동으로 생성됩니다.
방법 C: 최고의 텍스트 음성 변환
- XTTS 파인 튜닝 웹 UI 폴더에서 맞춤형 XTTS 모델 파일을 찾으십시오.
- 이 파일들을 잘라내어 XTTS 웹 UI의 "models" 폴더에 붙여넣으십시오.
- XTTS 웹 UI를 실행하고 사용자 지정 XTTS 모델을 선택하십시오.
- 텍스트와 참조 오디오를 입력한 다음 "Generate"를 클릭하십시오.
- 생성된 파일을 다운로드하고 RVC에서 열어보십시오.
- 참조 음성 모델을 선택하고 "Convert"를 클릭하십시오.
- 최종 오디오는 사용자 지정 XTTS 모델과 RVC를 사용하여 만든 최고의 텍스트 음성 변환이 될 것입니다.
최고 수준의 방법은 더 많은 노력이 필요하지만 가장 높은 품질과 진정성을 제공합니다. 자신의 필요와 선호에 가장 잘 맞는 방법을 선택하십시오.
결론
결론
이 종합 가이드에서는 로컬 컴퓨터에서 고품질의 맞춤형 텍스트 음성 변환(TTS) 음성을 만드는 다양한 방법을 살펴보았습니다. 10초 음성 복제부터 최고 수준의 TTS까지, 다양한 기술을 다루어 특정 요구사항에 맞는 솔루션을 제공했습니다.
가장 간단한 방법부터 시작하여 XTTS 웹 UI를 사용하여 10초의 참조 오디오만으로 TTS 오디오를 생성하는 방법을 보여드렸습니다. 이 빠르고 쉬운 접근 방식을 통해 최소한의 노력으로 맞춤형 음성을 만들 수 있습니다.
다음으로 2분 분량의 오디오만으로 XTTS 모델을 미세 조정하는 중간 수준의 TTS 방법을 살펴보았습니다. 이 프로세스를 통해 화자의 고유한 특성을 반영하는 더 진정성 있고 표현력 있는 TTS 음성을 만들 수 있었습니다.
마지막으로 XTTS와 RVC(Real-Voice Cloning)를 결합하는 최고 수준의 TTS 방법을 공개했습니다. 사용자 지정 XTTS 모델과 RVC의 고급 음성 변환 기능을 활용하여 원래 화자의 음성과 매우 유사한 TTS 오디오를 생성할 수 있었습니다.
가이드 전반에 걸쳐 원활한 설치 및 구현 과정을 위한 단계별 지침과 실용적인 팁을 제공했습니다. 초보자든 숙련된 사용자든 이제 로컬 컴퓨터에서 고품질 TTS 음성을 직접 만들 수 있는 지식과 도구를 갖추게 되었습니다.
가이드에 언급된 리소스와 그래픽은 Patreon에서 무료로 제공되므로 설명에 있는 링크를 확인하시기 바랍니다. 질문이 있거나 추가 지원이 필요하시면 Patreon 플랫폼을 통해 언제든 연락주시기 바랍니다.
텍스트 음성 변환의 재미를 즐기세요!
자주하는 질문
자주하는 질문