영국 악센트 음성 변성기: 악센트 변환이 실시간으로 작동하는 방식

영국 악센트 음성 변성기 는 간단한 아이디어처럼 들립니다 — 버튼을 누르고 실크 RP 릴트로 말하세요 — 하지만 실시간 악센트 변환 뒤의 엔지니어링은 더 흥미롭고 더 제한적이며 대부분의 소프트웨어 마케팅이 제안합니다. 이 가이드는 실제 악센트 변환이 실제로 어떻게 작동하는지, DSP 기반 음성 변성기가 어디서 실패하고 AI 음성 복제가 (그리고 여전히 할 수 없는) 일을 설명합니다.

TL;DR

DSP 피치/포먼트 이동은 음색 을 변경하지만 악센트는 모음 소리, 리듬 및 억양에서 살고 있기 때문에 영국 악센트를 추가할 수 없습니다 — 단지 음정뿐만 아니라.
영국 음성 모델에서 훈련된 AI 음성 복제는 모든 DSP 필터보다 훨씬 더 설득력 있게 악센트를 재현합니다.
“영국”은 하나의 악센트가 아닙니다 — RP, Cockney, Scouse, Geordie 및 Brummie는 상호 고유하며 별도의 음성 모델이 필요합니다.
VoxBooster는 실시간 신경 음성 변환을 낮은 지연 오디오 캡처 주입과 결합합니다 (커널 드라이버 없음, 안티치트 안전) 게임, 스트리밍 및 콘텐츠 사용을 위해.
AI 복제에서 현실성을 예상합니다. DSP에서 재미있는 의상 효과를 예상하십시오. 둘 다 자리가 있습니다.
좋은 악센트 모델을 훈련하려면 대상 음성의 깨끗한 오디오 샘플이 필요합니다 — 최소 5-20분.

영국 악센트 음성 변성기는 무엇입니까?

영국 악센트 음성 변성기는 실시간 음성을 처리하고 영국 스피커처럼 더 들리는 오디오를 출력하는 모든 소프트웨어입니다. 이 카테고리는 광범위한 기술을 다룹니다 — 간단한 피치 시프트 필터에서 완전한 신경 음성 변환까지 — 그리고 스펙트럼의 양쪽 끝 사이의 품질 차이는 엄청납니다.

낮은 끝에서 DSP (디지털 신호 처리) 도구가 있어 피치, 포먼트 주파수를 조정하고 때로는 EQ 또는 실 시뮬레이션을 추가합니다. 고급 끝에서 당신은 AI 기반 음성 복제 도구를 사용하여 당신의 음성을 대상 음성으로 변환하는 훈련된 신경 모델을 사용합니다 — 악센트, 음색 및 프로소디 모두 포함.

무엇이든 다운로드하기 전에 차이를 이해하는 것이 중요합니다. “약간 영국 같음”과 “실제로 설득력 있는 RP” 사이의 간격은 대부분 후드 아래에서 실행되는 기술에 의해 결정되기 때문입니다.

DSP만으로 진정한 영국 악센트를 만들 수 없는 이유

이것은 이 전체 기사에서 가장 중요한 기술 포인트이며, 대부분의 음성 변성기 마케팅이 완전히 무시합니다.

악센트는 단지 음정이 아닙니다. 그것은 음운 체계 입니다 — 화자가 사용하는 모음과 자음 소리 — 프로소디 와 결합됨, 즉 음성의 리듬, 스트레스 패턴 및 억양 윤곽을 의미합니다. 영국 RP 스피커가 “목욕”이라고 말할 때, 모음은 긴 열린 뒤 모음입니다. 미국 스피커가 “목욕”이라고 말할 때, 그것은 짧은 앞 모음입니다. 어떤 포먼트 변환도 영어에서 생각하는 동안 한 개를 다른 개로 변환하지 않습니다.

DSP는 유용한 것들을 할 수 있습니다:

Pitch shift — 기본 주파수를 위아래로 이동하여 기본 수준에서 음성이 얼마나 남성 또는 여성 소리인지 변경합니다.
Formant shift — 성도의 공명 주파수를 독립적으로 변환하여 감지된 모음 색을 변경합니다. Formants를 위로 이동하면 음성이 더 작고 밝게 들립니다. 아래로 더 크게 들립니다.
EQ 및 포화 — 스펙트럼 포락선을 조각하여 감지된 음 품질을 변경합니다 (따뜻함, 밝음, 코 등).
실 시뮬레이션 — 공간 문자를 추가하십시오.

DSP가 할 수 없는 것:

당신이 생성하는 모음 음을 변경하십시오. “묻다”를 짧은 A로 말하면, 포먼트를 약간 변환해도 RP long-A를 생성하지 않습니다.
프로소디를 바꾸십시오. 영국 RP는 미국의 상승 억양과 다른 선언문에 대한 하강 억양이 있습니다. 문장 강조는 당신의 모국어 패턴에 남아 있습니다.
떨어진 H 음성 (Cockney) 또는 Geordie 열린 O를 추가하십시오. 이것들은 실제로 다르게 표현해야 합니다.

순수 DSP “영국 악센트” 필터의 결과는 대부분의 리스너가 즉시 인위적인 것으로 인식하는 불가사의한 효과입니다 — 음성 패턴은 여전히 당신의 것입니다, 표면에 다른 스펙트럼 래퍼 일뿐입니다. 이것은 아무도 현실성을 기대하지 않는 역할 놀이에 재미있을 수 있지만, 진정한 악센트로 통과하지 않습니다.

AI 음성 복제가 실제로 악센트를 변환하는 방법

AI 음성 복제는 근본적으로 다른 접근 방식을 취합니다. 오디오 신호를 직접 조작하는 대신 대상 스피커의 녹음에서 훈련된 신경 음성 변환 모델 을 사용합니다. 당신이 말할 때, 모델은 당신이 말한 내용의 내용 표현 (음성 내용)을 추출한 다음 대상 음성의 학습된 음성 특성을 사용하여 해당 내용을 다시 합성합니다 — 모음 인벤토리, 음정 윤곽 경향 및 특징적인 음색 포함.

대상 음성이 원천 영국 RP 스피커인 경우, 모델은 해당 스피커의 음운 패턴을 배웠습니다. 변환은 완벽하지 않습니다 — 당신은 여전히 당신의 모국어 악센트 흔적이 출혈하는 것을 들을 것입니다. 특히 모음에서 당신의 모국 악센트와 대상이 크게 다릅니다 — 하지만 결과는 DSP 만큼만 훨씬 더 설득력 있습니다.

좋은 악센트 클론의 주요 요소:

훈련 데이터 품질

신경 모델은 대상 음성의 오디오 샘플에서 배웁니다. 깨끗한 녹음 (최소 배경 잡음, 일관된 마이크 배치, 자연 회화 음성)은 시끄럽거나 처리된 오디오보다 더 나은 모델을 생성합니다. 짧은 샘플은 스피커의 가장 일반적인 음성 패턴에 수렴하는 모델을 생성하고 드문 음운에서 유연성이 부족할 수 있습니다.

샘플 길이

대략 5-20분의 깨끗한 음성은 모델에 대상 음성을 안정적으로 캡처하기에 충분한 데이터를 제공합니다. 2분 미만이고 모델은 흔치 않은 소리에서 눈에 띄는 시공품을 자주 가집니다. 20분 이상은 생산 사용을 위해 매우 높은 충실도를 목표로 하지 않는 한 수익 감소를 생성합니다.

지연 예산

실시간 변환은 처리 지연을 추가합니다. 변환 모델은 들어오는 오디오를 작은 프레임으로 청크하고, 신경망을 통해 각각을 처리하고, 재구성된 오디오를 출력합니다. 낮은 지연 모델은 더 작은 프레임과 가벼운 아키텍처를 사용하며 일부 충실도로 비용이 추가됩니다. 정상적인 대화의 경우 80ms 미만의 지연이 일반적으로 지각할 수 없습니다. VoxBooster는 로컬로 GPU 또는 CPU에서 오디오를 처리합니다 — 클라우드 왕복 없음 — 게임 및 Discord 통화에 대한 지연을 실용적으로 유지합니다.

영국 악센트는 한 가지 것이 아닙니다

“영국 악센트” 모델을 찾기 전에 “영국”은 광범위하게 영역적으로 그리고 사회적으로 별개의 악센트를 다룬다는 것을 아는 것이 좋습니다. 영국 악센트를 요청하는 것은 카스틸, 멕시칸, 아르헨티나 또는 카리브 스페인 중 어느 쪽인지 명시하지 않고 “스페인” 악센트를 요청하는 것과 같습니다.

주요 영국 악센트 가족은 다음과 같습니다:

Received Pronunciation (RP)

“여왕의 영어” 또는 BBC 영어라고도합니다. 지역적이지 않으며, 역사적으로 남부 영어 교육받은 음성, 방송 미디어 및 공식 문맥과 관련되어 있습니다. 명확하게 조음된 모음, 비-자음성 (R이 자음 전이나 단어 끝에서 발음되지 않음) 및 선언문에 대한 특징적인 하강 억양이 특징입니다. 이것은 영국이 아닌 대부분의 사람들이 “영국”을 생각할 때 상상하는 악센트입니다.

Cockney

런던 동쪽 노동 계급. 글로털 정지 (병 → “bo-ul”), 떨어진 H 음성 (행복 → “‘appy”), Cockney 모음 이동 (친구 같은 “mite”)을 포함하고 유명한 라이밍 속담을 포함합니다. 전혀 RP처럼 들리지 않습니다.

Scouse (리버풀)

특징적인 코 품질, 특정 모음 소리 (“pool”과 “book”과 같은 단어에서 특히), 그리고 진술에서도 고유한 문장 최종 상승 억양. 비틀즈의 세계적 유명을 만들었습니다.

Geordie (뉴캐슬/타인사이드)

많은 언어학자들에 의해 구영어에 가장 가까운 악센트로 간주됩니다. 특징적인 열린 모음, 고유한 어휘 (“bairn”은 아이, “canny”는 좋음), 그리고 다른 영국 악센트와 같지 않은 멜로디입니다.

Brummie (버밍엄)

종종 영국 악센트 인식 설문 조사의 하단에 공정하지 않게 순위가 매겨진 Brummie는 느리고 음악적인 리듬을 가지며 RP 및 Cockney 모두와 완전히 다른 특징적인 모음 소리가 있습니다. 하강-그 다음-상승 억양은 진술에 대해 독특한 소리를 제공합니다.

스코틀랜드, 웨일스, 북아일랜드

기술적으로 영국이지만 자신의 카테고리를 보증할 충분히 별개입니다. 스코틀랜드 영어와 스코츠는 부분적으로 로티쿠 (R 발음)이며, 웨일스 영어는 웨일스 프로소디 영향에서 노래하는 목소리를 가지고 있으며, 북아일랜드 (Ulster English)는 아일랜드 영어와 스코츠 모두의 특징이 있습니다.

AI 음성 복제를 위해 이러한 각 악센트는 별도로 훈련된 모델이 필요합니다 — 모든 것을 다루는 일반 “영국 음성 모델”은 없습니다.

악센트 사용을 위한 음성 변성기 기술 비교

기술	악센트 현실성	지연	CPU/GPU 로드	최적 사용 대상
DSP 음정 + 포먼트 이동	낮음 — 음색만 변경	매우 낮음 (<5ms)	최소	재미/역할 놀이, 간단한 효과
DSP + 악센트별 EQ 사전 설정	낮음-중간 — 약간 더 문자	매우 낮음 (<5ms)	최소	캐주얼 사용, 빠른 성격
AI 음성 복제 (로컬)	높음 — 음운 + 프로소디 캡처	중간 (30-80ms)	중간-높음	스트리밍, 콘텐츠, 게임
AI 음성 복제 (클라우드)	높음	높음 (150ms+)	낮음 로컬	스튜디오 녹음, 비라이브 사용
전문 성우	매우 높음	N/A — 실시간이 아님	N/A	프로덕션 오디오, 더빙

VoxBooster는 AI 음성 복제 (로컬) 행에 앉습니다. 처리는 당신의 머신에서 실행됩니다 — 오디오가 당신의 PC를 떠나지 않습니다 — 개인 정보 보호 및 라이브 사용을 위해 지연을 충분히 낮게 유지하는 데 중요합니다.

사용 사례: 누가 실제로 영국 악센트 음성 변성기를 원합니까?

역할 놀이 및 탁상 RPG

D&D 플레이어와 온라인 TTRPG 그룹은 NPC 음성을 자신의 음성과 구별하기 위해 악센트 변경기를 사용합니다. Cockney 무법자는 고상한 RP 마법사와 다르게 들리고, 4시간 세션에 걸쳐 일관되게 이러한 문자를 유지하면서 목구멍을 긴장시키지 않는 것은 실제적인 삶의 질 개선입니다.

콘텐츠 제작 및 내레이션

YouTube 채널, 팟캐스트 기록 및 TikTok 콘텐츠 작성자는 다양성과 엔터테인먼트를 위해 문자 음성을 사용합니다. AI 기반 음성 복제는 영국 TV를 통해 평생 동안 실제 영국 음성을 들은 청중을 위한 DSP 필터보다 더 신뢰할 수있는 출력을 제공합니다.

게임 및 스트리밍 성격

스트리머 빌드 성격. 설득력 있는 악센트는 스트리밍 성격에 문자를 추가하고 브랜드 정체성의 일부가 될 수 있습니다. 경쟁 멀티플레이어 게임의 경우 VoxBooster의 낮은 지연 오디오 캡처 주입 접근법은 중요합니다 — 드라이버 없음은 드라이버 수준 오디오 조작자를 표시하는 안티 채트 시스템을 통과한다는 의미입니다.

언어 학습 및 발음 연습

음성을 영국 악센트로 처리한 상태에서 큰소리로 읽으면서 들으면 일부 학습자는 귀를 훈련하는 데 유용하다고 생각하는 오디오 피드백을 제공합니다. 그것은 실제 발음 코칭의 대체가 아니지만 연습을 보완할 수 있습니다.

접근성

사회 불안을 경험하는 일부 사용자는 다른 음성을 통해 말하면 통화 및 회의의 심리적 마찰이 감소한다는 것을 발견합니다. 이것은 충분히 보고되지 않은 사용 사례입니다.

VoxBooster가 실시간 악센트 변환을 처리하는 방법

VoxBooster는 낮은 지연 오디오 캡처 주입 을 사용하여 응용 프로그램 수준에서 오디오를 캡처합니다 — 가상 케이블 드라이버 없음, 커널 모듈 없음. 이 접근법은 여러 이유로 중요합니다:

안티 체트 안전: Valorant, Fortnite 및 PUBG와 같은 게임은 무단 커널 드라이버를 표시하는 커널 수준 안티 채트 시스템을 사용합니다. VoxBooster는 드라이버를 설치하지 않으므로 이러한 검사를 통과합니다.
시스템 안정성: 게임 오디오 스택과 충돌하는 커널 오디오 드라이버는 Windows에서 시스템 불안정성의 알려진 원인입니다. 낮은 지연 오디오 캡처 주입이 완전히 우회합니다.
응용 프로그램 수준 타겟팅: 음성 변환을 특정 응용 프로그램으로 라우팅할 수 있습니다 — 예를 들어 Discord이지만 DAW가 아닙니다 — 시스템 전체 오디오 변경 없이.

악센트 변환을 구체적으로 위해, VoxBooster는 대상 스피커에서 훈련된 음성 모델을 로드하고 신경 음성 변환 을 로컬로 실행합니다. 음성 모델을 선택하고, 변환 강도 슬라이더를 조정합니다 (이는 음성 특성이 대상으로 대체되는 공격성을 제어함) 및 라이브로 이동합니다. 처리는 사용 가능한 경우 GPU에서 실행되며, 최신 하드웨어에서 허용 가능한 지연으로 CPU로 폴백합니다.

VoxBooster는 또한 음성 변환과 함께 실행되는 Whisper 기반 전사 를 포함합니다. 라이브 악센트 변환 오디오 피드와 텍스트 성적증명서를 동시에 원하는 콘텐츠 생성 워크플로우에 유용합니다.

VoxBooster를 다른 음성 변성기와 비교

Voicemod 는 가장 널리 사용되는 실시간 음성 변성기입니다. 해당 악센트 사전 설정은 DSP 기반입니다 — 재미있는 효과이지만 언어학적으로 정확하지 않습니다. 역사적으로 일부 안티 채트 시스템과 호환성 문제를 유발한 독점 드라이버 모델이 있습니다.

MorphVOX 는 음성 효과 사전 설정의 큰 라이브러리가있는 오래된 DSP 기반 도구입니다. 인공 지능 복제가 없습니다. 만화 스타일 문자 음성에 좋지만 설득력있는 악센트 작업이 아닙니다.

Clownfish Voice Changer 는 무료 경량 DSP 도구입니다. 기본 음정 및 포먼트 시프트, AI 없음. 현실성이 문제가 아닌 캐주얼 사용에 좋습니다.

Voice.ai 는 클라우드 처리 옵션이있는 AI 기반 음성 복제를 제공합니다. 클라우드 루트는 로컬 처리와 비교하여 라이브 게임 사용에 덜 실용적으로 만드는 지연을 추가합니다.

VoxBooster의 차별화는 로컬 AI 처리 (낮은 지연, 클라우드 독립성), 낮은 지연 오디오 캡처 주입 (커널 드라이버 없음, 안티 채트 안전) 및 당신이 기록한 악센트 스피커를 포함하여 당신의 오디오 샘플에 사용자 정의 음성 모델을 훈련하는 기능의 조합입니다.

실시간 음성 변성기가 기술적으로 작동하는 방식 및 Discord에서 음성 변성기를 설정하는 방법을 확인하여 기본 역학에 대한 더 많은 세부 사항을 확인합니다.

악센트 변경의 정직한 제한

VoxBooster를 포함한 어떤 도구도 모든 조건에서 완벽한 악센트 변환을 생성하지 않습니다. 예상할 수 있는 것:

Vowel bleed-through: 당신의 모국 모음이 대상 모음에서 멀면 변환이 한 개를 다른 개로 완전히 대체하지 않고 두 개 사이의 타협을 할 것입니다. 강한 모국 악센트는 더 많은 출혈을 보입니다.

Prosody는 어렵습니다: 리듬과 문장 스트레스는 당신의 발언이 끝나기 전에 발언을 예측해야 하기 때문에 실시간으로 변환하기 가장 어려운 것들입니다. AI 모델은 DSP보다 이것을 더 잘 처리하지만, 음운 패턴을 실제로 배운 성우 뒤에 여전히 라그입니다.

시끄러운 입력이 변환을 저하시킵니다: AI 모델은 깨끗한 마이크 입력에서 가장 잘 수행됩니다. 배경 잡음, 리버브 및 열악한 마이크 배치는 모두 변환 품질을 감소시킵니다. 조용한 방에서 체면 있는 콘덴서 또는 동적 마이크는 소프트웨어 개선보다 훨씬 더 가치가 있습니다.

계산 층: 실시간 신경 변환은 실제 GPU 또는 다중 코어 CPU 전력이 필요합니다. 10년 된 저가 랩톱에서 지연 및 오디오 시공품이 눈에 띌 수 있습니다. VoxBooster의 시스템 요구 사항 목록은 최소 사양을 나타냅니다. 그 아래에 있으면 AI 변환 없이 DSP 모드가 더 안정적입니다.

유능한 음성 소프트웨어를 장난감 수준 도구와 구분하는 것에 대한 광범위한 보기는 PC 가이드를 위한 최고의 음성 변성기를 참조하세요.

영국 악센트 모델 설정

VoxBooster에서 사용자 정의 영국 악센트 모델을 빌드하려면:

오디오 소싱: 대상하려는 악센트가 있는 원래 영국 스피커를 찾습니다. 직접 (허가 있음) 또는 Creative Commons 오디오 소스 사용을 녹음합니다. 일관된 볼륨에서 깨끗한 음성의 5-20분을 목표로 합니다.
오디오 정리: 2초 이상 침묵 제거, 배경 잡음 잘라내기, 음량 수준 정규화. Audacity와 같은 오디오 편집 도구가 잘 작동합니다.
모델 훈련: VoxBooster의 모델 훈련 UI로 오디오를 가져옵니다. 훈련은 샘플 길이 및 하드웨어에 따라 20분에서 몇 시간이 걸립니다.
테스트 및 조정: 변환을 통해 음성을 실행하고 비판적으로 청취합니다. 변환 강도 슬라이더는 음성이 대상으로 얼마나 멀리 당겨지는지를 제어합니다. 낮은 설정은 음성 서명을 더 많이 보존하면서 악센트 색상을 추가합니다. 높은 설정은 자연성이 감소하면서 대상을 향해 더 멀리 푸시합니다.
반복: 특정 음운이 이상하게 들리면 훈련 데이터를 다시 검사합니다. 문제가 되는 사운드의 더 많은 샘플을 추가하면 도움이됩니다.

AI 음성 복제 워크플로우에 대한 추가 정보는 AI 음성 변성기 가이드를 참조하세요.

자주 묻는 질문

음성 변성기가 나에게 진정한 영국 악센트를 줄 수 있습니까?

DSP 혼자서는 아닙니다. 피치 및 포먼트 이동은 음성을 영국 음색 방향으로 밀 수 있지만, 설득력 있는 악센트에는 리듬, 모음 소리 및 억양이 필요합니다 — AI 음성 복제 훈련된 강조된 대상 음성만 실시간으로 현실적으로 재현할 수 있습니다.

RP와 Cockney의 차이점은 무엇입니까?

Received Pronunciation (RP)은 ‘표준’ 영국 악센트입니다 — 지역적이지 않음, BBC 방송 및 공식 연설과 관련됨. Cockney는 떨어진 H 음성, 성문 정지 및 라이밍 속담이 특징인 동런던 노동 계급 방언입니다. 그들은 모음 소리를 공유하지 않으며 완전히 다르게 들립니다.

VoxBooster가 커널 드라이버 없이 작동합니까?

예. VoxBooster는 낮은 지연 오디오 캡처 주입을 사용하여 커널 드라이버를 설치하지 않고 앱 간 오디오를 라우팅합니다. 이렇게 하면 시스템이 안정적으로 유지되고 대부분의 안티치트 검사를 통과하므로 Valorant 또는 Fortnite와 같은 게임에서 안전하게 사용할 수 있습니다.

영국 악센트로 AI 음성 복제를 훈련하려면 무엇이 필요합니까?

대상 영국 음성의 오디오 샘플이 필요합니다 — 이상적으로는 깨끗하고 일관된 음성의 5-20분. AI는 이러한 샘플에서 모음 배치, 리듬 및 억양을 배웁니다. 더 많은 데이터와 일관된 녹음 품질은 더 설득력 있는 악센트 복제를 생성합니다.

Discord에서 영국 악센트 음성 변성기를 사용할 수 있습니까?

예. VoxBooster를 Discord의 오디오 설정에서 마이크 입력으로 설정하면 처리된 음성이 실시간으로 전달됩니다. 낮은 지연 오디오 캡처 주입은 가상 케이블 드라이버가 필요하지 않으며 지연이 정상적인 대화에 충분히 낮습니다.

실시간 악센트 변경이 리스너에게 눈에 띄는가?

좋은 음성 모델에서 AI 기반 악센트 복제는 대화 거리에서 설득력 있습니다. 순수 DSP 악센트는 대부분의 귀에 부자연스러워 들립니다. 왜냐하면 프로소디 — 리듬 및 문장 스트레스 — 당신의 원래 패턴에 남아 있기 때문입니다. AI는 프로소디를 더 잘 처리하지만 여전히 완벽하지 않습니다.

영국 악센트 음성 변성기의 최고의 사용 사례는 무엇입니까?

역할 놀이 및 D & D 캠페인, 콘텐츠 제작 및 YouTube 내레이션, 게이밍 및 스트리밍 성격, 언어 학습 연습, 그리고 특정 악센트가 이해력을 향상시키는 접근성 응용 프로그램이 가장 인기 있는 사용입니다.

결론

영국 악센트 음성 변성기는 후드 아래에서 실행되는 기술만큼만 좋습니다. DSP 도구는 빠르고 가벼우며 재미있습니다 — 그들은 캐주얼 역할 놀이, 게임 문자 음성 및 리스너가 언어학적으로 정확한 악센트를 기대하지 않는 모든 맥락에서 잘 작동합니다. 콘텐츠 제작, 스트리밍 성격 또는 원래 영국 스피커가 청중에 있을 수있는 상황의 경우, 실제 악센트 스피커에서 훈련된 AI 음성 복제가 설득력있는 거리를 가까이 할 수있는 유일한 접근법입니다.

VoxBooster는 로컬 AI 음성 변환, 낮은 지연 오디오 캡처 주입 및 단일 Windows 응용 프로그램의 커널 없음 드라이버 안전을 함께 가져옵니다. YouTube 시리즈를 위한 RP 악센트를 쫓든 D & D 악당을 위한 Cockney 음성을 쫓든 워크플로우는 같은 방식으로 시작됩니다. 좋은 훈련 오디오, 모델 훈련의 몇 시간, 그리고 변환 강도 슬라이더를 얼마나 멀리 밀어넣을지를 선택할 수 있습니다.

VoxBooster 다운로드 및 포함된 스타터 모델을 시도하거나, 당신의 오디오 샘플을 가져와 첫날부터 사용자 정의 영국 음성을 훈련시킵니다. 가격을 참조하여 계획 옵션을 확인합니다.