Formant Kaydırma Açıklaması: Doğal Ses Değişiklikleri
Yalnızca pişkinliği hareket ettiren yapay zeka ses değiştirici üç saniye içinde sahte gelir. Inandırıcı ses dönüşümlerinin arkasındaki gerçek sır, formant kaydırmasıdır - pişkinlikten bağımsız olarak vokal yolunuzun akustik karakterini tanımlayan rezonant frekansları ayarlama. Bir kez formanların nasıl çalıştığını anladığınızda, çoğu ucuz ses değiştiricisinin ne yanlış yaptığını hemen duyacaksınız ve kendi dönüşümleriniz işlenmiş ses gibi geldiğinde hangi düğmeye ulaşacağınızı tam olarak bileceksiniz.
Bu yazı, formanlar arkasında fiziksel fiziği sade dilde kapsar, formant kontrolü olmadan pişkinlik kaydırması neden sincap veya yavaşlatılmış bant gibi ses çıkarır, modern yapay zeka ses değiştiricileri formanları daha eski DSP araçlarıyla karşılaştırarak nasıl işler, ve VoxBooster’ın formant kontrolleri kullanarak en doğal gelen sonuçları nasıl elde eder.
TL;DR
- Formantlar, vokal yolunuzun şekli tarafından üretilen rezonant frekans tepeleridir. Ünlü sesleri ve ses karakterini tanımlarlar.
- Pişkinlik kaydırması tek başına temel frekansı hareket ettirir, ancak formanları yerinde bırakır ve doğal olmayan bir “çizgi film” etkisi yaratır.
- Formant kaydırması, spektral zarfı pişkinlikten bağımsız olarak ayarlar ve bu da ses dönüşümünü gerçekten farklı bir kişi gibi ses çıkmasını sağlar.
- Pişkinlik kaydırması ile formant kaydırması oranı, dönüşüm hedefine bağlıdır: ince kılıf, karakter sesi veya tam cinsiyet geçişi.
- Yapay zeka ses değiştiricileri formant yörüngelerini sürekli modelleyen daha yumuşak sonuçlar üretir.
- VoxBooster’da bağımsız pişkinlik ve formant kaydırıcıları artı formanları otomatik olarak işleyen yapay zeka ses klonlaması vardır.
Formantlar Nedir?
Ses telleriniz, temel frekansı olan bir uğultu sesi üretir - bu sizin pişkinliğinizdir. Ama bu ham uğultu neredeyse bir ses olarak tanınmaz. Bunu tanınabilir ünlülere, duygusal dokuya ve kişisel ses karakterine şekillendiren şey, larinksinizin üstündeki odaların rezonansıdır: boğazınız, ağzınız, dudaklarınız ve burun geçitleri birlikte vokal yolu oluşturur.
Vokal yolu, karmaşık ve sürekli değişen şekle sahip bir tüptür. Herhangi bir rezonant boşluk gibi, doğal rezonant frekansları vardır. Çıkış spektrumunda bu tepelere formantlar denir ve en düşükten en yükseğe kadar numaralandırılır: F1, F2, F3 vb.
F1 ve F2 çoğu algısal işi yaparlar. “Heed”deki ünlü, düşük F1 ve çok yüksek F2’ye sahiptir. “Hod”daki ünlü, F1 ve F2’nin her ikisi orta aralıkta olmasına rağmen daha yakındır. Beyniniz bu iki tepesi kullanarak ünlüleri neredeyse anında tanımlar, bu nedenle formantlar bazen bir ünlünün “parmak izi” olarak tanımlanır. Akustik teori üzerine daha derinlemesine okuma için formantlar hakkında Vikipedi makalesi katı bir başlangıç noktasıdır ve vokal yol makalesi anatomik bağlamı sağlar.
F3 ve üstü kişisel ses karakterine katkıda bulunur - adını söylemeden önce telefondan bir arkadaşın sesini tanımanıza izin veren nitelik. F3 vokal yolu uzunluğu ve bireysel anatomi ile güçlü bir şekilde ilişkilidir.
Vokal Yolu Uzunluğu Neden Önemli
Daha uzun vokal yollarına sahip kişiler, spektrumda daha düşük konumlandırılmış formantalara sahiptir. Bu, ortalama olarak erkeklerin kadınlardan daha düşük formantalara sahip olmasının ve yetişkinlerin çocuklardan daha düşük formantalara sahip olmasının nedenidir - sadece pişkinlik nedeniyle değil, fiziksel yolu uzunluğu nedeniyle. 6 fitlik bir adam ve 5 fitlik bir kadın bazen aynı müzik pişkinliğine çarpabilir, ancak formanları tamamen farklı spektral konumlarda olacaktır.
Vücut boyutu, vokal yolu uzunluğu ve formant pozisyonu arasındaki bu ilişki, sadece akademik önemsizliktir. Bu, yalnızca pişkinliği değiştirmenin neden yanlış ses çıkardığının tüm nedenidir. Bir kaydı pişkinliği düşürmek için yavaşlattığınızda, her formant geçişini de yavaşlatırsınız. Bu, ünlüleri yavaş ve cansız ses yapar, yanlış hızda çalan bir kayıt gibi. Hızlandırdığınızda, formantlar orantılı olarak yerinde kalır, ancak şimdi çok yüksek ve çok sıkı paketlenmiş hissettiren, tanıdık sincap eserleriyle sonuçlanır.
Farklı bir pişkinlikte çalışan gerçek bir ses, aslında farklı bir vokal yolu yapılandırması tarafından üretilen formantalara sahiptir. Formant konumları kaymalar, ancak pişkinliğe basit bir doğrusal oran olarak değil. İyi bir ses dönüşümü bu ilişkiyi modellemek zorundadır.
Pişkinlik Kaydırma Vs. Formant Kaydırma
Burası çoğu ucuz ses değiştirici düşerler. Pişkinlik kaydırması kolaydır: ses sinyalinin frekans içeriğini çarpın veya bölün, teyp değişikliğinden kaçınmak için zamanı telafi edin, bitti. Sonuç, temel frekansı yükseltilmiş veya alçaltılmış sesinizdir, ancak spektral zarf - frekans yanıtının genel şekli - orijinal sesinizle aynıdır.
Diğer yandan formant kaydırması, temel pişkinlik yapısını tek başına bırakırken (veya ayrı ayrı ayarlarken) spektral zarfı hareket ettirir. Sesin kısa vadeli spektrumunu analiz ederek, zarfı (harmonik tepeleri bağlayan yumuşak eğri) tahmin ederek, bu zarfı frekans olarak yukarı veya aşağı çarpıtarak, ardından sinyali yeniden sentezleyerek çalışır.
Uygulamada ayrım:
| Teknik | Ne Hareket Eder | Ne Kalır | Tipik Artefakt |
|---|---|---|---|
| Yalnızca pişkinlik kaydırması | Temel frekans | Spektral zarf / formantlar | Sincap (yukarı) veya yavaş hareket (aşağı) |
| Yalnızca formant kaydırması | Spektral zarf | Temel pişkinlik | Orijinal pişkinliğinizde konuşan farklı biri gibi ses |
| Her ikisi, doğru oran | Her ikisi, eşleşmiş | — | Farklı bir ses türüne inandırıcı dönüşüm |
| Her ikisi, yanlış oran | Her ikisi, eşleşmemiş | — | İşlenmiş, mekanik veya boş ses |
“Doğru oran”, başarmaya çalıştığınız dönüşüme büyük ölçüde bağlıdır. Pişkinliği 4 yarım ton yükseltmek ve formanları %15-20 kaydırmak, daha uzun bir kişinin daha kısası ile aynı pişkinlikte konuştuğunda ne olduğunun kaba bir tahminidir. Ancak gerçek ilişki doğrusal olmayan ve ses bağımlı olup, bu da yapay zeka modellerinin sabit DSP zincirlerine karşı önemli bir avantaja sahip olduğu yerdir.
Formant Korunması: Diğer Kullanım Durumu
Her formant manipülasyonu dönüşüm hakkında değildir. Formant korunması - pişkinlik değişirken formanları sabit tutma yeteneği - belirli senaryolarda eşit derecede önemlidir.
Bir şarkıcı pişkinliği düzelttiğinde veya bir performansı transpoze ettiğinde, saf pişkinlik kaydırması ünlülerini uçlarda tanınmaz bir şeye dönüştürür. Formant korunması, nota değişse bile ünlü kalitesini sabit tutar. Bu profesyonel pişkinlik düzeltme yazılımında standarttır.
Ses değiştiriciler için koruma, ince ayarlamalar istediğiniz zaman önemlidir: sesinizi biraz daha sıcak veya parlak hale getirme ve timbral kimliğini değiştirmeme, veya belirli bir frekans aralığında sertlik ekleyen bir mikrofonu telafi etme. Ayrıca canlı akış sırasında tanınamaz hale gelmeden belirli bir karakterin hızını eşleştirmek için yararlıdır.
VoxBooster’daki formant kaydırıcısı sıfır civarında çalışır. Pozitif olarak kaydırmak formanları yukarı kaydırır (parlak, daha küçük yolun niteliği), negatif olarak kaydırmak onları aşağı kaydırır (koyu, daha büyük yolun niteliği). Yalnızca pişkinlik ayarlı sıfırda bırakmak, çok uzağa basarsanız sincap etkisi verir. Her ikisini de kalibrede oran ile kilitlemek dönüşüm verir. Yalnızca formantu ayarlamak ince ton oymacılığı verir.
Geleneksel DSP Araçları Formanları Nasıl İşler
Klasik ses değiştiriciler, sesin kısa çerçevesinden spektral zarfı çıkarmak ve bu zarfı sabit bir çarpanla çarpıtmak için LPC (Doğrusal Öngörücü Kodlama) veya Cepstral zarf tahmini denilen bir teknik kullanır, ardından ses yeniden oluşturur. MorphVOX ve Voicemod’un önceki sürümleri gibi araçlar bu yaklaşımın varyantlarını kullanır.
Kalıcı ünlüler üzerinde orta kaydırma miktarlarında makul bir şekilde iyi çalışır. Sorunlar kenarlarda görülür:
Ünsüzler ve geçişler. Fricatif (“s” veya “f”) veya durma patlaması sırasındaki spektral zarf, bir ünlü ile aynı yapıya sahip değildir. Ünlü optimized zarf çarpıtmasını bir ünsüze uygulamak, ünsüzü bulanıklaştırır veya eserleri üretir.
Hızlı konuşma. LPC çerçeve analizi, sinyalin her kısa pencere içinde yarı-sabit olduğunu varsayar. Hızlı formant geçişleri ile hızlı konuşma bu varsayımı sorgulandırır ve duyulabilir “kabarcık” eserleri üretir.
Sabit çarpan. Spektrum genelinde düzgün bir şekilde uygulanan tek bir formant kaydırma çarpanı, gerçek vokal yollarının nasıl davrandığı ile eşleşmez. Tüm formantlar vokal yolu yapılandırması değiştiğinde aynı oranda kaymaz.
Bu sınırlamalar ölümcül değildir. Birçok yayıncı geleneksel DSP tabanlı değiştiricileri başarıyla kullanır. Ancak doğal sonuçlar elde etmek dikkatli ayarlama gerektiği ve bazı dönüşümlerin temiz bir şekilde başarılamadığı anlamına gelir.
Yapay Zeka Ses Değiştiricileri Formanları Farklı Kılıyor
Modern yapay zeka ses değiştiricileri - ve burada teknoloji gerçekten ilerledi - spektral zarfı geleneksel anlamda tahmin etmez ve çarpıtmaz. Bunun yerine, insan konuşmasının büyük veri setlerinde eğitilen sinir ağlarını kullanarak ses özelliklerinin istatistiksel yapısını ve doğal konuşma sırasında formanların nasıl hareket ettiğini öğrenirler.
Çalışma zamanında, model gelen sesi işler ve giriş formantlarına sabit matematiksel dönüşüm uygulamak yerine hedef sesin formant özelliklerini yansıtan çıktı üretir. Pratik farklılıklar:
Ünsüz işleme. Model gerçek seslerin ünsüzleri nasıl ürettiklerini öğrendiğinden, jenerik spektral çarpıtmadan daha doğal olarak işler.
Sürekli adaptasyon. Sabit çerçeveleri bağımsız olarak analiz etmek yerine, tekrarlayan veya dikkat tabanlı modeller çevre çerçevelerinden bağlamı kullanabilir, fonem arasındaki geçişleri daha yumuşak kılabilir.
Hedef eşleştirilmiş formantlar. Belirli bir sesi klonlarken, sinir modeli jenerik kaydırma formülü tahmin ettiğinin yerine o kişinin sesinin gerçekten yaptığı şey ile eşleşen formanlar üretir.
Takas hesaplama maliyeti ve gecikmedir. Sinir ses dönüşümü LPC’den daha zordur. Tüketici donanımında 10ms gidiş-dönüş altında almak gerçek bir mühendislik sorunudur. VoxBooster’ın düşük gecikmeli ses yakalama temelli boru hattı, dikkatli tampon boyutlandırması ile ses iş parçacığında işlenerek, sinir işlemeyi özel bir arka planda iş parçacığında tutarak ve sonucu ön-tamponlamış 10ms altında ses gecikmesi elde eder. Bu Discord veya oyun içi iletişimde canlı kullanım için önemli bir tasarım seçimidir.
Belirli Ses Değişiklik Amaçları için Formant Kaydırma
Cinsiyet Geçişi Dönüşümleri
Bu, insanların ses değiştiriciden istediği dönüşümdür ve aynı zamanda inandırıcı bir şekilde başarılması en zordur. İnandırıcı erkek-dişi dönüşüm, pişkinliği yükseltirken formanları yaklaşık %15-25 yükseltme gerektirir. Ancak tam miktarlar sesinize, hedefinize ve söylediğiniz şeyin fonetik içeriğine bağlıdır.
Yaygın bir hata, formanları dokunmadan pişkinliği yükseltmek ve neden açıkça işlenmiş ses çıktığını merak etmektir. İkinci yaygın hata, farklı bir ses türü için kalibre edilmiş önceden ayarlanmış değerler kullanmaktır. Ortalama üstü derin erkek sesiniz varsa, orta aralık erkek sesi için tasarlanan bir ön ayar hala yanlış görünecektir.
Küçük formant kaydırmalarından başlayın (%5-10%) ve dinleyin. Erkek sesler tarafsız ünlüler için F1 yaklaşık 500 Hz ve F2 yaklaşık 1500 Hz civarında olma eğilimindedir. Kadın sesler F1’i yaklaşık 700 Hz’e ve F2’yi yaklaşık 2000 Hz’e yakın tutar. Formanları %20-25 yükseltmek sizi doğru aralığa getirir. Ardından pişkinliği eşleştirmek için ayarlayın. Genellikle düşündüğünüzden daha az pişkinlik kaydırmasına ihtiyaç duyacaksınız, çünkü formant kaydırması çoğu algısal işi zaten yapmıştır.
Karakter Sesleri
Robot sesleri, yabancı karakterler, şeytanlar ve benzer etkiler, genellikle doğal vokal yolu modelini kasıtlı olarak kıran yollarla formant kaydırmasını kullanır. Bu nokta. Formanları dramatik olarak aşağı kaydırmak stereotipik “büyük şeytan” etkisini yaratır. Hafif pişkinlik düşüşü ile uç yukarı kaydırmalar, mekanik veya uzaylı olarak okunan çok insansız bir doku yaratır.
Referans için, robot sesi efekti ve radyo sesi efekti hakkında ilgili gönderiyi kontrol edin, formant işi ile iyi bir şekilde eşleşen tamamlayıcı işleme teknikleri için.
Ince Kılıf veya Gizlilik Maskeleme
Her kullanım durumu dramatik dönüşüm değildir. Bazı yayıncılar, izleyicilerine belirgin bir şekilde tanınabilir, ancak gerçek seslerine atfedilemez bir şekilde konuşmak isteyecektir. Küçük formant kaydırmaları (%5-10%), orta pişkinlik ayarlaması (2-4 yarım ton) ile kombine, ses tanımlama yazılımının başarısız olması için yeterli, insan dinleyicilere açıkça işlenmiş olmadan.
Ses Değişikliği Olmadan Pişkinlik Düzeltmesi
VoxBooster’ın pişkinlik düzeltme özelliğini kullanarak şarkılı geçişlerde nota üzerinde kalmanız veya daha rezonant bir pişkinliğe yayın yapmak için, formant korunmasını etkinleştirmek pişkinlik ayarlanırken ünlüleri doğal tutar. Bu, profesyonel yayıncıların larenksleri eğitmeden alışılmış konuşma pişkinliğini taşımak için kullandıkları aynı tekniktir.
VoxBooster’da Formant Kontrolü Kullanma
VoxBooster’ın ses efektleri panelinde formant kaydırıcısı yarım ton cinsinden ifade edilir, sezgisel eşleştirme için pişkinlik kaydırıcısı birimlerine eşleşir. Pratik bir iş akışı aşağıdadır:
- VoxBooster’ı açın ve yan çubuktan Ses Efektleri modunu seçin.
- İstediğiniz dönüşüm için temel pişkinlik kaydırmasını ayarlayın - diyelim, daha hafif bir ses için +4 yarım ton.
- Pişkinlik ayarlanmış şekilde, formant kaydırıcısını yavaş yukarı hareket ettirin. Mümkünse kulaklıkta dinleyin. Sesin “benim pişkinlik-kaydırılmış sürümü” yerine “farklı bir kişiye” kaymış olduğunuzu duyacaksınız.
- Doğal seslenen +4 yarım ton pişkinlik değişiklliği için tatlı nokta, tipik olarak +2 ile +3 yarım ton formant kaydırma civarındadır. Formantlar müziksel yarım tonlar ile doğrusal değil yolu uzunluğuna orantılı olarak ölçeklendiğinden oran 1:1 değildir.
- Yapay zeka ses klonlama modu kullanıyorsanız, sinir modeli formanları otomatik olarak seçer. Formant ofset kaydırıcısı daha sonra modelin çıkışının üzerinde ince ayar basması olarak hareket eder. Hedef ses belirli bir ünlü aralığında biraz kapalı göstermiyorsa faydalıdır.
OBS kullanıcıları için VoxBooster standart bir sanal ses cihazı olarak kaydeder. OBS ayarlarında mikrofon kaynağı olarak seçin ve formant kaydırılmış ses diğer herhangi bir mikrofon girişi gibi tam olarak yönlendirir. OBS tarafında fişin gerekli değildir. Discord kurulumu eşdeğeri için how-to-use-voice-changer-on-discord bakın. Yönlendirme ilkesi aynıdır.
Ayrıca formant kaydırması ile birlikte çalışan gerçek zamanlı efektlerin tam listesi için VoxBooster’ın özellikleri sayfasını kontrol edebilir ve tam teknik spec için ses değiştirici özellikleri sayfasını kontrol edebilirsiniz.
Yaygın Hatalar ve Bunları Düzeltme
Kulaklıklarda dinlemeden formant kaydırma. Hoparlör sızıntısı ve oda akustiği, formant işleme tarafından tanıtılan eserleri maskeleyecektir. Hoparlörlerden iyi gelen, genellikle kulaklıklar aracılığıyla açıkça işlenmiş ses gelmektedir. Bu, akış izleyicinizin sizi duyduğu şeklidir.
Sesinize kalibr olmadan ön ayarları kullanma. Ön ayarlar geliştirici veri setinde “tipik” bir sese dayanır. Sesiniz tipik değilse - alışılmadık rezonans, aksent, pişkinlik aralığı - ön ayarları yönetmek yerine beş dakika manuel kalibr yapmaya harcayacak daha iyi sonuçları alacaksınız.
Bir yönde çok fazla kaydırma. Formant kaydırması güçlü bir etkidir. %20 kaydırma zaten önemli bir dönüşümdür. %40’ı taşımak formanları harmonik seri ile kötü etkileşime giren frekans bölgelerine ittiğiniz için boş, tüp benzeri eserleri üretmeye başlar.
Gürültü bastırma ile etkileşimi göz ardı etme. VoxBooster’ın yerleşik bastırıcısını da içeren gürültü bastırma filtreleri, yönlendirmenize bağlı olarak efekt zincirinin öncesinde veya sonrasında sinyal üzerinde çalışır. Gürültü bastırma formant kaydırmadan önce ise, bastırıcıdan spektral smearing formant tahmini düşürebilir. Aşağıda ise, bastırıcı formant kaydırılmış sinyalin yüksek frekans içeriğinin bazılarını yiyebilir. Her ikisini de kullanıyorsanız siparişle deneme yapın.
Yapay zeka klonlaması efekt zinciri ayarlama için bir ikame olmak bekleniyor. Yapay zeka ses klonlaması formanları sizin için işler, ancak modelin çıkışı giriş sesinin kalitesi, mikrofonunuzun frekans yanıtı ve arka plan gürültüsü tarafından etkilenir. Modele giren temiz sinyal, gürültülü veya yankılı oda kaydından çok daha temiz bir dönüşüm üretir.
Ne Bir Sesi Belirli Biri Gibi Ses Çıkarmaktadır?
Bu ilk görünüşten daha derin bir sorudur ve yapay zeka ses değiştiricilerin gerçekten ne yaptığını anlamak ile ilgilidir. Bir konuşmacıyı sesinden tanımlanması kapsamlar:
- Temel frekans aralığı ve varyasyon (konuşmalarının “melodi”)
- Formant frekansları ve dinamik yörüngeleri (ünlülerinin “şekli”)
- Ses kalitesi parametreleri: bitkinlik, çatlamışlık, burunluk, ses kordlama derecesi
- Ritim, oran ve prosodi (pace ve stres nasıl yaptıkları)
- Burun geçişleri ve sinüslerden rezonans özellikleri
Basit pişkinlik ve formant kaydırması ilk ikisini yaklaşık yapabilir. Üçüncü ve dördüncü daha geliştirilmiş işleme gerektirir. Hedef sesin bu özelliklerin istatistiksel dağılımını modellemek, hangi sinir ses dönüşümü yapar. Prosodi (dördüncü) ses değiştiriciler tarafından genellikle hiç değiştirilmez, bu neden başka her şey dönüştürülse bile konuşma modeliniz tanınabilir şekilde kendi kalmasıdır.
Bunu anlamak gerçekçi beklentiler ayarlanmasına yardımcı olur. Ses değiştirici sesinizin nasıl ses çıkacağını değiştirebilir. Konuştuğunuz şekli değiştiremez. Ses dönüşümünün kasıtlı prosodi taklit ile kombinasyonu en inandırıcı taklit üretir. Ancak bu ikinci bölüm yazılım değil, uygulama gerektirir.
Daha derin akustik bilim ile ilgilenen okuyucular için Gunnar Fant tarafından vokal yolu akustikleri hakkında klasik kağıt temel referanstır ve OBS sanal ses cihazı belgeleri sanal ses yönlendirmesinin işletim sistemi düzeyinde nasıl çalıştığını kapsar.
Sık Sorulan Sorular
Ses değiştiricide formant kaydırma nedir?
Formant kaydırma, vokal yolunuzun rezonant frekanslarını hareket ettirir. Sesinizin spektrumundaki ünlü sesleri ve timbral karakteri tanımlayan tepeleri pişkinliği mutlaka değiştirmeden. Bu, ses dönüşümünün sadece hızlandırılmış veya yavaşlatılmış bir sürüm yerine farklı bir kişi gibi gelmesini sağlayan şeydir.
Formant kaydırma pişkinlik kaydırması ile aynı mı?
Hayır. Pişkinlik kaydırması, sesinizin temel frekansını müzik notası gibi yukarı veya aşağı alır. Formant kaydırması, pişkinlikten bağımsız olarak rezonant boşluk özelliklerini değiştirir. Her ikisini de doğru oranla yapmak, inandırıcı ses dönüşümleri üretir.
Pişkinlik kaydırması tek başına neden doğal değil?
Formantları ayarlamadan sesin pişkinliğini kaydırdığınızda, rezonant tepeler aynı spektral konumda kalırken temel frekans hareket eder. Sonuç çizgi film sincabı veya yavaş hareket kaydı gibi gelmektedir, çünkü gerçek insan sesi bu şekilde davranmaz. Doğal sesler vokal yolu uzunluğu ile ölçeklendirilen formantalara sahiptir.
Formant korunması nedir ve ne zaman istiyorum?
Formant korunması, pişkinliğiniz değişse bile orijinal rezonant frekanslarınızı korur. Şarkı söylerken veya konuşurken, işlenmiş ses olmadan pişkinlikte kalmanız gerektiğinde istiyorsunuz. Koro uygulamaları bunu yoğun şekilde kullanır. Ses değiştirici bağlamında, koruma, timbral karakterini değiştirmeden ince ayar istediğinizde yararlıdır.
Yapay zeka ses değiştirici formanları daha eski araçlardan farklı işler mi?
Geleneksel DSP araçları formanları sabit spektral zarf çarpıtması olarak kaydırır. Modern yapay zeka ses değiştiricileri sesi sürekli analiz eder ve hedef sesin doğal formant yörüngelerini tahmin eden sinir ağı modellerini uygulayarak, hızlı konuşma ve ünsüz patlamaları sırasında bile daha yumuşak, daha gerçekçi geçişler üretir.
VoxBooster’da formant kontrolü var mı?
Evet. VoxBooster, pişkinlik kaydırıcısından bağımsız olarak ses efektleri panelinde formant kaydırma kaydırıcısını ortaya koymaktadır. Onları birlikte veya ayrı ayrı hareket ettirebilirsiniz. Yapay zeka ses klonlama modu için sinir modeli formanları otomatik olarak işler, ancak yine de çıkışı ince ayar yapmak için formant ofsetini ayarlayabilirsiniz.
Formant kaydırma kullanmak oyunlarda anti-cheat veya ses algılanması sorunlarına neden olur mu?
Hayır. Formant kaydırma, ses akışına sanal mikrofona ulaşmadan önce uygulanan standart ses DSP işlemidir. VoxBooster düşük gecikme süreli ses yakalamayı kullanır ve standart bir sanal ses cihazını kaydeder. Oyunlar ve anti-cheat sistemleri sürücü düzeyinde bir kanca değil, normal mikrofon girişi görürler.
Sonuç
Formant kaydırma, “bir ses değiştirici kullanıyor musunuz?” diye soran ses dönüşümü ile “bu gerçek sesiniz mi?” diye soran ses dönüşümü arasındaki farktır. Formant farkındalığı olmadan pişkinlik kaydırması bir stüdyo numarası gibi gelmektedir. Pişkinlik ve formant birlikte, dönüşüm hedefiniz için doğru oranla ayarlanmış, farklı bir kişi gibi gelmektedir.
Ses işi hakkında ciddiyseniz - akış, içerik oluşturma, gizlilik veya sadece deneme - bir gece formanların ne yaptığını gerçekten anlamak ve bu anlayışı ön ayarları yönetmek yerine kurulumunuza uygulamakla geçirmek değerlidir. Kontroller bir kez zihinsel modeliniz olunca karmaşık değildir.
VoxBooster her ikisi için de bağımsız kaydırıcılar artı hedef ses dönüşümleri için formant haritalamayı otomatik olarak işleyen yapay zeka ses klonlaması sağlamaktadır. Ücretsiz 3 günlük deneme, bu yazıda açıklanan her iş akışını yapacak kadar zaman vardır.
VoxBooster’ı İndir - ücretsiz 3 günlük deneme, kredi kartı gerekli değildir.