Demoniczny modulator głosu: Ustawienia fantasy dla DnD, TTRPG i streamów horroru

Cztery archetypy demonów - szeptucha, arcydemona, opętanego i szalonego demona - zbudowane z przesunięciem tonacji, nakładką warkotem, wzmocnieniem bas głębokim i obniżaniem formantów dla DnD, TTRPG i streamów horroru.

Demoniczny modulator głosu: Ustawienia fantasy dla DnD, TTRPG i streamów horroru

Demoniczny modulator głosu zbudowany dla tabelarycznej gry fabularnej, streamów horroru i zawartości fantasy jest fundamentalnie innym narzędziem niż zabawny suwak tonacji. Różnica jest architekturą: gdzie standardowy shifter tonacji przesuwa pojedynczy parametr częstotliwości, prawidłowo zaprojektowane ustawienie demonicznego głosu łączy przesunięcie tonacji, obniżanie formantów, zniekształcenie harmoniczne, nakładkę warkotem i wzmocnienie bas głębokie w pojedynczą sieć przetwarzania - a następnie pozwala ci przełączać się między oddzielnymi archetypami w czasie potrzebnym na naciśnięcie skrótu klawiszowego.

Ten przewodnik buduje cztery nazwane archetypy demonów od podstaw, wyjaśnia przetwarzanie sygnału za każdą warstwą i obejmuje konfigurację w czasie rzeczywistym dla DnD, TTRPG, streamów horroru i każdego innego kontekstu, w którym potrzebujesz wcielić się w coś starożytnego i złośliwego w jednej chwili.


Szybkie streszczenie

  • Cztery archetypy demonów - szeptucha, arcydemona, opętany i szalony demon - każdy ukierunkowany na odrębną funkcję narracyjną w grze fabularnej i zawartości horroru.
  • Warstwy rdzenne: przesunięcie tonacji, obniżanie formantów, zniekształcenie harmoniczne, nakładka warkotem na -10 do -14 dB i wzmocnienie bas głębokie wyśrodkowane na 60 Hz.
  • Opóźnienie w czasie rzeczywistym poniżej 300 ms dla wszystkich wyłącznie ustawień DSP; przezroczyste kierowanie przechwytywania dźwięku o niskim opadzie czasowym oznacza, że Discord, Foundry VTT, Roll20 i OBS nie potrzebują żadnej rekonfiguracji.
  • Zapisz każdy archetyp jako nazwany profil z skrótem klawiszowym, aby móc przełączać się między NPC w środku sesji bez przerywania przepływu narracyjnego.
  • Obniżanie formantów bez przesunięcia tonacji daje bardziej delikatny i bardziej niepokojący efekt niż sam ciężki shifter tonacji.

Dlaczego ustawienie demonicznego głosu to więcej niż suwak tonacji

Samo przesunięcie tonacji daje wolny, ospały głos, który brzmi jak magnetofon pracujący przy niewłaściwej prędkości. To jest linia bazowa - konieczna, ale niewystarczająca. Trzy dodatkowe warstwy, które oddzielają przekonujący demoniczny głos od taniego efektu tonacji, to:

Obniżanie formantów dostosowuje częstotliwości rezonansowe twojego traktu głosowego niezależnie od podstawowej tonacji. Kiedy mówisz, twój głos produkuje tone bazowy i serię wyższych tonów; formanty (szczyty rezonansowe utworzone przez kształt gardła i ust) to to, co daje twojemu głosowi charakterystyczną barwę i postrzeganą wielkość. Obniżenie formantów o -15 do -30 procent powoduje, że głos brzmi, jakby pochodził z ciała kilka razy większego od twojego fizycznego rozmiaru - nie tylko niższa częstotliwość, ale większy stwór.

Zniekształcenie harmoniczne i saturacja dodają chropowatość, ziarno i krawędź poprzez wprowadzenie harmonik powyżej i poniżej oryginalnego sygnału. Demoniczny głos bez zniekształcenia brzmi jak wiolonczela smyczkiem; ze zniekształceniem brzmi jak coś, co żyło dziesięć tysięcy lat i ma pogardę dla twojego istnienia. Charakter zniekształcenia - miękkie przycięcie dla ciepła, twarde przycięcie dla agresji - określa, czy ustawienie czyta się jako starożytne czy monstrualne.

Wzmocnienie bas głębokie dodaje energię w zakresie 40-80 Hz, dając głosowi fizyczną obecność, którą słuchawki i głośniki mogą reprodukować jako wyczuwalny rumor zamiast tylko słyszanej tonacji. Samo przesunięcie tonacji obniża twoją fundamentalną w ten zakres, ale pozostawia dolny koniec cienki, ponieważ zawartość harmoniczna, która powinna go wypełnić, jest nieobecna. Wzmocnienie bas głębokie to kompensuje, wyśrodkowując się wokół 60 Hz na +4 do +6 dB.

Nakładka warkotem to warstwa zniekształcenia równoległa dostrojona specjalnie do pasma 80-250 Hz - zakres częstotliwości wokalizacji dużego zwierzęcia. Pomieszana poniżej głównego sygnału na -10 do -14 dB dodaje stukającą, chrapliwą teksturę warkotem stwora bez przytłaczania zrozumienia mowy.


Cztery archetypy demonów

Archetyp 1: Szeptucha

Szeptucha to demon, który obserwował, czekał i teraz ostrożnie wybiera swoje słowa. To archetyp dla starożytnych inteligencji, manipulacyjnych fiendów i NPC, które komunikują się w ciemnym kącie mapy. Efekt powinien być niepokojący niż głośny - bliski, intymny, głębokie rezonujący.

Łańcuch sygnałowy:

  • Przesunięcie tonacji: -4 półtony z włączonym korektorem formantu
  • Obniżanie formantów: -20 procent
  • Saturacja: miękki charakter przycięcia, napęd na 30-40 procent
  • Pogłos: krótki, ciemny - opóźnienie przedpogłosu 5 ms, rozpad 0.8 s, tłumienie wysokich częstotliwości powyżej 3 kHz
  • Warstwa suboktatwy: -12 półtonów, -14 dB, pomieszana poniżej głównego sygnału
  • Wzmocnienie bas głębokie: +4 dB na 60 Hz, Q 0.8

Jak go używać: Mów cicho i powoli. Siła szeptuchy pochodzi z powściągliwości - przetwarzanie dodaje wagę, a wydajność dodaje intencję. To ustawienie jest najskuteczniejsze, gdy inni gracze właśnie zdali sobie sprawę, z czym się radzą i w pokoju zapada cisza.


Archetyp 2: Arcydemona

Arcydemona dowodzi. To jest demon wysokiego rzędu, starożytne zło, walka ze wspólnym wrogiem. Każde słowo to dekret. Głos powinien wykazywać autorytet, wypełniać pokój (lub rozmowę Discord) i wyjaśniać, że negocjacja to uprzejmość rozciągana, a nie konieczność.

Łańcuch sygnałowy:

  • Przesunięcie tonacji: -9 półtonów z włączonym korektorem formantu
  • Obniżanie formantów: -25 procent
  • Zniekształcenie harmoniczne: średniociężkie przycięcie, napęd na 55-65 procent, mieszanka na 35 procent
  • Pogłos: duża sala - opóźnienie przedpogłosu 20 ms, rozpad 2.5 s, umiarkowane tłumienie
  • Warstwa suboktatwy: -12 półtonów, -10 dB
  • Wzmocnienie bas głębokie: +5 dB na 60 Hz, Q 0.7
  • Filtr górnoprzepustowy wyłącznie na ogonie pogłosu: wytnij poniżej 120 Hz, aby pogłos nie zmętniał dolnego końca

Jak go używać: Projektuj. To ustawienie nagradza mówienie pełnym głosem - zniekształcenie i pogłos są skalibrowane dla normalnych poziomów mowy. Spuść do szeptu i traci autorytet. Mów pełną obecnością, a arcydemona wypełnia przestrzeń.


Archetyp 3: Opętany

Opętanie chodzi o niesamowite - zły głos w odpowiednim ciele, znanego uczynionego okropnym. Ten archetyp jest zbudowany dla streamów horroru, scenariuszy opętanego NPC i każdego momentu, w którym chcesz, aby twój naturalny głos pozostał słyszalny, ale głęboko zły.

Łańcuch sygnałowy:

  • Przesunięcie tonacji: -3 półtony, korektor formantu WYŁĄCZONY (mały artefakt tonacji dodaje do złości)
  • Obniżanie formantów: -28 procent (główny różniący - robi większość niepokojącej pracy)
  • Modulacja tonacji: powolny tremolo na tonacji, ±0.5 półtonów na 0.4 Hz (subtelny, ledwo dostrzegalny)
  • Saturacja: bardzo lekkie miękkie przycięcie, napęd na 20 procent
  • Pogłos: średni pokój, lekko odwrócony charakter, jeśli dostępny, rozpad 1.2 s
  • Wzmocnienie bas głębokie: +3 dB na 55 Hz

Jak go używać: Mów jak ty, ale pozwól przetwarzaniu uczynić to złym. Modulacja tonacji jest wystarczająco powolna, że słuchacze nie identyfikują jej świadomie jako tremolo - rejestruje się jako niestabilna, co jest psychologicznym efektem, który chcesz. To jest najbardziej technicznie subtelny z czterech archetypów i najskuteczniejszy dla zawartości horroru, gdzie niepokojąca jakość powinna poczuć się realna niż teatralna.


Archetyp 4: Szalony demon

Czyst zagrożenie, bez subtlności. Szalony demon to spotkanie, które już zdecydowało się zakończyć drużynę. To ustawienie idzie głośnie, zniekształcone i fizycznie przytłaczające. Użyj go do klimaksowych konfrontacji, pogróżek walki i każdego momentu, w którym siła demona musi być poczuta, a nie sugerowana.

Łańcuch sygnałowy:

  • Przesunięcie tonacji: -12 półtonów z włączonym korektorem formantu
  • Obniżanie formantów: -30 procent
  • Zniekształcenie twarde przycięcie: napęd na 80 procent, mieszanka na 50 procent
  • Nakładka warkotem: równoległa pasmo 80-250 Hz, zniekształcenie w przycięcie, pomieszanie -10 dB
  • Pogłos: duży, agresywny - opóźnienie przedpogłosu 8 ms, rozpad 1.8 s, bez tłumienia wysokich częstotliwości
  • Warstwa suboktatwy: -12 półtonów, -8 dB (głośniej niż inne archetypy - ten powinien wstrząsać)
  • Wzmocnienie bas głębokie: +6 dB na 65 Hz, Q 0.9

Jak go używać: Głośność w górę. Siła szalonego demona pochodzi z kombinacji maksymalnego spadku tonacji, maksymalnego zniekształcenia i warstwy suboktatwy wciśnięcia w dolny koniec. Mów pełnym głosem, pozwól przetwarzaniu przycięcia i rozważ skrócenie swoich fraz - szalony demon komunikuje się w oświadczeniach, a nie zdaniach.


Konfiguracja w czasie rzeczywistym dla DnD, TTRPG i streamów horroru

Kierowanie poprzez iniekcję przechwytywania dźwięku o niskim opadzie czasowym

Ustawienia demonicznego głosu w czasie rzeczywistym działają poprzez iniekcję przechwytywania dźwięku o niskim opadzie czasowym. Modulator głosu przechwytuje wejście mikrofonu, stosuje sieć DSP wybranego ustawienia i prezentuje przetworzony wyjście Windows jako wirtualny mikrofon. Każda aplikacja, która czyta twój mikrofon - Discord, Foundry VTT, Roll20, OBS, Zoom, każda gra z czatem głosowym - otrzymuje przetworzony sygnał bez żadnej konfiguracji dla aplikacji.

Krytyczna techniczna zaleta iniekcji przechwytywania dźwięku o niskim opadzie czasowym jest to, że działa całkowicie w przestrzeni użytkownika. Nie ma sterownika jądra, co oznacza brak konfliktu kompatybilności z oprogramowaniem antycheat, brak monitu UAC na początek każdej sesji i brak ryzyka niestabilności od sterownika załadowanego na poziomie jądra. VoxBooster używa iniekcji przechwytywania dźwięku o niskim opadzie czasowym wszędzie, czyniąc to kompatybilnym z tytułami antycheat, z którymi sterowniki audio poziomu jądra często zawodzą.

Opóźnienie

Dla wyłącznie ustawień DSP (wszystkie cztery archetypy powyżej) opóźnienie od końca do końca z wejścia mikrofonu do wyjścia aplikacji wynosi poniżej 300 ms - zazwyczaj 20-40 ms na nowoczesnym komputerze Windows 10/11 ze standardowym mikrofonem USB lub 3.5 mm. To jest niewyczuwalne w mowie rozmownej i grze fabularnej.

Skróty klawiszowe do przełączania NPC

Praktycznym powodem zapisu każdego archetypu jako nazwanego profilu z dedykowanym skrótem klawiszowym jest zarządzanie sesją. W sesji TTRPG możesz potrzebować przełączać się między trzema lub czterema NPC w ciągu kilku minut, gdy gracze zwracają się do różnych postaci. Przełącznik skrótu - zarejestrowany jako globalny skrót działający nawet wewnątrz pełnoekranowej gry - kosztuje jeden naciśnięcie klawisza i jest niewidoczny dla graczy.

VoxBooster obsługuje wiele zapisanych ustawień, każde z przypisanym skrótem klawiszowym. Zalecane mapowanie dla typowej sesji DnD: F9 (normalny głos), F10 (Szeptucha), F11 (Arcydemona), F12 (Szalony demon). Zarezerwuj ustawienie Opętany dla sesji horroru, gdzie niesamowity efekt jest podstawowym celem twórczym.


Obniżanie formantów kontra przesunięcie tonacji: narzędzie subtelne

Ze wszystkich warstw DSP opisanych powyżej obniżanie formantów jest najmniej zrozumiane i najpotężniejsze dla przypadków użycia gry fabularnej. Przesunięcie tonacji jest oczywiste dla słuchaczów - słyszą niższą tonację i psychicznie rejestrują “przetworzony głos.” Obniżanie formantów nie jest oczywiste. Brzmi jak inny człowiek: ktoś fizycznie większy, z większą komorą rezonansową, który przypadkowo ma podobną tonację do mówcy. Mózg kategoryzuje to jako inne stwory zamiast modyfikowanego sygnału.

Dla scenariuszy horroru i opętania obniżanie formantów bez przesunięcia tonacji - lub z bardzo minimalnym przesunięciem tonacji - produkuje efekt, który rejestruje się jako genuinnie zły niż teatralnie zmieniany. Archetyp Opętany powyżej opiera się na tym: większość niepokojącej jakości pochodzi z obniżania formantów o -28 procent i powolnej modulacji tonacji, a nie z dramatycznego spadku tonacji.

Dla DM i streamerów horroru, którzy chcą zmaksymalizować zanurzenie, to jest ustawienie do eksperymentowania z pierwszej.


Używanie klonowania głosu AI do niestandardowych postaci demonów

Ustawienia DSP dają spójne i niezawodne efekty, ale wszystkie zaczynają się od twojego własnego głosu. Klonowanie głosu AI zajmuje inne podejście: zamiast transformować twój głos za pomocą przetwarzania sygnału mapuje twój głos na wytrenowany cel na poziomie fonem, zachowując czasowanie mowy i infleksję, podczas gdy konwertując pełną charakterystykę timbrów.

Dla archetypu demona oznacza to, że możesz trenować niestandardowy model głosu AI na wstępnie przetworzonym dźwięku demona - lub na zarejestrowanej postaci - i następnie mówić naturalnie, podczas gdy konwersja produkuje wytrenowany głos w czasie rzeczywistym. Rezultat jest bardziej organiczny niż przetworzony DSP, zachowuje niuans twojej wydajności i produkuje spójną tożsamość postaci przez długie sesje.

Klonowanie głosu AI VoxBooster działa lokalnie z opóźnieniem poniżej 300 ms na GPU Windows średniego zakresu, co oznacza, że pełny pipeline - wejście mikrofonowe na żywo, konwersja AI, wyjście urządzenia wirtualnego - jest dostępne w sesjach TTRPG w czasie rzeczywistym bez przetwarzania końcowego.


Aplikacje streamowania horroru

Cztery archetypy mapują bezpośrednio na scenariusze streamowania horroru poza TTRPG:

Szeptucha: narracja poza kamerą, przekaz w stylu znalezionego materiału, wszechobecne zagrożenie, które komentuje bez pojawiania się.

Arcydemona: ujawnienia złoczyńcy, monologi antagonisty, każda scena, gdzie publiczność musi czuć zagrożenie jako autorytet zamiast obecności.

Opętany: momenty postaci gracza, dialogi jump-scare, sceny, w których horror pochodzi z czegoś znanego zepsucia.

Szalony demon: klimaksowe konfrontacje, sekwencje pościgu z komunikacją głosową, każdy moment, w którym czyta agresja musi uderzyć publiczność w przerażający sposób.

Zasada uniwersalna w całych czterech: efekt głosu powinien wzmacniać funkcję narracyjną sceny, a nie tylko wykazać, że możesz sprawić, aby twój głos brzmiał przerażająco. Szeptucha w scenie bitwy klimaksowej traci wpływ; Szalony demon w scenie intrygi niszczy napięcie. Wybierz archetyp, który służy obecnemu rejestrowi historii.


Wybór konfiguracji demonicznego głosu

Praktyczna konfiguracja modulatora demonicznego głosu dla TTRPG i streamów horroru potrzebuje czterech rzeczy: wielokrotnych zapisanych ustawień, przełącznika skrótu klawiszowego, rozwiązania kierowania, które działa bez konfiguracji specyficznej dla aplikacji i wystarczająco niskiego opóźnienia, aby używać w rozmowie na żywo.

VoxBooster obejmuje wszystkie cztery w tej samej aplikacji: iniekcja przechwytywania dźwięku o niskim opadzie czasowym dla kierowania uniwersalnego, wielokrotne nazwane ustawienia każde z przypisanym skrótem klawiszowym, przetwarzanie DSP z opóźnieniem poniżej 300 ms na Windows 10/11 i brak wymagania sterownika jądra. Załaduj cztery archetypy powyżej jako punkty wyjścia, dostosuj do swoich konkretnych koncepcji postaci i zapisz. Następna sesja, są one jednym naciśnięciem klawisza od razu.

Demon czekał. Daj mu głos godny strachu.

Wypróbuj VoxBooster — 3 dni za darmo.

Klonowanie głosu w czasie rzeczywistym, soundboard i efekty — wszędzie, gdzie rozmawiasz.

  • Bez karty
  • ~30ms opóźnienia
  • Discord · Teams · OBS
Wypróbuj 3 dni za darmo