محول الصوت العميق ل Discord: كيف يعمل + 4 إعدادات مسبقة
الحصول على صوت عميق مقنع على Discord ليس بسهولة سحب منزلق الملعب لأسفل. خفض التردد الأساسي فقط وابدأ صوتك في بدو وكأنه تسجيل بطيء - فارغ وصناعي وخاطئ. السبب هو عدم تطابق بين خاصيتين صوتيتين منفصلتين يحتفظ بها صوت بشري عميق. يشرح هذا الدليل تلك العلاقة ويعطيك الأرقام للحصول عليها بشكل صحيح وينتهي برسم الخرائط بأربع إعدادات مسبقة قابلة للنسخ واللصق يمكنك تحميلها مباشرة.
الملخص
- يتطلب تحويل الصوت العميق خفض F0 و تحويل الفورمنت معا - F0 وحده ينتج اعمه “السنجاب العكسي”.
- منطقة آمنة للصوت العميق الطبيعي هي 2-5 أنصاف نغمة من F0 بالإضافة إلى 10-20٪ خفض الفورمنت.
- أربع إعدادات مسبقة مغطاة: Movie Villain و Radio DJ و Narrator و Demon - كل منها مع قيم F0 والفورمنت والتأثير المحددة.
- يحافظ توجيه الصوت منخفض الكمون على زمن الانتظار من طرف إلى طرف أقل من 300 ميلي ثانية على أي جهاز حديث Windows 10/11.
- لا يتطلب برنامج تشغيل kernel؛ يسجل VoxBooster جهاز ميكروفون افتراضي يرى Discord كإدخال قياسي.
لماذا الملعب وحده ليس كافيا
الصوت البشري له طبقتان مستقلتان من المعلومات الصوتية.
التردد الأساسي (F0) هو المعدل الذي يهز فيه حبلك الصوتي - الملعب الخام لصوتك. يتحدث ذكر بالغ متوسط حول 85-180 هرتز؛ يتحدث الإناث البالغة حول 165-255 هرتز. F0 هو ما تدركه بأنه ملعب مرتفع أو منخفض.
الفورمنتس هي ذرات رنينية تتشكل من تجاويف جهاز النطق الخاص بك - فم وبلعوم والجيوب الأنفية. حمل أول اثنين من الفورمنت (F1 و F2) معظم هوية حرف الكلام. بشكل حاسم، يحملان أيضا إدراك الحجم. الجسم الكبير له تجاويف رنينية أكبر، والتي تدفع قمم الفورمنت إلى الأسفل. هذا الهدير المنخفض المرتبط برسومات الشرير والراديو يأتي من الفورمنت المنخفض مثل الملعب المنخفض.
عندما ينخفض محول الصوت فقط F0 بينما يترك الفورمنت في المكان، يكتشف الدماغ عدم التطابق على الفور. تم ضغط السلسلة التوافقية لكن توقيع الرنين لا يزال ينتمي إلى جهاز نطق أصغر. تبدو النتيجة وكأنها تسجيل مشغل في 80٪ سرعة - طبيعي قليلا، قليلا الفكاهية. يسمي المهندسون هذا مشكلة السنجاب العكسية (أو تأثير الجنموم العكسي)، وهي أكثر أنماط الفشل الشائعة في محولات الصوت العميق السذاجة.
الحل هو تحويل الفورمنت إلى أسفل بالتناسب مع التغيير F0، الحفاظ على النسبة الصوتية التي تميز صوتا عميقا بطبيعته.
فيزياء صوت عميق
التردد الأساسي
يتم تعيين F0 بواسطة اهتزاز الحبل الصوتي. لخفض F0 الخوارزمي، يعيد مصراع الملعب عينات الصوت: يمتد الموجة الموجة ثم يعيد العينات إلى معدل العينات الأصلي. الحديثة مرحلة-الفوكيدر و وسيلة الاختراق التشابه التشابه (WSOLA) تفعل هذا بنظافة في 2-5 نصف نغمة. وراء 6 أنصاف نغمة، تزداد الأعمال الفنية المرحلة والخشونة.
الفورمنتس
الفورمنتس تتشكل من خلال الهندسة الصوتية من الجهاز التجاري الصوتي. يعمل تحويل الفورمنت في البرنامج من خلال تقدير الغلاف الطيفي (عادة عبر LPC أو تنعيم قيفرية)، فصله عن بنية التوافقيات الدقيقة، وتحويل الغلاف، وإعادة دمجها. يتوافق تحويل طيف 10-20٪ إلى أسفل تقريبا مع ما سيكون جهاز النطق 10-20٪ أطول - صوتيات شخص أكثر أهمية بكثير.
الحفاظ على الرنين
يقدم تحويل الفورمنت بقوة على حد سواء تشوه حرف: تغيير بعض الأحرف الهوية لأن F1 و F2 قد تحركت خارج نطاقها الصوتي. الهدف هو خفض الغلاف بشكل موحد بما يكفي لإضافة حجم متصور دون انهيار الذكاء. المنطقة الحلوة لمعظم الكلام هي نسبة فورمنت قريبة من ما سيكون جهاز النطق ~15 سم أطول سيكون.
F0 ونطاقات مرجعية الفورمنت
| الهدف | تغيير F0 | تحويل الفورمنت | الشخصية |
|---|---|---|---|
| أعمق قليلا، طبيعي | -1 إلى -2 st | -5 إلى -8٪ | مذيع تلفاز، راوية هادئة |
| واضح بعمق، لا تزال حقيقية | -3 إلى -5 st | -12 إلى -18٪ | شرير الفيلم، راديو DJ |
| مسرحي، كبير | -5 إلى -7 st | -20 إلى -25٪ | راوي فيلم ملحمي |
| أسلوب / تأثير | -8 إلى -12 st | -25 إلى -35٪ | شيطان، شخصية رعب |
st = أنصاف نغمة. القيم السلبية تعني التحويل إلى أسفل.
صوت منخفض الكمون وزمن الانتظار
أي تأثير صوتي في الوقت الفعلي يعمل على Windows يحتاج إلى مسار صوتي مع زمن انتظار متوقع منخفض. الصوت المنخفض الكمون الالتقاط بوضع حصري يتجاوز خلاط صوت Windows، مما يمنح الوصول المباشر للأجهزة. أحجام المخزن المؤقت 5-10 ميلي ثانية قابلة للتحقيق في الوضع الحصري، مقابل 30-100 ميلي ثانية في الوضع المشترك من خلال الخلاط.
بالنسبة لمحول الصوت العميق على Discord، خط الأنابيب هو:
الميكروفون → التقاط صوت منخفض الكمون → سلسلة DSP (تحويل F0 + تحويل الفورمنت) → جهاز ميك افتراضي → إدخال Discord
يضاف زمن الانتظار الكلي من سلسلة DSP نفسها أقل من 20 ميلي ثانية. جهاز الميكروفون الافتراضي يضيف حملا لا يذكر. من طرف إلى طرف، خط أنابيب منخفض الكمون المتنفذ بشكل جيد يحافظ على تأخير الفم إلى إخراج Discord أقل من 300 ميلي ثانية، وهو غير محسوس في المحادثة.
يستخدم VoxBooster صوتا منخفض الكمون للالتقاط والتشغيل، مما يحافظ على سلسلة التأثيرات حتى على الأجهزة الأساسية.
إعداد صوت عميق على Discord: خطوة بخطوة
- تثبيت VoxBooster على Windows 10 أو 11. لا يلزم برنامج تشغيل kernel؛ يسجل المثبت جهاز ميكروفون افتراضي من خلال واجهة برمجة تطبيقات صوت Windows القياسية.
- فتح VoxBooster والانتقال إلى لوحة Effects.
- إضافة تأثير Pitch Shift وتعيين خفض F0 في أنصاف نغمة (انظر جدول الإعداد المسبق أدناه).
- إضافة تأثير Formant Shift مباشرة بعد تحويل الملعب في السلسلة. عيّن نسبة الفورمنت كنسبة مئوية إلى أسفل.
- إضافة أي تأثيرات ثانوية للإعداد المسبق (انعكاس وضغط وEQ - التفاصيل لكل إعداد مسبق أدناه).
- فتح Discord → User Settings → Voice & Video → Input Device. حدد VoxBooster Virtual Microphone من القائمة المنسدلة.
- اختبار مع زر اختبار Mic في Discord. اضبط منزلقات F0 والفورمنت حتى يبدو الصوت صحيحا.
- حفظ كإعداد مسبق مسمى في VoxBooster حتى تتمكن من التبديل بين الأحرف بنقرة واحدة.
يعمل كبح الضوضاء الخاص بـ Discord (Krisp-based) بعد إدخال الميكروفون الخاص بك. عموما توافق مع تأثير صوت عميق، على الرغم من أن الإعدادات القصوى قد تخفف قليلا أقل التوافقيات. إذا بدا الصوت المعالج رقيقا في الاستدعاءات، فعطّل كبح الضوضاء في Discord تحت Voice & Video → Advanced واستخدم بدلا من ذلك بوابة الضوضاء المدمجة في VoxBooster.
أربع إعدادات الصوت العميق
إعداد 1: شرير الفيلم
الموصوفة الباريتون الكلاسيكية - السيطرة، تهديد، واضح. فكر هانز لاندا، أنطون تشيغور، أو أي شرير مارفل الذي يشرح خطتهم في الطول.
| معامل | قيمة |
|---|---|
| تحويل F0 | -4 أنصاف نغمة |
| تحويل الفورمنت | -15٪ |
| الانعكاس (حجم الغرفة) | 18٪ |
| الانعكاس (رطب / جاف) | 12٪ |
| EQ ذو الرف المنخفض (+3 dB @ 120 Hz) | إيقاف |
| EQ عالية الرف (-2 dB @ 8 kHz) | إيقاف |
| الضغط (نسبة 3:1، حد تنبيه -18 dB) | إيقاف |
يضيف الانعكاس الخفيف المساحة دون أن يجعل الصوت بعيدا. يعزز رفع الرف المنخفض رنين الصدر على الأجهزة التي تغلق أقل من 150 هرتز. يحافظ الضغط على الإسقاط المسيطر عليه - الكلام السريع يبقى ذكيا حتى في F0 منخفض.
الإعداد 2: راديو DJ
دافئة، سلطة، قليلا دافئة مصقولة. طاقة صباح FM الكلاسيكية: واثق، مستدير، لا صفير خشونة.
| معامل | قيمة |
|---|---|
| تحويل F0 | -3 أنصاف نغمة |
| تحويل الفورمنت | -12٪ |
| الانعكاس | إيقاف |
| تعزيز الحضور (+2 dB @ 3-5 kHz) | إيقاف |
| دفء منخفض الوسط (+3 dB @ 200-250 Hz) | إيقاف |
| De-esser (حد تنبيه -20 dB، تردد 6 kHz) | إيقاف |
| الضغط (نسبة 4:1، حد تنبيه -22 dB، هجوم بطيء) | إيقاف |
توصيل راديو DJ هو في الغالب قصة EQ. يقوم تحويل الفورمنت بالعمل الثقيل من أجل العمق، والضغط يلتصق الديناميات بحيث لا يصرخ الصوت أو ينخفض أبدا. De-essing مهم بشكل خاص هنا - خفض F0 يمكن أن يؤكد بعض الأعمال الفنية التوافقية العليا في الصفير على بعض الميكروفونات.
الإعداد 3: راوي ملحمي
الصوت الذي يقرأ مقاطع الأفلام وفقدان الكتب الصوتية. أبطأ، أكثر تعمدا، مع وزن شخص رأى الأشياء.
| معامل | قيمة |
|---|---|
| تحويل F0 | -5 أنصاف نغمة |
| تحويل الفورمنت | -20٪ |
| الانعكاس (قاعة كبيرة، 35٪) | إيقاف |
| EQ ذو الرف المنخفض (+4 dB @ 100 Hz) | إيقاف |
| تغطس الحضور (-3 dB @ 1-2 kHz) | إيقاف |
| جوقة دقيقة (معدل 0.3 Hz، عمق 8٪) | إيقاف |
| الضغط (نسبة 2.5:1، ركبة ناعمة) | إيقاف |
يدفع هذا الإعداد المسبق تحويل الفورمنت أبعد من الآخرين. في -20٪ ستلاحظ تحول شخصية حرف قليلا - وهذا مقصود. التلوين الطفيف حرف يضيف إلى الشعور بالرنين أكبر من الإنسان. الجوقة البطيئة جدا بسرعة بطيئة جدا تضيف سمك دون تعديل واضح.
الإعداد 4: شيطان
مسرح كامل - عمق غير بشري، خشونة طفيفة، حضور دون صراخ. يعمل لدور الرعب، فلاتر Halloween، وأي شخصية بالتأكيد ليست من حول هنا.
| معامل | قيمة |
|---|---|
| تحويل F0 | -10 أنصاف نغمة |
| تحويل الفورمنت | -30٪ |
| التشوه (قص ناعم، محرك 15٪) | إيقاف |
| الانعكاس (كهف، 55٪ رطب) | إيقاف |
| EQ ذو الرف المنخفض (+6 dB @ 80 Hz) | إيقاف |
| Bitcrusher (عمق البت 14، دقيق) | إيقاف |
| تعديل الملعب (LFO ±0.3 st، معدل 0.8 Hz) | إيقاف |
في -10 أنصاف نغمة كنت عميق جدا في مسرح. يضيف قص ناعم التشوه التوافقيات الفردية التي تخلق جودة خشنة تنبح. الكهف الانعكاس يعزز الشعور بصوت يرن في مساحة حجر كبيرة. تعديل الملعب الدقيق LFO يعطي الصوت عدم استقرار عضوي دقيق - الشياطين من المفترض أن لا تتنفس مثل البشر.
الذكاء سيقلل مقارنة الإعدادات المسبقة الأخرى. بالنسبة لدور الشيطان فهذا عادة ما يكون المقايضة الصحيحة؛ إذا كنت بحاجة إلى الأفصل أنظف، تقليل محرك التشوه ومزيج الانعكاس الرطب.
جدول المقارنة: جميع الإعدادات المسبقة الأربعة
| الإعداد المسبق | F0 إسقاط | إسقاط الفورمنت | الطبيعية | أفضل بالنسبة |
|---|---|---|---|---|
| شرير الفيلم | -4 st | -15٪ | عالية | شخصية RPG منطقية، لعب دور الشرير، المناقشات |
| راديو DJ | -3 st | -12٪ | عالية جدا | الدردشة اليومية والبودكاست وزر الإعلان |
| راوي ملحمي | -5 st | -20٪ | متوسط | قراءة الكتاب الصوتي، روج للفيلم |
| شيطان | -10 st | -30٪ | منخفض (مقصود) | تيارات الرعب، أحداث Halloween، SFX |
استكشاف أخطاء صوت عميق على Discord
الصوت يبدو آليا أو متذبذبا. مرحلة الفن من shifter الملعب. حاول تقليل تحويل F0 من قبل 1 نصف نغمة وتعويض مع تحويل الفورمنت أكثر قليلا. بعض الخوارزميات تتعامل مع التحولات الأكبر بنظافة أكثر من غيرها.
الصوت هو هادئ جدا في الإخراج. معالجة الصوت العميق تحول الطاقة إلى نطاقات ترددية حيث قد AGC Discord (التحكم التلقائي في الكسب) لا تعويض. أضف مكياج كسب +3-5 dB بعد مرحلة الضغط.
Discord يقطع صوتي بشكل متقطع. قد تكون حد AGC Discord (الكشف عن نشاط الصوت) عالية جدا لأساسية أقل طاقة. في Discord Voice & Video → Input Sensitivity، انتقل من Automatic إلى حد ثابت وانخفاض من قبل 10-15 dB.
التأثير يبدو مختلفا في سماعات الرأس مقابل السماعات. تكشف سماعات الرأس عن المزيد من الأعمال الفنية المعالجة. اضبط الإعداد المسبق أثناء ارتداء سماعات الرأس - إذا بدا مقنعا هناك، سيبدو مقنعا للجميع في المكالمة.
تحويل الفورمنت يشوه الأحرف كثيرا. العودة من نسبة الفورمنت بمقدار 3-5٪ الزيادات حتى استعادة الأحرف الذكاء. قد تعوض قليلا عن طريق إضافة تعزيز رف منخفض إضافي.
صوت عميق بعد الإعدادات المسبقة: نسخ الذكاء الاصطناعي
الإعدادات المسبقة أعلاه تستخدم DSP المعياري - لا يوجد تعلم، لا توجد مرجعية الخلفية، استجابة فورية. يتضمن VoxBooster أيضا نسخ الصوت الذكي لحالة استخدام مختلفة: بدلا من تحويل صوتك مع معاملات ثابتة، تقدم عينة صوت مرجعية والذكاء الاصطناعي يخطط صوتك على ذلك، الحفاظ على هيكل الفورمنت الطبيعي والملف الشخصي الملعب.
بالنسبة لصوت عميق على وجه التحديد، فإن نسخ الذكاء الاصطناعي يعني أنه يمكنك استخدام تسجيل مرجعي لصوت عميق حقا - بدلا من حساب نسب الفورمنت يدويا - والحصول على النشد الطبيعي ورنين المصدر. المقايضة هي ميزانية معالجة قليلا أعلى مقارنة مع DSP نقي، على الرغم من أن زمن الانتظار يبقى تحت 300 ميلي ثانية على الأجهزة المدعومة.
ملاحظة صحة الصوت
تشغيل تأثير صوت عميق لا يضر بصوتك الحقيقي. ومع ذلك، محاولة أداء صوت عميق مجبر جسديا - إجهاد الحنجرة الخاصة بك - يمكن أن يسبب تعب الحبل والضرر مع مرور الوقت. إذا كنت بحاجة إلى صوت عميق لجلسات البث الموسعة، دع البرنامج يفعل العمل بالكامل والتحدث في التسجيل الطبيعي الخاص بك. سيشكرك الحبل الصوتي الخاص بك.
الموارد الداخلية
- Voice Changer for Discord: Complete Setup Guide
- Real-Time Voice Cloning: How It Works
- Best Free Voice Changers for Streamers
- Voice Cloning vs Voice Changer
المراجع الخارجية
- Fundamental frequency — Wikipedia
- Formant — Wikipedia
- Discord Voice & Video settings — Discord Support
الأسئلة الشائعة
ما هو محول الصوت العميق ل Discord؟ محول الصوت العميق ل Discord هو برنامج يخفض التردد الأساسي (F0) وينقل الفورمنت في الوقت الفعلي، وتوجيه الصوت المعالج من خلال ميكروفون افتراضي يقرأ Discord كجهاز إدخال عادي. النتيجة هي صوت أعمق مقنع دون تغييرات أجهزة أو كابلات إضافية.
لماذا يجعل خفض الملعب وحده صوتي يبدو وكأنه سنجاب معكوس؟ إن خفض F0 فقط يضغط السلسلة التوافقية لكن يترك الفورمنت - الذرات الرنينية في جهاز النطق الخاص بك - في موضعها الأصلي. يجعل هذا عدم التطابق الصوت رقيقًا، مثل تسجيل مبطأ بدلاً من صدر كبير بطبيعته. يحافظ تحويل الفورمنت بالتوازي مع F0 على نسب الرنين التي تربط الأذن بصوت عميق كبير.
كم عدد أنصاف النغمة التي يمكنني خفض صوتي قبل أن يتوقف عن بدو طبيعي؟ للحصول على صوت ذكر عميق طبيعي، يغطي 2-5 أنصاف نغمة من F0 مع 10-20٪ خفض الفورمنت معظم حالات الاستخدام. ما بعد 6-7 أنصاف نغمة يبدأ الصوت في بدو معالج. للتأثيرات المسرحية مثل إعداد الشيطان يمكنك الدفع إلى الأمام - 8-12 نصف نغمة - لأن الهدف ليس واقعياً.
هل يضيف محول الصوت العميق تأخيرًا ملحوظًا في استدعاءات صوت Discord؟ يضيف تحويل الملعب والفورمنت القائم على DSP حملا معالجة قليلا جدا - أقل بكثير من 20 ميلي ثانية لمعظم التطبيقات. يهيمن على التأخير المتصور في مكالمة صوتية وقت الرحلة ذهابا وإيابا على الشبكة، وليس سلسلة التأثيرات المحلية. خط أنابيب فرعي 300 ميلي ثانية من الميكروفون إلى إخراج Discord يمكن تحقيقه على أي وحدة معالجة مركزية حديثة.
هل سيعمل الإعداد المسبق للصوت العميق إذا كنت أستخدم ميكروفون USB رخيص الثمن؟ نعم. تعمل خوارزميات F0 والفورمنت على الإشارة الصوتية بغض النظر عن جودة التسجيل، على الرغم من أن ميكروفونًا أنظف بسجل منخفض التردد مسطح سيعطي نتيجة أكثر إقناعًا. غالبًا ما تقوم أجهزة USB الرخيصة بإغلاق أقل من 100 هرتز، مما يحد قليلاً من مدى الإخراج المعالج بعمق، لكن التأثير لا يزال واضحًا تماما.
هل يمكنني استخدام تأثيرات صوت عميق متعددة في نفس الوقت على Discord؟ نعم. يمكنك تكديس التأثيرات في سلسلة - على سبيل المثال، خفض F0 بالإضافة إلى تحويل الفورمنت بالإضافة إلى ذيل انعكاس دقيق لإعداد الشيطان أو ضغط خفيف لإعداد راديو DJ. تعمل السلسلة قبل وصول الصوت إلى كبح الضوضاء الخاص بـ Discord، لذا لا تتداخل الطبقات الاثنين.
هل يجب علي تثبيت كابل صوتي افتراضي بشكل منفصل لاستخدام محول الصوت العميق على Discord؟ باستخدام VoxBooster لا توجد. ينشئ VoxBooster جهاز ميكروفون افتراضي تلقائيًا ويسجله باستخدام صوت Windows. ما عليك سوى فتح إعدادات Discord Voice & Video واختيار VoxBooster كميكروفون إدخال. لا توجد حاجة لإعداد كابل افتراضي يدوي، لا تثبيت برنامج تشغيل بعيدا عن مثبت VoxBooster نفسه.
يعمل VoxBooster على Windows 10 و 11 بدون برنامج تشغيل kernel. الخطط تبدأ من $6.99/شهر. حاول مجانا لمدة 3 أيام - لا توجد بطاقة ائتمان مطلوبة.