مولد الصوت الذكي لأنظمة الإعلانات على الحافلات

صوت الإعلان على الحافلات بالذكاء الاصطناعي هو النظام الذي يعمل بهدوء في كل مرة تخبرك فيها حافلة المدينة أن المحطة التالية قادمة - وأصبح أكثر تطوراً بكثير مما يدركه معظم الركاب. ما يبدو وكأنه رسالة مسجلة بسيطة هو بشكل متزايد حدث توليف عصبي حي: إحداثيات GPS تشغل سلسلة نصية، محرك تحويل النص إلى كلام على متن الطائرة يحولها إلى كلام في أقل من 300 ميلي ثانية، والصوت يصل إلى مكبرات الصالة قبل أن تسافر الحافلة 30 متراً آخر. يغطي هذا الدليل كيفية عمل خط أنابيب ذلك من البداية إلى النهاية، والمزودون والبرنامج الذي يشغله في الأنظمة الحقيقية، كيف يتعامل MTA في نيويورك وحافلات لندن وحافلات Tokyo Toei معه بشكل مختلف، ما الذي يتطلبه الامتثال لقانون ADA فعلاً، وكيف يمكن للمنشئين الذين يبنون محاكيات النقل والألعاب والأفلام الوصول إلى نفس تكنولوجيا الصوت الذكي.

ملخص سريع

يتم إنشاء الإعلانات على الحافلات بواسطة تحويل نص إلى كلام عصبي مُشغَّل بواسطة GPS، وليس بنوك المقاطع - مما يتيح استدعاءات محطات دقيقة وديناميكية لأي تعديل مسار في الوقت الفعلي.
Clever Devices و Luminator هما أكبر مزودي الأجهزة في أمريكا الشمالية؛ كلاهما يدعم توليف الصوت العصبي في أجيال الأنصات الحالية.
MTA في نيويورك وحافلات لندن وحافلات Tokyo Toei تستخدم كل منها شخصيات صوتية مميزة واستراتيجيات ثنائية اللغة معايرة لديموغرافيا الركاب الخاصة بهم.
يتطلب قانون ADA (49 CFR الجزء 37) إعلانات محطات آلية في نقاط التحويل والتقاطعات الرئيسية؛ يستوفي توليف الذكاء الاصطناعي هذا وينتج سجلات امتثال قابلة للتدقيق.
يمكن للتكنولوجيا نفسها إنشاء صوت PA واقعي للحافلات للألعاب والأفلام ومحاكاة النقل باستخدام أدوات صوت الذكاء الاصطناعي لسطح المكتب.

كيف تعمل أنظمة الإعلانات على الحافلات المُشغَّلة بواسطة GPS

نظام معلومات الركاب الآلي (APIS) على حافلة نقل حديثة هو كمبيوتر صغير مدمج يدمج تحديد موضع GPS وبيانات جدول المسار وآلية تحويل النص إلى كلام ومراقبة مكبر PA وإدارة عرض الركاب في وحدة واحدة معززة. يطلق خط أنابيب الإعلان في تسلسل مؤقتت بإحكام:

تحديد موضع GPS - يتتبع كمبيوتر المركبة الموضع في فترات 1 ثانية. يتم تخزين هندسة المسار على متن الطائرة كسلسلة من المقاطع الجغرافية، كل منها مميز بالمحطات المرتبطة بها ونقاط محفزات الإعلان.
محفز الحد الجغرافي - عندما تدخل المركبة منطقة الاقتراب من محطة (عادة 200-400 متر، حسب ملف السرعة للمسار)، يطلق APIS حدث إعلان.
بناء النص - يجمع النظام نص الإعلان من قالب: اسم المحطة والاتصالات وأي معلومات إمكانية الوصول. بالنسبة للمسارات الديناميكية أو سيناريوهات الالتفافية، يتم تعديل سلسلة النص على الطاير من تحديث الإرسال المرسل عبر LTE.
توليف تحويل النص إلى كلام - يحول محرك تحويل النص إلى كلام (على متن الطائرة أو عبر اتصال حافة منخفض الكمون) النص إلى شكل موجة صوتية في أقل من 300 ميلي ثانية. في وحدات Clever Devices و Luminator من الجيل الحالي، يعمل التوليف بالكامل على متن الطائرة لتجنب اعتماد كمون LTE.
توجيه الصوت - يوجه وحدة تحكم PA الصوت إلى مكبرات الصالة، مع مراقبة المناطق (الجزء الأمامي مقابل الجزء الخلفي من الحافلة) وتشغيل متزامن لتحديثات شاشة معلومات الركاب.
تسجيل الامتثال - يسجل APIS كل حدث إعلان - الطابع الزمني وإحداثيات GPS ومعرّف المحطة وسلسلة النص وتجزئة ملف الصوت - لأغراض الامتثال لقانون ADA وعمليات تدقيق ضمان الجودة.

النتيجة هي نظام يمكنه إنشاء إعلانات محطة دقيقة حتى للمسارات المعدلة في نفس الصباح، والإعلان عن الالتفافات واضطرابات الخدمة بكلام طبيعي، وفعل كل هذا بدون أي صوت مسجل مسبقاً.

Clever Devices و Luminator: الأجهزة خلف صوت الحافلات الذكي

Clever Devices

Clever Devices هي أكبر مزود نظام معلومات ركاب آلي في أمريكا الشمالية، مع نشر عبر MTA في نيويورك و Chicago CTA وعشرات وكالات النقل الأصغر. تجمع منصتهم الرئيسية IVIU (وحدة واجهة المركبة الذكية) بين GPS والخلايا والكمبيوتر على متن الطائرة ومكبر PA وبرنامج إدارة الإعلانات في وحدة واحدة.

تدعم منصة Clever Devices محركات تحويل نص إلى كلام متعددة، بما في ذلك توليف الصوت الملكي وتكامل تحويل نص إلى كلام العصبي من جهات خارجية. تشمل أجيال المنصات الحديثة دعم تحويل نص إلى كلام العصبي المتسلسل وفي الأوضاع المتصلة بالسحابة، توليف الكلام العصبي من طرف إلى طرف عبر خادم حافة على مستوى المستودع. يدير النظام جدول الإعلان الكامل - استدعاءات الاقتراب واستدعاءات الإيقاف واستدعاءات الاتصال والرسائل الأمنية - مع إمكانية التكوين لكل مسار لنوافذ التوقيت واختيار اللغة.

من الميزات الملحوظة الوضع ثنائي اللغة في Clever Devices: يمكن تكوين المسارات لتسليم الإعلانات بلغتين بالتتابع، مع محرك تحويل النص إلى كلام الأساسي ومحرك اللغة الثانوية استقبال نفس النص المنظم وتوليد تيارات صوتية مستقلة تعمل بالتتابع.

مجموعة تقنية Luminator

Luminator هي اللاعب الرئيسي الآخر، مع اختراق قوي بشكل خاص في الأنظمة الأوروبية والكندية والنشر في أمريكا الشمالية. وحدة ATPIS (نظام معلومات ركاب النقل الآلي) لديها قدرات مماثلة لـ Clever Devices IVIU، لكن مع تكامل أصلي أقوى لشبكات التوزيع الصوتي القائمة على IP الأوروبية.

تدعم البنية التحتية لتوليف الصوت في Luminator نموذج تصنيف ممثل الصوت: يمكن لوكالات النقل أن تطلب نموذج صوت بديل مدرب على ممثل صوتي احترافي محدد الاختيار، مما يعطي النظام هوية صوتية “منزلية” مميزة. صوت Luminator الأنثوي البريطاني المميز في جميع مشغلي TfL هو مثال معروف على هذا النهج.

الميزة	Clever Devices IVIU	Luminator ATPIS
السوق الأساسي	أمريكا الشمالية	أمريكا الشمالية + أوروبا
معمارية تحويل النص إلى كلام	هجين على متن الطائرة + حافة السحابة	عصبي على متن الطائرة
دعم ثنائي اللغة	ثنائي المحرك المتسلسل	متسلسل وقائم على المناطق
ملكية نموذج الصوت	وكالة مرخصة أو ملكية	خيار ممثل صوت مخصص
تسجيل ADA	سجل تدقيق كامل للإعلانات	سجل تدقيق كامل للإعلانات
دقة محفز GPS	الحد الجغرافي (200-400 متر الاقتراب)	حد جغرافي + هجين قائم على الجدول
تكامل الشاشة	نعم (شاشات معلومات الركاب)	نعم (شاشات الوجهات)

حافلات MTA في نيويورك: الإنجليزية والإسبانية وتعقيد أسطول 5800 مركبة

أسطول حافلات MTA المحلية هو أحد أكبر الأساطيل في العالم - أكثر من 5800 مركبة تعمل عبر حوالي 300 مسار في الأحياء الخمسة. تشغيل الإعلانات الآلية على متن الطائرة عبر أسطول بهذا الحجم ينطوي على تعقيد لوجستي يقلل النقاش حول تكنولوجيا النقل من قيمته بشكل كبير.

يعمل نظام الإعلان على حافلات MTA على أجهزة Clever Devices. الصوت باللغة الإنجليزية هو صوت مصنوع بناءً على تسجيل صوتي احترافي مفوض، مصمم للوضوح في كابينات الحافلات الحضرية الصاخبة. يعمل الصوت بوتيرة أبطأ قليلاً من الكلام المحادثي - حوالي 145-155 كلمة في الدقيقة - وهو معيار لـ PA للنقل لإعطاء الركاب وقتاً لتحليل أسماء المحطات فوق الضوضاء المحيطة.

بالنسبة للخدمة ثنائية اللغة، تسلم مسارات جذع مختارة (خاصة في مانهاتن وكوينز وبرونكس حيث تزداد نسبة الركاب ذوي الناطقين الإسبانيين) أزواج إعلانات متسلسلة باللغة الإنجليزية والإسبانية. يستخدم محرك تحويل النص إلى كلام الإسباني لهجة أمريكية لاتينية محايدة بدلاً من لهجة بورتوريكية أو دومينيكية، مما يخدم أوسع ديموغرافية على الرغم من أن الركاب الناطقين بالإسبانية في حافلات نيويورك من أصل كاريبي بشكل أساسي - حل عملي بسبب قيود تحويل النص إلى كلام المتطابق مع لهجة على نطاق الأسطول.

يستخدم MTA أيضاً الإعلانات المُشغَّلة بواسطة GPS لاتصالات المترو فوق سطح الأرض: عندما تقترب الحافلة من محطة مجاورة لمحطة مترو، يتضمن الإعلان خطوط القطار الموصولة. يتم إنشاء هذا ديناميكياً - يتم الاحتفاظ ببيانات الاتصال في قاعدة بيانات المسار، وليس في الشفرة الثابتة في بنوك المقاطع - لذلك يتم تحديثه عند حدوث تغييرات الخدمة.

مقياس	التفاصيل
حجم الأسطول	حوالي 5800 حافلة محلية
مزود APIS	Clever Devices
اللغة الأساسية	الإنجليزية (مصنعة)
اللغة الثانوية	الإسبانية (مسارات جذع مختارة)
محفز الإعلان	حد جغرافي GPS (200-300 متر)
استدعاءات الاتصال	ديناميكية (بيانات خطوط المترو)
أساس الامتثال لقانون ADA	49 CFR الجزء 37

حافلات لندن: صوت متسق عبر شبكة مرخصة

تقدم حافلات لندن نموذج تشغيل مختلف عن MTA في نيويورك. لا تشغل Transport for London (TfL) معظم خدمات الحافلات مباشرة - بل ترخص المسارات لمشغلين خاصين بما في ذلك Arriva وGo-Ahead وMetroline وغيرهم. هذا يخلق تحدياً مثيراً للاهتمام لاتساق الصوت: يشغل مشغلون مختلفون مركبات مختلفة من مصنعي مختلفين، لكن الركاب يختبرون علامة تجارية واحدة موحدة لحافلات لندن.

معالجة TfL هذا من خلال مواصفات APIS مفروضة في عقود مشغلي الحافلات. يُطلب من جميع مشغلي حافلات TfL المتعاقد معهم تثبيت أجهزة APIS المعتمدة - بشكل أساسي أنظمة متوافقة مع Luminator - واستخدام نموذج صوت معياري يوفره TfL. الصوت الأنثوي البريطاني المميز الذي يعلن عن المحطات على حافلات لندن ليس فردياً لأي مشغل؛ إنه نموذج صوت مفوض من TfL تم نشره بشكل موحد عبر الشبكة.

يستخدم نظام لندن قاموساً صوتياً لعدة آلاف من أسماء الشوارع والمناطق في لندن - كثير منها ينطق بشكل غير بديهي (Marylebone وHolborn وPlaistow وSouthwark جميعها لها أنماط إجهاد غير واضحة التي يخطئ نظام تحويل النص إلى كلام العام في نطقها). يحافظ فريق الصوت TfL على هذا القاموس مع المدخلات من اللغويين وردود الفعل من المجتمع، ويتم تحديثه مع كل إطلاق برنامج APIS الرئيسي.

تتضمن إعلانات حافلات لندن أيضاً معلومات المحطة النهائية والاتجاه في بداية المسارات، وتنبيه “هذه الحافلة في حالة انحراف” عندما يكون انحراف المسار نشطاً - كلاهما تم إنشاؤه ديناميكياً من بيانات الإرسال.

مقياس	التفاصيل
نوع الشبكة	مرخصة (عقود TfL)
معيار APIS	TfL مفروض متوافق مع Luminator
شخصية الصوت	أنثوي بريطاني (مفوض من TfL)
القاموس الصوتي	عدة آلاف من أسماء الأماكن في لندن
معالجة الانحراف	نص مدفوع بالإرسال الديناميكي
محفز المسار	حد جغرافي GPS

حافلات Tokyo Toei: توليف ثنائي اللغة والأعراف الثقافية للإعلان

تخدم حافلات Toei في طوكيو (التي تشغلها مكتب النقل الحضري في طوكيو) حوالي 590 مسار عبر طوكيو، بتغطية خاصة في الأحياء غير المخدومة بواسطة مترو طوكيو أو شبكة السكك الحديدية JR. يعكس نظام الإعلان على متن الطائرة ثقافة النقل اليابانية، التي لديها عدة أعراف مميزة مختلفة عن الأنظمة الغربية.

إعلانات الحافلات على متن الطائرة اليابانية أطول بكثير من نظيراتها الغربية. يتضمن الإعلان النموذجي لاقتراب محطة Toei Bus: اسم المحطة الحالي وتذكير مهذب للخروج إذا كانت هذه محطة الركاب والاسم التالي للمحطة وأحياناً تذكير الاتصال. يتم تسليم كل عنصر بالوتيرة المتأنية المميزة لاتصال الخطاب العام الياباني - حوالي 130-140 كلمة في الدقيقة بالياباني، وهو ما يبدو مقاساً لكن معياري لسجل الرسمية لـ PA للنقل.

المسار الإنجليزي ثنائي اللغة على حافلات Toei Bus يستخدم سيناريو مبسطاً: فقط اسم المحطة و “محطة التوقف التالية، [اسم]” بنية. أسماء المحطات التي لها romanizations رسمية (من signage مترو طوكيو أو JR) تستخدم تلك؛ المحطات التي لا توجد لديها romanizations رسمية تستخدم transliteration hepburn مع الإجهاد على المقطع الأول، وهو أعراف لأسماء الأماكن اليابانية متوسطة اللغة الإنجليزية.

نموذج الصوت لإعلانات Tokyo Toei Bus اليابانية هو صوت أنثوي برسمية - مختلف عن الصوت الأنثوي الأكثر دفئاً والأكثر محادثية المستخدم في مترو طوكيو. هذا اختيار أسلوبي متعمد: تخدم حافلات Toei العديد من الركاب المسنين والأشخاص ذوي الحركة المحدودة الذين يفضلون سجل PA الرسمي، وقد أظهر البحث أن هذا يحسن الامتثال لسلوك خروج الركاب بين تلك الديموغرافية.

مقياس	التفاصيل
المشغل	مكتب النقل الحضري في طوكيو
عدد المسارات	حوالي 590 مسار
اللغات	اليابانية (الأساسية)، الإنجليزية (مسارات السياح)
معدل اللغة اليابانية	حوالي 130-140 كلمة في الدقيقة (سجل رسمي)
أسماء المحطات الإنجليزية	romanizations رسمية + fallback hepburn
مكونات الإعلان	المحطة الحالية وتنبيه الخروج والمحطة التالية والاتصالات

الامتثال لقانون ADA: ما يتطلبه اللائحة فعلياً

قانون الأمريكيين ذوي الإعاقة، المنفذ للنقل عبر 49 CFR الجزء 37، وضع متطلبات محددة لمعلومات الركاب على متن الطائرة التي دفعت مباشرة اعتماد الأنظمة المؤتمتة للإعلان. يكون فهم ما يتطلبه الامتثال فعلياً - بدلاً من ما تنفذه وكالات النقل أحياناً - مفيد لأي شخص يحدد أو يقيم APIS للحافلة.

49 CFR 37.167(b) - مركبات المسار الثابت تتطلب أن تعلن وكالات النقل عن محطات في:

نقاط التحويل مع المسارات الثابتة الأخرى
التقاطعات الرئيسية ونقاط الوجهة
فترات كافية على طول المسار لتوجيه الركاب ذوي الضعف البصري

بالإضافة إلى ذلك، يتطلب 49 CFR 37.167(c) أن تضمن وكالة النقل أن إعلان المحطة مسموع في جميع أنحاء المركبة.

لا تحدد اللائحة أن الإعلانات يجب أن تكون آلية - يمكن للسائق الإعلان يدوياً. ومع ذلك، الامتثال اليدوي غير متسق وغير عملي للتدقيق. أنظمة الصوت الذكي الآلية تستوفي اللائحة بشكل منهجي وتنتج سجلات الإعلان المُطبوعة بالطابع الزمني GPS التي تسمح لوكالات النقل بإثبات الامتثال أثناء عمليات تدقيق إدارة النقل الفيدرالية.

محطات الطلب هي ميزة امتثال ذات صلة: الركاب الذين لا يستطيعون رؤية معلومات المحطة يمكنهم طلب محطة معينة شفهياً أو عبر زر الطلب. تدعم أنظمة APIS الحديثة هذا بتشغيل إعلان تحويل نص إلى كلام عند الطلب عندما يضغط الركاب على زر طلب توقف، مما يولد إعلانات الاقتراب والإيقاف لوجهتهم المطلوبة.

متطلب ADA	كيفية استيفاء مولد الصوت الذكي للحافلة
الإعلان عن نقاط التحويل	مُشغَّل بواسطة GPS في جميع محطات التحويل المعينة
الإعلان عن التقاطعات الرئيسية	قاعدة بيانات المحطة تتضمن علامات التقاطع
الإعلان في فترات كافية	إعلانات فترة قابلة للتكوين
مسموع في جميع أنحاء المركبة	PA معايرة لنموذج صوتي للمركبة
دعم محطة الطلب	تحويل نص إلى كلام المُشغَّل بواسطة الزر عند الطلب
قابلية تدقيق الامتثال	مسار حدث إعلان مسجل بـ GPS

للسياق حول كيفية تطبيق متطلبات PA المماثلة في بيئات النقل الأخرى، اطلع على دليلنا حول مولدات الصوت الذكي لأنظمة PA لمحطات القطار.

التحدي الصوتي لصوت كابينة الحافلة

كابينة الحافلة معادية صوتياً مقارنة بمعظم البيئات حيث يتم نشر تحويل النص إلى كلام. نظام PA يتعين عليه التنافس مع:

ضوضاء المحرك والطريق على 65-78 ديسيبل عند سرعات حضرية نموذجية
حديث الركاب على 55-65 ديسيبل
ضوضاء نظام HVAC على 55-60 ديسيبل
الحجم الصوتي المتغير - حافلة ممتلئة تمتص صوتاً بشكل أكبر بكثير من حافلة فارغة بسبب أجسام الركاب التي تعمل كمادة تخفيف صوتية

يعالج مهندسو PA للنقل هذا بمزيج من معايرة نموذج الصوت ومعالجة سلسلة DSP التي تختلف عن عمل الاستوديو أو البث. الخطوات الرئيسية:

معادل Bandpass - لا يمكن لمكبرات صالة الحافلة إعادة إنتاج bass أقل من 200 هرتز أو treble أعلى من 5 كيلو هرتز بأصوات مفيدة. نماذج الصوت الذكي لـ PA للحافلة إما تدرب مع هذا في الاعتبار أو معالجة لاحقاً مع مرشح bandpass مركزي في نطاق الوضوح 500-3500 هرتز. هذا هو السبب في أن إعلانات الحافلات تبدو “معدنية” مقارنة بالصوت المدى الكامل: يتم قطع الأطراف المنخفضة والعالية بشكل متعمد.

ضغط ثقيل - مكبر PA في خزانة الحافلة يعمل بالقرب جداً من مستوى الإنتاج الأقصى لديه لمحاولة التغلب على الضوضاء المحيطة. يتم تطبيق ضغط ثقيل (النسب 6: 1 إلى 10: 1 مع أوقات الهجوم السريعة) قبل مكبر الصوت لمنع القطع وضمان الحجم المدرك المتسق عبر الإعلانات.

معدل الكلام - أصوات PA للحافلات تعمل على 140-160 كلمة في الدقيقة، أبطأ من الكلام المحادثي، لإعطاء الركاب وقتاً لتحليل أسماء المحطات فوق الضوضاء. يظهر البحث في الوضوح باستمرار أن تقليل معدل الكلام بنسبة 15٪ ينتج عنه تحسن قابل للقياس في الفهم في البيئات الصاخبة.

Saloon equalization - تتضمن بعض عمليات تثبيت APIS المتقدمة معادلة متكيفة تضبط ملف الاستجابة للتردد بناءً على قياس في الوقت الفعلي لضوضاء الكابينة المحيطة، وتعزز ترددات الكلام التي يتم حجبها بواسطة أرضية الضوضاء الحالية.

مرحلة DSP	إعداد PA للحافلة	الأساس المنطقي
مرشح عالي التمرير	200 هرتز، من الرتبة الثانية	إزالة bass فرعي لا يمكن للمكبرات إعادة إنتاجه
تأكيد Bandpass	رف +4 ديسيبل عند 1-3 كيلو هرتز	تعزيز نطاق وضوح الكلام
مرشح قطع عالي	قطع roll-off 5 كيلو هرتز	إزالة treble فوق إمكانية المكبر
ضغط	نسبة 6: 1، عتبة -15 ديسيبل، هجوم 5 ميلي ثانية	منع قطع مكبر PA
تحديد	سقف true peak -2 ديسيبل FS	حد صعب
كبت الضوضاء	قبل التوليف، اختياري	تنظيف الإدخال لنموذج تحويل النص إلى كلام

بناء صوت PA على متن الحافلة للمشاريع الإبداعية

التكنولوجيا نفسها في الصوت الذكي التي تشغل أنظمة الإعلان لسلطات النقل متاحة للمنشئين المستقلين. يجب على مطوري الألعاب الذين يبنون محاكيات عبور حضرية وصناع الأفلام الذين يحتاجون إلى صوت حافلة داخلية موثوق وتصميمات الحدائق موضوعية يخلقون بيئات النقل ومنشئي المحتوى الذين ينتجون فيديو متعلقة بالنقل جميعهم نفس الحاجة الأساسية: صوت PA للحافلة الواقعي الذي يبدو وكأنه جاء فعلاً من مكبر كابينة الحافلة.

سير العمل على أجهزة سطح مكتب Windows:

الخطوة 1 - اختر نموذج صوتي. بالنسبة لصوت على غرار MTA في نيويورك، اختر صوت أنثوي إنجليزي أمريكي محايد بسجل متوسط - ليس بشكل خاص متنفساً أو دافئاً، أكثر “وظيفية وواضح.” بالنسبة لصوت على غرار حافلات لندن، صوت أنثوي بريطاني باللفظ المنطوق برسمية. بالنسبة لأسلوب Tokyo Toei Bus، صوت أنثوي ياباني رسمي هو الإشارة.

الخطوة 2 - استنساخ وتدريب. استخدم أداة استنساخ صوت الذكاء الاصطناعي لإنشاء نموذج من 2-4 دقائق من الصوت المصدر النظيف. يتعامل خط أنابيب استنساخ الصوت VoxBooster مع هذا على أجهزة Windows 10/11 القياسية، يعمل محلياً بدون اعتماد سحابي. احتفظ بالصوت المصدر جاف - بلا صدى، بلا صوت الغرفة - للحصول على نموذج توليف الأنظف.

الخطوة 3 - اكتب سيناريواتك مع أعراف PA الحافلة في الاعتبار. احتفظ بكل إعلان محطة لجملة مركبة واحدة كحد أقصى. استخدم continuous present لاستدعاءات الاقتراب (“المحطة التالية هي…”) والحاضر البسيط لاستدعاءات الإيقاف (“هذا هو…”). تجنب الانقباضات - “نحن” يبدو أنظف على PA مضغوط من “نحن”. تجنب أسماء المحطات التي تحتوي على plosives ثقيلة في البداية حيث أمكن.

الخطوة 4 - التوليف إلى WAV نظيف. أنشئ كل إعلان عند 44.1 كيلو هرتز، 16 بت WAV. احتفظ بالمكسب عند -18 ديسيبل FS قبل المعالجة.

الخطوة 5 - تطبيق سلسلة DSP للحافلة PA. High-pass عند 200 هرتز، bandpass boost عند 1-3 كيلو هرتز، ضغط 6: 1، high-cut عند 5 كيلو هرتز، hard limit عند -2 ديسيبل FS. أضف صدى خفيف جداً للغرفة (RT60 من 0.3-0.5 ثانية - كابينات الحافلات أجف بكثير من محطات القطار).

الخطوة 6 - طبقة ضوضاء محيطة للواقعية. في سياق لعبة أو فيلم، يتم سماع صوت PA على ضوضاء محيطة الكابينة. امزج الإعلان المعالج على +3 إلى +6 ديسيبل فوق مرجع ضوضاء PA للحافلة للحصول على وضوح مدرك واقعي.

للأسير العمل الصوتي PA في سياقات النقل الأخرى، اطلع على مولدات الصوت الذكي لأنظمة PA لسفن الرحلات و مولدات الصوت الذكي لأنظمة تمرير EZ-Pass للعبارات، والتي تغطي التحديات الصوتية والامتثال المماثلة في بيئات المركبات المختلفة.

تنوع شخصية الصوت عبر أنواع أسطول الحافلات

تماماً كما تختلف أصوات PA للقطارات بين مترو القطار الإقليمي والسكك الحديدية والسكك الحديدية للمطار، تختلف أصوات PA للحافلات بين سياقات أسطول الحافلات:

حافلة المدينة (المسارات المحلية والمحطات الحضرية): أسرع معدل كلام من جميع أنواع الحافلات (155-165 كلمة في الدقيقة)، صوت مضغوط الأكثر، أعلى تركيز على الوضوح على الدفء. أمثلة: MTA محلية في نيويورك وحافلات لندن الداخلية.

الخدمات السريعة والمحدودة الإيقاف: أبطأ قليلاً (145-155 كلمة في الدقيقة)، مزيد من المعلومات لكل إعلان (تفاصيل الاتصال وتغييرات منطقة الأجرة)، سجل أكثر دفئاً لأن الركاب يجلسون لرحلات أطول. أمثلة: خدمة حافلات MTA Select Bus في نيويورك وحافلات لندن السريعة.

مكوك المطار والمدرب: أبطأ معدل كلام (130-140 كلمة في الدقيقة)، سجل الأكثر رسمية، غالباً الأكثر متعددة اللغات. تتضمن الإعلانات عادة تعليمات مفصلة (الأمتعة ومعلومات الطرف). أمثلة: مدرب Heathrow Express و LAX FlyAway.

خدمات Paratransit والخدمات الميسرة: بطيء جداً (120-130 كلمة في الدقيقة)، النطق الأكثر تعمداً، تأكيد العنوان والتحقق من الاستقبال المدمج في منطق الإعلان. حساسية الوضوح الصوتي الأولويات.

تعكس هذه الاختلافات الاختبار الصوتي والبحث النفس صوتي - وليس أعراف تعسفية. لقراءة أعمق حول توليف الصوت الذكي في سياقات PA بيئة بنية أخرى، يغطي دليلنا حول استنساخ الصوت لعمل voiceover كيفية تطبيق نماذج التوليف العصبي نفسها المستخدمة في النقل في إنتاج المحتوى الاحترافي، و مولدات الصوت الذكي لأنظمة concierge الفنادق يغطي فلسفة تصميم الصوت المعاكسة - الدفء والعمق بدلاً من PA punch. بالنسبة لمنشئي المحتوى الذين يريدون استخدام شخصيات صوتية على غرار النقل في البث أو الإنتاجات، يغطي دليل مغير الصوت لمنشئي المحتوى تشكيل الصوت في الوقت الفعلي.

الأسئلة المتكررة

ما هو صوت الإعلان على الحافلات بالذكاء الاصطناعي؟

صوت الإعلان على الحافلات بالذكاء الاصطناعي هو نظام تحويل النص إلى كلام مدرب على ممثل صوتي احترافي ومدمج مع نظام معلومات الركاب الآلي (APIS) للمركبة. يولد أسماء المحطات والإشعارات والرسائل الأمنية في الوقت الفعلي من بيانات موضع GPS، مما يحل محل بنوك المقاطع المسجلة مسبقاً بتوليف عصبي غير محدود المفردات.

كيف يعمل تحويل النص إلى كلام المُشغَّل بواسطة GPS على الحافلة؟

يتتبع جهاز استقبال GPS موضع المركبة. عندما تدخل الحافلة منطقة الحد الجغرافي - عادة 200-400 متر قبل محطة - يمرر وحدة التحكم APIS اسم المحطة ورقم المسار وأي معلومات اتصال لمحرك تحويل النص إلى كلام. يقوم المحرك بتوليف الصوت في أقل من 300 ميلي ثانية وتوجيهه إلى مكبرات الصالة. يمكن للحدث نفسه أن يحدث تحديثات متزامنة لشاشات المعلومات والمحطات.

ما الأجهزة التي تستخدمها وكالات النقل للإعلانات على الحافلات؟

Clever Devices و Luminator هما أكبر مزودي الأجهزة في أمريكا الشمالية. كلاهما يصنع وحدات APIS متكاملة تجمع بين وحدة GPS/LTE وكمبيوتر على متن الطائرة ومكبر PA ووحدة تحويل النص إلى كلام في حزمة واحدة معززة. غالباً ما تستخدم الأنظمة الأوروبية معدات INIT أو Trapeze. تدعم جميع الأنصات الحالية تحويل النص إلى كلام العصبي عبر محرك تحويل نص إلى كلام على متن الطائرة أو في الحافة السحابية.

ما الذي يتطلبه الامتثال لقانون ADA للإعلانات على الحافلات؟

بموجب قانون الأمريكيين ذوي الإعاقة (ADA) وتحديداً 49 CFR الجزء 37، يجب على مركبات النقل الإعلان عن محطات عند نقاط التحويل والتقاطعات الرئيسية وعند الطلب. يجب أن يكون الإعلان مسموعاً في جميع أنحاء المركبة. تستوفي أنظمة الصوت الذكي الحديثة هذا المتطلب بتوليف إعلانات المحطات تلقائياً من محفزات GPS، وتسجيل كل إعلان لأغراض الامتثال، وتوفير زر طلب محطة يُفعّله الركاب لتوليف إضافي عند الحاجة.

كيف يتعامل MTA في نيويورك وحافلات لندن وحافلات Tokyo Toei مع الأصوات على الحافلات؟

تستخدم حافلات MTA في نيويورك أجهزة Clever Devices IVIU بصوت إنجليزي مصنوع؛ تحويل نص إلى كلام ثنائي اللغة الإنجليزية والإسبانية نشط على عدة مسارات رئيسية. تستخدم حافلات لندن APIS متوافقة مع Luminator بصوت أنثوي بريطاني مصنوع مميز يُستخدم بشكل متسق عبر جميع مشغلي TfL. تستخدم حافلات Tokyo Toei تحويل نص إلى كلام ثنائي اللغة الياباني-الإنجليزي مع تقديم أسماء المحطات بصيغة romaji للمسار الإنجليزي وباللغة اليابانية الكاملة للمسار الياباني.

هل يمكنني إنشاء صوت PA على غرار الحافلات للألعاب أو الأفلام باستخدام برنامج سطح المكتب؟

نعم. تحتاج إلى استنساخ صوت معاير لبيئة صوتية PA - معادلة عرض النطاق الترددي الهاتفي مع نطاق تمرير مركزي على 500-3500 هرتز - بالإضافة إلى سيناريو يتبع أنماط الإعلانات المُشغَّلة بواسطة GPS. تتعامل أدوات مثل VoxBooster مع استنساخ الصوت والتوليف في الوقت الفعلي على Windows؛ يمكن إجراء خطوة محاكاة المعادل في أي محرر صوتي أو DAW.

لماذا يبدو صوت PA على الحافلات مختلفاً عن تسجيل الصوت في الاستوديو؟

مكبرات الصالة على الحافلات صغيرة ومحدودة القوة ويجب أن تتنافس مع ضوضاء المحرك والطريق والحديث بين الركاب. يطبق مكبر PA ضغطاً ثقيلاً ومعادل نطاق تمرير يقطع أقل من 200 هرتز وأعلى من 5 كيلو هرتز. يتم تدريب نماذج الصوت الذكي للنقل أو معالجتها لاحقاً ليكون لديها طاقة مركزة في نطاق الوضوح 500-3500 هرتز، مع ضغط مطبق مسبقاً حتى لا يقطع الصوت سلسلة مكبر PA للمركبة.

الخاتمة

لقد غير صوت الإعلان على الحافلات بالذكاء الاصطناعي ما كان في السابق مزيج متنوع من المقاطع المسجلة مسبقاً والإعلانات غير المتسقة من السائقين إلى نظام موثوق وقابل للتدقيق متعدد اللغات يعمل عبر بعض أكثر شبكات النقل تعقيداً في العالم. من أسطول MTA بـ 5800 مركبة يعمل على أجهزة Clever Devices في نيويورك إلى نموذج الصوت الموحد المفروض من TfL في حافلات لندن إلى توليف ثنائي اللغة الياباني-الإنجليزي الرسمي المسجل في حافلات Tokyo Toei - نفس معمارية تحويل النص إلى كلام العصبي المُشغَّلة بواسطة GPS تكمن تحتها جميعاً، مع معايرة صوتية وحسابية مطبقة على كل بيئة.

بالنسبة للمنشئين والمطورين الذين يحتاجون إلى صوت PA للحافلات بجودة النقل بدون موازنات سلطة النقل، يكون خط أنابيب النص هو نفسه بحجم صغير: استنساخ صوت الذكاء الاصطناعي وسيناريو مكتوب مع أعراف PA الحافلة وسلسلة DSP التي تحاكي الشخصية الصوتية المضغوطة bandpass-compressed لمكبر كابينة الحافلة. يتعامل VoxBooster مع جانب استنساخ الصوت والتوليف على Windows 10/11، مع تجربة مجانية لمدة 3 أيام وبدون بطاقة ائتمان مطلوبة.

الفرق بين إعلان حافلة مقنع وغير مقنع يأتي بالكامل من سلسلة DSP ومعايرة معدل الكلام الموضحة هنا. احصل عليها بشكل صحيح، والنتيجة لا تمييز عن إخراج Clever Devices أو Luminator الذي يسمعه الركاب كل يوم.

تنزيل VoxBooster - تجربة مجانية لمدة 3 أيام، بدون بطاقة ائتمان مطلوبة.