Raspberry Pi Voice Changer: بناء مشروع صوتي في جيبك
محول صوت Raspberry Pi يفتح فئة كاملة من المشاريع التي ستكون غير عملية على جهاز كمبيوتر قياسي - بناء الخوذات، وأصوات روبوتات الدعائم، وآلات ألعاب عتيقة مع صوت الشخصيات، وأجهزة cosplay مستقلة تعمل بالكامل من بطارية USB. يغطي هذا الدليل كل شيء من إعداد الأجهزة الأولية على Pi 4 و Pi 5، من خلال محول صوت Python عامل باستخدام PyAudio و librosa و Sox و rubberband bindings، إلى عمليات مشاريع كاملة لثلاثة بناءات شهيرة. في النهاية، سيكون لديك خط أنابيب وظيفي وفهم واضح لتبادلات الكمون والجودة في كل خطوة.
ملخص سريع
- Raspberry Pi 4 أو 5 يمكن أن يشغل تحويل طبقة في الوقت الفعلي وتأثيرات صوت روبوت باستخدام PyAudio و librosa و pyrubberband.
- ميكروفون USB + إخراج صوت USB أو HDMI - لا يلزم أي أسلاك تناظرية للحصول على إعداد عامل.
- بناء خوذات Cosplay وألعاب ألعاب عتيقة وأجهزة صوت روبوت تعمل جميعها على Pi بدون رأس تشغيل خدمة systemd.
- هدف زمن التأخير: 20-40 ms قابل للتحقيق في 44100 Hz مع أحجام مخزن مؤقت 512-1024 عينة.
- لاستخدام Discord/البث على Windows، فإن أداة مخصصة مثل VoxBooster أسرع في الإعداد وتنتج كمون أقل.
- المكدس Python الموصوف هنا ينطبق أيضاً على سطح المكتب Linux - انظر محول صوت Linux لتلك الزاوية.
الأجهزة التي تحتاجها: Pi 4 و Pi 5 والملحقات
Raspberry Pi 4 مقابل Pi 5 لمعالجة الصوت
يحدد اختيار نموذج Pi ما هي تأثيرات الصوت العملية في الوقت الفعلي.
| Feature | Raspberry Pi 4 (4 GB) | Raspberry Pi 5 (4/8 GB) |
|---|---|---|
| CPU | Cortex-A72 @ 1.8 GHz | Cortex-A76 @ 2.4 GHz |
| Real-time pitch shift | نعم، بشكل مريح | نعم، مع مساحة خالية |
| Librosa STFT (real-time) | على حافة المخازن الصغيرة | نعم |
| Neural voice conversion | لا (بطيء جداً) | ممكن بجودة مخفضة |
| Power draw (active) | ~3–5 W | ~5–8 W |
| Idle in helmet build | جيد | جيد، يعمل أدفأ قليلاً |
| Price (approx.) | $55 | $80 |
بالنسبة لمعظم بناءات cosplay والدعائم، فإن Pi 4 بذاكرة 2 GB أو 4 GB كافية. Pi 5 يشتري لك مساحة رأس لسلاسل DSP أكثر تعقيداً أو القدرة على تشغيل نموذج صوتي ONNX صغير محلياً. Pi Zero 2W يعمل للتأثيرات البسيطة جداً للطبقة فقط لكن أدائها أحادي النواة يجعلها غير موثوقة لسلاسل DSP متعددة المراحل.
اختيار ميكروفون USB
أي ميكروفون يفضح واجهة معايير USB Audio Class (UAC 1.0 أو 2.0) سيعمل على Raspberry Pi OS بدون تثبيت برامج تشغيل.
خيارات موصى بها:
- Fifine K669B - مضغوط، يعمل بالحافلة، قطب ثنائي، تحت 30 دولار. يناسب داخل صندوق الخوذة.
- Blue Snowball iCE - التقاط أوسع، رفض ضوضاء جيد، دعم Linux قياسي.
- Samson Go Mic - عامل clip-on، مفيد لبناء الأزياء حيث المساحة محدودة.
- Generic USB lapel mic - الخيار الأرخص. جودة الصوت محدودة لكن مقبولة لتأثيرات الروبوت/التشويه حيث جودة المصدر تهم أقل.
تجنب الميكروفونات التي تعلن “USB لـ Windows فقط” أو تتطلب برامج مساعدة - تلك عادة ما تستخدم واصفات USB ملكية التي لا تعدد بشكل صحيح على Linux.
خيارات إخراج الصوت
- محول صوت USB (DAC dongle) - الخيار الأبسط، يوصل إلى جانب ميكروفون USB. اختر واحداً يحتوي على إخراج سماعة رأس 3.5 ملم.
- صوت HDMI - يعمل مباشرة من الصندوق لبناء خوذات متصلة بشاشة عرض أو جهاز استقبال AV.
- مكبر صوت Bluetooth - يضيف 50-150 ms من كمون إضافي من مكدس Bluetooth. مقبول لأصوات الدعائم حيث المزامنة مع حركة الفم ليست حرجة؛ ليس عظيماً للمحادثة في الوقت الفعلي.
- I2S DAC HAT (مثل HiFiBerry DAC+ Zero) - أفضل جودة صوتية، أقل زمن تأخير، لكن يتطلب تكوين التراكب الحبيبي.
بالنسبة للأمثلة في هذا الدليل نستخدم ميكروفون USB + محول صوت USB، لأن هذا الأسهل للتكرار ولا يتطلب أي تراكب شجرة الجهاز.
الإعداد الأولي: Raspberry Pi OS و ALSA Configuration
تثبيت Raspberry Pi OS
استخدم Raspberry Pi OS Lite (64-bit) لبناء بدون رأس أو Raspberry Pi OS Desktop إذا كنت تريد واجهة رسومية للتطوير. فلاش إلى بطاقة SD باستخدام Raspberry Pi Imager و تفعيل SSH في إعدادات imager المتقدمة.
بعد الإقلاع الأول:
sudo apt update && sudo apt upgrade -y
sudo apt install -y python3-pip python3-dev portaudio19-dev libsndfile1-dev sox rubberband-cli
تحديد أجهزة الصوت الخاصة بك
aplay -l # lists playback devices
arecord -l # lists capture devices
الناتج النموذجي مع ميكروفون USB + DAC USB سيظهرهما كـ card 1 و card 2 إلى جانب صوت bcm2835 المدمج. لاحظ أرقام الطاقة والجهاز - ستحتاجها لـ PyAudio’s input_device_index و output_device_index.
تعيين أجهزة ALSA الافتراضية
أنشئ أو عدّل /etc/asound.conf:
pcm.!default {
type asym
playback.pcm "plughw:2,0"
capture.pcm "plughw:1,0"
}
ctl.!default {
type hw
card 2
}
استبدل أرقام البطاقة لمطابقة إخراج aplay -l / arecord -l الخاص بك. اختبار مع arecord -d 5 test.wav && aplay test.wav.
محول صوت Python: خط الأنابيب الأساسي
تثبيت اعتماديات Python
pip3 install pyaudio numpy librosa sounddevice pyrubberband
إذا فشل pyaudio في الإنشاء، تأكد من تثبيت portaudio19-dev. على Pi OS Bookworm قد تحتاج إلى التثبيت داخل بيئة افتراضية:
python3 -m venv voicechanger
source voicechanger/bin/activate
pip install pyaudio numpy librosa sounddevice pyrubberband
محول طبقة بسيط في الوقت الفعلي
أبسط خط عمل قراءة إطارات الصوت، وتطبيق تحويل الطبقة مع librosa، وكتابة الإخراج مرة أخرى. هذا هو أساس كل تأثير أكثر تعقيداً يبني عليه.
import pyaudio
import numpy as np
import librosa
RATE = 44100
CHUNK = 1024
SEMITONES = 4.0 # positive = higher pitch, negative = lower
p = pyaudio.PyAudio()
stream_in = p.open(format=pyaudio.paFloat32,
channels=1,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
stream_out = p.open(format=pyaudio.paFloat32,
channels=1,
rate=RATE,
output=True,
frames_per_buffer=CHUNK)
print("Voice changer running. Ctrl+C to stop.")
try:
while True:
data = np.frombuffer(stream_in.read(CHUNK, exception_on_overflow=False),
dtype=np.float32)
shifted = librosa.effects.pitch_shift(data, sr=RATE, n_steps=SEMITONES)
stream_out.write(shifted.astype(np.float32).tobytes())
except KeyboardInterrupt:
pass
stream_in.stop_stream()
stream_out.stop_stream()
p.terminate()
سيعمل هذا على Pi 4 مع CHUNK=1024 في حوالي 23 ms من كمون المعالجة لكل إطار، بالإضافة إلى كمون مخزن ALSA المؤقت. توقع كمون الرحلة ذهاباً وإياباً الكلي من 40-80 ms اعتماداً على تخزين جهاز الصوت USB المؤقت.
تحويل طبقة عالي الجودة مع pyrubberband
librosa’s pitch_shift يستخدم vocodor المرحلة داخلياً، والذي يعمل لكن يمكن أن ينتج phasiness على الساكنات. مكتبة rubberband تستخدم خوارزمية أكثر تعقيداً تتعامل مع الحدود بشكل أفضل - نفس المحرك المستخدم في تصحيح الطبقة DAW المهني.
import pyrubberband as pyrb
# Replace the librosa line with:
shifted = pyrb.pitch_shift(data, RATE, SEMITONES)
pyrubberband يتطلب حزمة نظام rubberband-cli (المثبتة في خطوة apt أعلاه). يستدعي ثنائي rubberband عبر subprocess، مما يضيف تكلفة صغيرة ولكن ثابتة. بالنسبة لمعظم تطبيقات صوت الشخصيات، تحسين الجودة يستحق الأمر.
تأثير صوت الروبوت
صوت الروبوت يجمع عدة خطوات DSP: تحويل طبقة متوسط، تعديل حلقة (تعديل سعة بموجة جيبية حاملة)، وانعكاس معادن قصير.
import numpy as np
def robot_voice(audio, rate=44100, mod_freq=60.0, shift_semitones=-2):
# Pitch down slightly for that mechanical quality
import librosa
pitched = librosa.effects.pitch_shift(audio, sr=rate, n_steps=shift_semitones)
# Ring modulation: multiply by a sine wave carrier
t = np.arange(len(pitched)) / rate
carrier = np.sin(2 * np.pi * mod_freq * t)
modulated = pitched * carrier
# Mix dry and wet (50/50)
result = 0.5 * pitched + 0.5 * modulated
# Normalize
peak = np.max(np.abs(result))
if peak > 0:
result /= peak
return result.astype(np.float32)
ضبط mod_freq لضبط الشخصية المعدنية: 40-60 Hz يعطي همهمة ميكانيكية منخفضة؛ 80-120 Hz يبدو أكثر مثل روبوت خيال علمي كلاسيكي؛ 200+ Hz يبدأ يبدو أكثر مثل تأثير جهاز تشفير.
استخدام Sox لتأثيرات الصوت على Raspberry Pi
Sox (Sound eXchange) هي أداة معالجة صوت سطر الأوامر التي تأتي مع معظم توزيعات Linux. يتعامل مع مجموعة واسعة من تأثيرات الصوت من خلال الأعلام البسيطة، ويمكن استدعاؤها من Python عبر subprocess أو من خلال مكتبة wrapper pysox.
تثبيت pysox
pip3 install sox
تطبيق تأثيرات Sox من Python
Sox معالجات ملفات صوتية بدلاً من تدفقات في الوقت الفعلي، مما يعني أنها تعمل بشكل أفضل في خط أنابيب حيث تسجل مخزن مؤقت قصير، معالجة، ثم تشغيله مرة أخرى - فعالياً نهج البث منخفض الكمون مع تأخير كتلة طفيف.
import sox
import tempfile, os
def apply_sox_effect(input_wav, effect_name, effect_args):
tfm = sox.Transformer()
if effect_name == "pitch":
tfm.pitch(effect_args) # semitones * 100 = cents
elif effect_name == "rate":
tfm.rate(effect_args)
elif effect_name == "reverb":
tfm.reverb(reverberance=effect_args)
with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as f:
out_path = f.name
tfm.build(input_wav, out_path)
return out_path
Sox مفيد أكثر لبناء محول صوت Raspberry Pi مع نمط push-to-talk - تسجيل عينة، تطبيق التأثير، تشغيله مرة أخرى - أكثر من البث الحقيقي في الوقت الفعلي. للبث المستمر في الوقت الفعلي لتغيير الصوت، فإن نهج PyAudio + NumPy + librosa أفضل.
تأثيرات Sox المفيدة لمشاريع الصوت
| Effect | Sox Flag | Result |
|---|---|---|
| Pitch shift | pitch +500 | +5 semitones (in cents) |
| Echo/delay | echo 0.8 0.9 500 0.5 | Single 500ms echo |
| Reverb | reverb 80 | Hall-sized reverb |
| Distortion | overdrive 10 | Mild saturation |
| Tempo change | tempo 0.85 | Slower without pitch change |
| Low-pass filter | lowpass 3000 | Telephone voice quality |
| Bandpass | band 1000 500 | CB radio / walkie-talkie |
بناء المشروع: محول صوت خوذة Cosplay
هذا أحد أكثر تطبيقات محول صوت Raspberry Pi شيوعاً - خوذة قابلة للارتداء أو قناع يحول صوت مرتديها لمطابقة الشخصية. فكر في Iron Man أو Mandalorian أو stormtrooper أو أي شخصية روبوت/أندرويد.
قائمة المكونات
- Raspberry Pi 4 (2 GB) أو Pi Zero 2W للبناء الصغير
- بطارية USB (10,000 mAh للعملية متعددة الساعات)
- ميكروفون USB مضغوط (Fifine K669B أو ميكروفون lapel USB عام)
- محول صوت USB صغير (لإخراج سماعة الرأس)
- 2× مكبر صوت بقوة 3 واط + لوحة مضخم Class D صغيرة
- مفتاح تبديل للتشغيل/الإيقاف
- صندوق الخوذة/القناع المطبوع ثلاثي الأبعاد أو التجاري
الأسلاك
- بطارية الطاقة → Pi USB-C power input
- ميكروفون USB → Pi USB port
- محول صوت USB → Pi USB port
- إخراج سماعة الرأس → لوحة المضخم → مكبرات الصوت المثبتة في الخوذة
حافظ على كابلات USB قصيرة (تحت 30 سم) لتقليل التداخل الكهرومغناطيسي الذي يمكن أن يظهر كهسهسة على أجهزة الصوت USB الرخيصة.
سكريبت Python لخوذة الإقلاع
أنشئ /home/pi/voicechanger/helmet.py مع وظيفة صوت الروبوت الخاصة بك، ثم أنشئ خدمة systemd التي تبدأها عند الإقلاع:
# /etc/systemd/system/helmet-voice.service
[Unit]
Description=Helmet Voice Changer
After=sound.target
[Service]
User=pi
WorkingDirectory=/home/pi/voicechanger
ExecStart=/home/pi/voicechanger/venv/bin/python helmet.py
Restart=on-failure
RestartSec=3
[Install]
WantedBy=multi-user.target
تفعيل مع sudo systemctl enable helmet-voice.service. Pi يقلع ويبدأ محول الصوت في حوالي 15 ثانية من التشغيل.
إعدادات صوت الشخصية
| Character Type | Pitch Shift | Mod Freq | Extra Effect |
|---|---|---|---|
| Robot / android | -3 semitones | 80 Hz | Light reverb |
| Iron Man (JARVIS) | -1 semitone | None | EQ: boost 1-3 kHz, slight compression |
| Stormtrooper | 0 semitones | 100 Hz | Bandpass 500-3000 Hz (walkie-talkie) |
| Darth Vader style | -4 semitones | 40 Hz | Heavy reverb, deep bass boost |
| Alien / creature | +2 semitones | 60 Hz | Ring mod + short echo |
بناء المشروع: دعامة ألعاب عتيقة الصوت
دعامات الأحداث ألعاب عتيقة - فكر في صناديق صوت شخصيات لعبة 8-بت، تأثيرات صوت خزانة الألعاب، أو عدة صوت محمولة - هي حالة استخدام ممتازة أخرى لمحول صوت Raspberry Pi المدمج.
Pi Zero 2W في صندوق يشبه الخرطوشة، يعمل من بطارية LiPo صغيرة، يمكن أن يشغل مقاطع صوتية قصيرة أو تطبيق تأثيرات صوت في الوقت الفعلي. مع زر push-to-talk ومكبر صوت صغير، يصبح دعامة مستقلة لا تتطلب أي هاتف أو كمبيوتر محمول. إعداد الأجهزة مشابه لبناء الخوذة أعلاه لكن أبسط: قد تستخدم أجش piezo صغير لتأثيرات بسيطة أو مكبر صوت بقوة 1 واط لإخراج الصوت. يستمع سكريبت Python لضغطات زر GPIO لتشغيل إعدادات صوت مختلفة. للحصول على الإلهام في تأثيرات الصوت 8-بت والعتيقة، انظر محول صوت 8-بت.
بناء المشروع: صندوق صوت روبوت مستقل
دعامة روبوت أو شخصية متحركة تستفيد من Pi 4 في صندوق، تشغيل محول صوت دائم يمكن لأي شخص التحدث فيه. الإعداد واضح:
- ميكروفون USB في موضع التقاط كلي الاتجاهات (أو وجهه حيث يقف الناس)
- سكريبت Python دائم التشغيل (خدمة systemd)
- إخراج صوت USB إلى مكبر صوت Bluetooth محمول أو مكبر صوت سلكي مع مضخم
- تحريك LED أو servo اختياري عبر GPIO عند تجاوز مستوى الصوت عتبة
تحريك LED/servo الذي يتم تشغيله بمستوى الصوت هو إضافة شهيرة. PyAudio يوفر مستوى الصوت مباشرة من RMS لكل مخزن مؤقت:
rms = np.sqrt(np.mean(data**2))
is_speaking = rms > THRESHOLD # set THRESHOLD by experiment
قم بتوصيل boolean is_speaking بإخراج GPIO وليس لديك روبوت يفتح “فمه” عندما يتحدث شخص ما فيه.
تحسين زمن التأخير لتغيير الصوت في الوقت الفعلي
الكمون هو التحدي الهندسي الرئيسي في أي محول صوت في الوقت الفعلي، Pi أو خلاف ذلك. يصبح إدراك الإنسان للتناقض المتزامن مع الشفاه ملحوظاً حول 50 ms ومزعجاً فوق 80 ms. لتطبيقات الصوت فقط (بدون فيديو)، الكمون حتى 150 ms مقبول؛ بالنسبة للمحادثة، أقل من 50 ms يشعر طبيعياً.
مصادر الكمون على Raspberry Pi
| Source | Typical Value | Reducible? |
|---|---|---|
| ALSA input buffer | 10-30 ms | Yes, reduce buffer size |
| Python processing (librosa, 1024 samples) | 23 ms | Yes, reduce chunk size |
| ALSA output buffer | 10-30 ms | Yes |
| USB audio roundtrip overhead | 5-15 ms | Partially |
| Bluetooth audio (if used) | 50-150 ms | No — avoid for real-time |
نصائح الضبط
- تقليل CHUNK: الذهاب من 2048 إلى 512 عينة يقطع كمون المعالجة من 46 ms إلى 12 ms في 44100 Hz. المقابل هو استدعاءات معاودة اتصال Python أكثر في الثانية، مما يزيد من حمل CPU.
- استخدام sounddevice بدلاً من PyAudio: مكتبة
sounddeviceلها تكامل ALSA أنظف على Linux وغالباً ما تحقق كمون أقل مع عدم وجود underrun مخزن مؤقت. - تجنب librosa.load() داخل معاودة الاتصال: جميع الإعداد (معدل العينة، معاملات النموذج) يجب أن يحدث قبل بدء معاودة الاتصال الصوتية.
- تعيين حاكم CPU للأداء:
sudo cpufreq-set -g performanceيمنع Pi من خنق CPU في منتصف التدفق. - استخدم محول صوت USB سلكي: Bluetooth يضيف 50-150 ms. صوت USB السلكي يضيف فقط 5-15 ms.
محول صوت Raspberry Pi مقابل البرنامج المخصص
إذا كان هدفك النهائي هو تغيير الصوت على Discord أو دردشة الألعاب أو Twitch أو تطبيقات Windows، فمن الجدير أن تكون واضحاً حول مشروع Pi المناسب مقابل أداة مخصصة لـ Windows.
| Scenario | Raspberry Pi (Python) | Windows Dedicated Software |
|---|---|---|
| Cosplay helmet / wearable prop | Ideal | Not applicable |
| Tabletop robot prop | Ideal | Not applicable |
| Retro gaming prop / standalone | Ideal | Not applicable |
| Discord / game chat on Windows PC | Workaround (USB audio loopback) | Much simpler |
| Twitch / YouTube stream voice | Possible with JACK routing | VoxBooster or similar is simpler |
| AI voice conversion quality | Limited (Pi compute) | Much better (GPU/CPU on PC) |
| Latency on PC | 40-80 ms on Pi | Under 10 ms on modern PC |
| Setup time | Hours | Minutes |
| Cost | $55-$80 (Pi alone) | Subscription or one-time |
بالنسبة لأي شخص يبني دعامة أو ملابس قابلة للارتداء، Pi هو بالفعل الأداة الصحيحة ويعطيك هذا الدليل نقطة بداية كاملة. بالنسبة لأي شخص وصل هنا أثناء البحث عن محول صوت Discord أو البث وانتهى على برنامج تعليمي Pi بالصدفة - انظر خيار Windows أصلي بدلاً من ذلك. يقوم VoxBooster بإنشاء ميكروفون افتراضي مباشرة في رسم بياني الصوت Windows، معالجة مع زمن تأخير أقل من 10ms، ويستغرق حوالي خمس دقائق للإعداد. يمكنك أيضاً أن تنظر إلى محول صوت Linux إذا كنت تقوم بتشغيل جهاز البث على Linux بدلاً من Windows.
بالنسبة لمشاريع عملية لا تتعلق بـ Raspberry Pi على الإطلاق، برنامج تعليمي محول صوت Audacity يغطي التعديل الطبقي غير المتصل، و ألعاب ودعامات محول الصوت يغطي خيارات الأجهزة المدمجة مسبقاً لـ cosplay.
بالنسبة لمشاريع قائمة على microcontroller مع عوامل شكل أصغر حتى، انظر محول صوت Arduino - النهج مختلف (Arduino يتعامل مع تأثيرات أبسط وتناظرية) لكن حالات الاستخدام تتداخل في بناء الدعائم.
الأسئلة المتكررة
هل يمكن لـ Raspberry Pi تشغيل محول صوت في الوقت الفعلي؟
نعم. Raspberry Pi 4 أو 5 لديه قوة CPU كافية لتشغيل تحويل الطبقة الخفيفة مع PyAudio و Sox بزمن تأخير 20-40 ms. تحويل الصوت العصبي AI أثقل ويتطلب إما Pi 5 أو خطوة استدلال مفرغة، لكن تأثيرات الطبقة الأساسية والصيغة وصوت الروبوت تعمل بشكل مريح في الوقت الفعلي على Pi 4.
ما أفضل ميكروفون USB يعمل مع Raspberry Pi لتغيير الصوت؟
أي ميكروفون USB يفضح واجهة معايير USB Audio Class (UAC) سيعمل بدون تثبيت برامج تشغيل إضافية على Raspberry Pi OS. تشمل الخيارات الشهيرة Blue Snowball iCE و Fifine K669B و Samson Go Mic. تجنب الميكروفونات التي تتطلب برامج تشغيل Windows ملكية - لن تعمل على Linux.
ما مكتبات Python التي أحتاجها لمحول صوت Raspberry Pi؟
المكدس الأساسي هو PyAudio (I/O الصوتي)، NumPy (رياضيات المصفوفات)، وإما librosa (تحليل طيفي وتحويل الطبقة) أو pysox (وصلات Sox) للتحولات. للحصول على جودة تحويل طبقة مثل Rubberband، ثبت pyrubberband بالإضافة إلى حزمة نظام rubberband-cli. SoundDevice هو بديل أنظف لـ PyAudio لـ ALSA على Linux.
كيف يمكنني تقليل زمن التأخير في محول صوت Python على Raspberry Pi؟
استخدم أحجام مخزن مؤقت صوتية صغيرة (512 أو 1024 عينة في 44100 Hz يعطي 12-23 ms). معالجة في إطارات متداخلة قصيرة مع نافذة Hann. تجنب librosa’s load() داخل معاودة الاتصال الصوتية - احسب المعاملات مسبقاً خارجاً. Sox عبر subprocess يضيف تكلفة الأنابيب؛ فضل المكتبات في العملية للحصول على أقل تأخير.
هل يمكنني استخدام محول صوت Raspberry Pi لبناء Cosplay أو الدعائم؟
بالتأكيد. Pi Zero 2W أو Pi 4 يناسب داخل خوذة أو صندوق دعائم، مدعوم ببطارية USB. قم بتوصيل ميكروفون USB داخل الخوذة، قم بتشغيل سماعة صغيرة أو إخراج صوت Bluetooth، وقم بتشغيل سكريبت محول الصوت Python عند الإقلاع عبر خدمة systemd. يمكن للوحدة بأكملها أن تعمل بدون رأس بدون لوحة مفاتيح أو شاشة.
ما الفرق بين تحويل الطبقة وتحويل الصوت على Raspberry Pi؟
تحويل الطبقة يغير التردد الأساسي لإشارة الصوت، مثل رفع أو خفض الطبقة الموسيقية. يحل تحويل الصوت محل خصائص صوتية صوتية واحدة بأخرى باستخدام نماذج التعلم الآلي. يعمل تحويل الطبقة في الوقت الفعلي على أي Pi 4؛ يتطلب تحويل الصوت استدلال أثقل ويعمل بشكل أفضل على Pi 5 أو مع معجل USB مثل Google Coral.
هل يعمل VoxBooster على Raspberry Pi؟
لا. VoxBooster هو تطبيق سطح مكتب Windows 10/11 ويعمل على أجهزة x86-64. بالنسبة لمشاريع Linux أو Raspberry Pi، فإن خطوط أنابيب قائمة على Python مع PyAudio و librosa و rubberband هي الطريقة الصحيحة. إذا كان هدفك النهائي هو إعداد Discord أو البث على جهاز Windows، فإن VoxBooster خيار أبسط وأقل كمون.
الخلاصة
محول صوت Raspberry Pi هو أحد أكثر المشاريع الصوتية المدمجة رضا يمكنك بناؤها - الأجهزة رخيصة، ومكتبة Python لـ DSP الصوت نضجة، والنتائج النهائية تتراوح من بناءات دعائم وظيفية إلى تثبيتات تفاعلية مثيرة للإعجاب حقاً. خط الأنابيب الأساسي (PyAudio → معالجة NumPy → PyAudio out) يحصلك على التشغيل في أقل من ساعة. إضافة pyrubberband ترفع الجودة بشكل ملحوظ، وبناء كل شيء في خدمة systemd يجعل الشيء كله يقلع تلقائياً مثل جهاز المستهلك.
Pi 4 يصل إلى حده مع تحويل الصوت العصبي الثقيل، لكن لتحويل الطبقة وتعديل الحلقة وصوت الروبوت وتأثيرات الشخصيات لديه أكثر من كافية قوة حصان. إذا تجاوزت Pi، نفس كود Python يعمل على أي جهاز Linux - والمفاهيم تنقل مباشرة إلى فهم ما تفعله الأدوات المخصصة مثل VoxBooster تحت الغطاء عندما تحقق كمون أقل من 10 ميلي ثانية على Windows مع تحويل صوت AI كامل.
بناء الخوذة. قم بتشغيل الروبوت. اخرج الدعامة في المؤتمر القادم.
تنزيل VoxBooster - تجربة مجانية مدتها 3 أيام لـ Windows، بدون الحاجة إلى بطاقة ائتمان.