Raspberry Pi Voice Changer: بناء مشروع صوتي في جيبك

محول صوت Raspberry Pi يفتح فئة كاملة من المشاريع التي ستكون غير عملية على جهاز كمبيوتر قياسي - بناء الخوذات، وأصوات روبوتات الدعائم، وآلات ألعاب عتيقة مع صوت الشخصيات، وأجهزة cosplay مستقلة تعمل بالكامل من بطارية USB. يغطي هذا الدليل كل شيء من إعداد الأجهزة الأولية على Pi 4 و Pi 5، من خلال محول صوت Python عامل باستخدام PyAudio و librosa و Sox و rubberband bindings، إلى عمليات مشاريع كاملة لثلاثة بناءات شهيرة. في النهاية، سيكون لديك خط أنابيب وظيفي وفهم واضح لتبادلات الكمون والجودة في كل خطوة.

ملخص سريع

Raspberry Pi 4 أو 5 يمكن أن يشغل تحويل طبقة في الوقت الفعلي وتأثيرات صوت روبوت باستخدام PyAudio و librosa و pyrubberband.
ميكروفون USB + إخراج صوت USB أو HDMI - لا يلزم أي أسلاك تناظرية للحصول على إعداد عامل.
بناء خوذات Cosplay وألعاب ألعاب عتيقة وأجهزة صوت روبوت تعمل جميعها على Pi بدون رأس تشغيل خدمة systemd.
هدف زمن التأخير: 20-40 ms قابل للتحقيق في 44100 Hz مع أحجام مخزن مؤقت 512-1024 عينة.
لاستخدام Discord/البث على Windows، فإن أداة مخصصة مثل VoxBooster أسرع في الإعداد وتنتج كمون أقل.
المكدس Python الموصوف هنا ينطبق أيضاً على سطح المكتب Linux - انظر محول صوت Linux لتلك الزاوية.

الأجهزة التي تحتاجها: Pi 4 و Pi 5 والملحقات

Raspberry Pi 4 مقابل Pi 5 لمعالجة الصوت

يحدد اختيار نموذج Pi ما هي تأثيرات الصوت العملية في الوقت الفعلي.

Feature	Raspberry Pi 4 (4 GB)	Raspberry Pi 5 (4/8 GB)
CPU	Cortex-A72 @ 1.8 GHz	Cortex-A76 @ 2.4 GHz
Real-time pitch shift	نعم، بشكل مريح	نعم، مع مساحة خالية
Librosa STFT (real-time)	على حافة المخازن الصغيرة	نعم
Neural voice conversion	لا (بطيء جداً)	ممكن بجودة مخفضة
Power draw (active)	~3–5 W	~5–8 W
Idle in helmet build	جيد	جيد، يعمل أدفأ قليلاً
Price (approx.)	$55	$80

بالنسبة لمعظم بناءات cosplay والدعائم، فإن Pi 4 بذاكرة 2 GB أو 4 GB كافية. Pi 5 يشتري لك مساحة رأس لسلاسل DSP أكثر تعقيداً أو القدرة على تشغيل نموذج صوتي ONNX صغير محلياً. Pi Zero 2W يعمل للتأثيرات البسيطة جداً للطبقة فقط لكن أدائها أحادي النواة يجعلها غير موثوقة لسلاسل DSP متعددة المراحل.

اختيار ميكروفون USB

أي ميكروفون يفضح واجهة معايير USB Audio Class (UAC 1.0 أو 2.0) سيعمل على Raspberry Pi OS بدون تثبيت برامج تشغيل.

خيارات موصى بها:

Fifine K669B - مضغوط، يعمل بالحافلة، قطب ثنائي، تحت 30 دولار. يناسب داخل صندوق الخوذة.
Blue Snowball iCE - التقاط أوسع، رفض ضوضاء جيد، دعم Linux قياسي.
Samson Go Mic - عامل clip-on، مفيد لبناء الأزياء حيث المساحة محدودة.
Generic USB lapel mic - الخيار الأرخص. جودة الصوت محدودة لكن مقبولة لتأثيرات الروبوت/التشويه حيث جودة المصدر تهم أقل.

تجنب الميكروفونات التي تعلن “USB لـ Windows فقط” أو تتطلب برامج مساعدة - تلك عادة ما تستخدم واصفات USB ملكية التي لا تعدد بشكل صحيح على Linux.

خيارات إخراج الصوت

محول صوت USB (DAC dongle) - الخيار الأبسط، يوصل إلى جانب ميكروفون USB. اختر واحداً يحتوي على إخراج سماعة رأس 3.5 ملم.
صوت HDMI - يعمل مباشرة من الصندوق لبناء خوذات متصلة بشاشة عرض أو جهاز استقبال AV.
مكبر صوت Bluetooth - يضيف 50-150 ms من كمون إضافي من مكدس Bluetooth. مقبول لأصوات الدعائم حيث المزامنة مع حركة الفم ليست حرجة؛ ليس عظيماً للمحادثة في الوقت الفعلي.
I2S DAC HAT (مثل HiFiBerry DAC+ Zero) - أفضل جودة صوتية، أقل زمن تأخير، لكن يتطلب تكوين التراكب الحبيبي.

بالنسبة للأمثلة في هذا الدليل نستخدم ميكروفون USB + محول صوت USB، لأن هذا الأسهل للتكرار ولا يتطلب أي تراكب شجرة الجهاز.

الإعداد الأولي: Raspberry Pi OS و ALSA Configuration

تثبيت Raspberry Pi OS

استخدم Raspberry Pi OS Lite (64-bit) لبناء بدون رأس أو Raspberry Pi OS Desktop إذا كنت تريد واجهة رسومية للتطوير. فلاش إلى بطاقة SD باستخدام Raspberry Pi Imager و تفعيل SSH في إعدادات imager المتقدمة.

بعد الإقلاع الأول:

sudo apt update && sudo apt upgrade -y
sudo apt install -y python3-pip python3-dev portaudio19-dev libsndfile1-dev sox rubberband-cli

تحديد أجهزة الصوت الخاصة بك

aplay -l     # lists playback devices
arecord -l   # lists capture devices

الناتج النموذجي مع ميكروفون USB + DAC USB سيظهرهما كـ card 1 و card 2 إلى جانب صوت bcm2835 المدمج. لاحظ أرقام الطاقة والجهاز - ستحتاجها لـ PyAudio’s input_device_index و output_device_index.

تعيين أجهزة ALSA الافتراضية

أنشئ أو عدّل /etc/asound.conf:

pcm.!default {
    type asym
    playback.pcm "plughw:2,0"
    capture.pcm "plughw:1,0"
}
ctl.!default {
    type hw
    card 2
}

استبدل أرقام البطاقة لمطابقة إخراج aplay -l / arecord -l الخاص بك. اختبار مع arecord -d 5 test.wav && aplay test.wav.

محول صوت Python: خط الأنابيب الأساسي

تثبيت اعتماديات Python

pip3 install pyaudio numpy librosa sounddevice pyrubberband

إذا فشل pyaudio في الإنشاء، تأكد من تثبيت portaudio19-dev. على Pi OS Bookworm قد تحتاج إلى التثبيت داخل بيئة افتراضية:

python3 -m venv voicechanger
source voicechanger/bin/activate
pip install pyaudio numpy librosa sounddevice pyrubberband

محول طبقة بسيط في الوقت الفعلي

أبسط خط عمل قراءة إطارات الصوت، وتطبيق تحويل الطبقة مع librosa، وكتابة الإخراج مرة أخرى. هذا هو أساس كل تأثير أكثر تعقيداً يبني عليه.

import pyaudio
import numpy as np
import librosa

RATE = 44100
CHUNK = 1024
SEMITONES = 4.0   # positive = higher pitch, negative = lower

p = pyaudio.PyAudio()

stream_in = p.open(format=pyaudio.paFloat32,
                   channels=1,
                   rate=RATE,
                   input=True,
                   frames_per_buffer=CHUNK)

stream_out = p.open(format=pyaudio.paFloat32,
                    channels=1,
                    rate=RATE,
                    output=True,
                    frames_per_buffer=CHUNK)

print("Voice changer running. Ctrl+C to stop.")
try:
    while True:
        data = np.frombuffer(stream_in.read(CHUNK, exception_on_overflow=False),
                             dtype=np.float32)
        shifted = librosa.effects.pitch_shift(data, sr=RATE, n_steps=SEMITONES)
        stream_out.write(shifted.astype(np.float32).tobytes())
except KeyboardInterrupt:
    pass

stream_in.stop_stream()
stream_out.stop_stream()
p.terminate()

سيعمل هذا على Pi 4 مع CHUNK=1024 في حوالي 23 ms من كمون المعالجة لكل إطار، بالإضافة إلى كمون مخزن ALSA المؤقت. توقع كمون الرحلة ذهاباً وإياباً الكلي من 40-80 ms اعتماداً على تخزين جهاز الصوت USB المؤقت.

تحويل طبقة عالي الجودة مع pyrubberband

librosa’s pitch_shift يستخدم vocodor المرحلة داخلياً، والذي يعمل لكن يمكن أن ينتج phasiness على الساكنات. مكتبة rubberband تستخدم خوارزمية أكثر تعقيداً تتعامل مع الحدود بشكل أفضل - نفس المحرك المستخدم في تصحيح الطبقة DAW المهني.

import pyrubberband as pyrb

# Replace the librosa line with:
shifted = pyrb.pitch_shift(data, RATE, SEMITONES)

pyrubberband يتطلب حزمة نظام rubberband-cli (المثبتة في خطوة apt أعلاه). يستدعي ثنائي rubberband عبر subprocess، مما يضيف تكلفة صغيرة ولكن ثابتة. بالنسبة لمعظم تطبيقات صوت الشخصيات، تحسين الجودة يستحق الأمر.

تأثير صوت الروبوت

صوت الروبوت يجمع عدة خطوات DSP: تحويل طبقة متوسط، تعديل حلقة (تعديل سعة بموجة جيبية حاملة)، وانعكاس معادن قصير.

import numpy as np

def robot_voice(audio, rate=44100, mod_freq=60.0, shift_semitones=-2):
    # Pitch down slightly for that mechanical quality
    import librosa
    pitched = librosa.effects.pitch_shift(audio, sr=rate, n_steps=shift_semitones)
    
    # Ring modulation: multiply by a sine wave carrier
    t = np.arange(len(pitched)) / rate
    carrier = np.sin(2 * np.pi * mod_freq * t)
    modulated = pitched * carrier
    
    # Mix dry and wet (50/50)
    result = 0.5 * pitched + 0.5 * modulated
    
    # Normalize
    peak = np.max(np.abs(result))
    if peak > 0:
        result /= peak
    return result.astype(np.float32)

ضبط mod_freq لضبط الشخصية المعدنية: 40-60 Hz يعطي همهمة ميكانيكية منخفضة؛ 80-120 Hz يبدو أكثر مثل روبوت خيال علمي كلاسيكي؛ 200+ Hz يبدأ يبدو أكثر مثل تأثير جهاز تشفير.

استخدام Sox لتأثيرات الصوت على Raspberry Pi

Sox (Sound eXchange) هي أداة معالجة صوت سطر الأوامر التي تأتي مع معظم توزيعات Linux. يتعامل مع مجموعة واسعة من تأثيرات الصوت من خلال الأعلام البسيطة، ويمكن استدعاؤها من Python عبر subprocess أو من خلال مكتبة wrapper pysox.

تثبيت pysox

pip3 install sox

تطبيق تأثيرات Sox من Python

Sox معالجات ملفات صوتية بدلاً من تدفقات في الوقت الفعلي، مما يعني أنها تعمل بشكل أفضل في خط أنابيب حيث تسجل مخزن مؤقت قصير، معالجة، ثم تشغيله مرة أخرى - فعالياً نهج البث منخفض الكمون مع تأخير كتلة طفيف.

import sox
import tempfile, os

def apply_sox_effect(input_wav, effect_name, effect_args):
    tfm = sox.Transformer()
    if effect_name == "pitch":
        tfm.pitch(effect_args)   # semitones * 100 = cents
    elif effect_name == "rate":
        tfm.rate(effect_args)
    elif effect_name == "reverb":
        tfm.reverb(reverberance=effect_args)
    
    with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as f:
        out_path = f.name
    tfm.build(input_wav, out_path)
    return out_path

Sox مفيد أكثر لبناء محول صوت Raspberry Pi مع نمط push-to-talk - تسجيل عينة، تطبيق التأثير، تشغيله مرة أخرى - أكثر من البث الحقيقي في الوقت الفعلي. للبث المستمر في الوقت الفعلي لتغيير الصوت، فإن نهج PyAudio + NumPy + librosa أفضل.

تأثيرات Sox المفيدة لمشاريع الصوت

Effect	Sox Flag	Result
Pitch shift	`pitch +500`	+5 semitones (in cents)
Echo/delay	`echo 0.8 0.9 500 0.5`	Single 500ms echo
Reverb	`reverb 80`	Hall-sized reverb
Distortion	`overdrive 10`	Mild saturation
Tempo change	`tempo 0.85`	Slower without pitch change
Low-pass filter	`lowpass 3000`	Telephone voice quality
Bandpass	`band 1000 500`	CB radio / walkie-talkie

بناء المشروع: محول صوت خوذة Cosplay

هذا أحد أكثر تطبيقات محول صوت Raspberry Pi شيوعاً - خوذة قابلة للارتداء أو قناع يحول صوت مرتديها لمطابقة الشخصية. فكر في Iron Man أو Mandalorian أو stormtrooper أو أي شخصية روبوت/أندرويد.

قائمة المكونات

Raspberry Pi 4 (2 GB) أو Pi Zero 2W للبناء الصغير
بطارية USB (10,000 mAh للعملية متعددة الساعات)
ميكروفون USB مضغوط (Fifine K669B أو ميكروفون lapel USB عام)
محول صوت USB صغير (لإخراج سماعة الرأس)
2× مكبر صوت بقوة 3 واط + لوحة مضخم Class D صغيرة
مفتاح تبديل للتشغيل/الإيقاف
صندوق الخوذة/القناع المطبوع ثلاثي الأبعاد أو التجاري

الأسلاك

بطارية الطاقة → Pi USB-C power input
ميكروفون USB → Pi USB port
محول صوت USB → Pi USB port
إخراج سماعة الرأس → لوحة المضخم → مكبرات الصوت المثبتة في الخوذة

حافظ على كابلات USB قصيرة (تحت 30 سم) لتقليل التداخل الكهرومغناطيسي الذي يمكن أن يظهر كهسهسة على أجهزة الصوت USB الرخيصة.

سكريبت Python لخوذة الإقلاع

أنشئ /home/pi/voicechanger/helmet.py مع وظيفة صوت الروبوت الخاصة بك، ثم أنشئ خدمة systemd التي تبدأها عند الإقلاع:

# /etc/systemd/system/helmet-voice.service
[Unit]
Description=Helmet Voice Changer
After=sound.target

[Service]
User=pi
WorkingDirectory=/home/pi/voicechanger
ExecStart=/home/pi/voicechanger/venv/bin/python helmet.py
Restart=on-failure
RestartSec=3

[Install]
WantedBy=multi-user.target

تفعيل مع sudo systemctl enable helmet-voice.service. Pi يقلع ويبدأ محول الصوت في حوالي 15 ثانية من التشغيل.

إعدادات صوت الشخصية

Character Type	Pitch Shift	Mod Freq	Extra Effect
Robot / android	-3 semitones	80 Hz	Light reverb
Iron Man (JARVIS)	-1 semitone	None	EQ: boost 1-3 kHz, slight compression
Stormtrooper	0 semitones	100 Hz	Bandpass 500-3000 Hz (walkie-talkie)
Darth Vader style	-4 semitones	40 Hz	Heavy reverb, deep bass boost
Alien / creature	+2 semitones	60 Hz	Ring mod + short echo

بناء المشروع: دعامة ألعاب عتيقة الصوت

دعامات الأحداث ألعاب عتيقة - فكر في صناديق صوت شخصيات لعبة 8-بت، تأثيرات صوت خزانة الألعاب، أو عدة صوت محمولة - هي حالة استخدام ممتازة أخرى لمحول صوت Raspberry Pi المدمج.

Pi Zero 2W في صندوق يشبه الخرطوشة، يعمل من بطارية LiPo صغيرة، يمكن أن يشغل مقاطع صوتية قصيرة أو تطبيق تأثيرات صوت في الوقت الفعلي. مع زر push-to-talk ومكبر صوت صغير، يصبح دعامة مستقلة لا تتطلب أي هاتف أو كمبيوتر محمول. إعداد الأجهزة مشابه لبناء الخوذة أعلاه لكن أبسط: قد تستخدم أجش piezo صغير لتأثيرات بسيطة أو مكبر صوت بقوة 1 واط لإخراج الصوت. يستمع سكريبت Python لضغطات زر GPIO لتشغيل إعدادات صوت مختلفة. للحصول على الإلهام في تأثيرات الصوت 8-بت والعتيقة، انظر محول صوت 8-بت.

بناء المشروع: صندوق صوت روبوت مستقل

دعامة روبوت أو شخصية متحركة تستفيد من Pi 4 في صندوق، تشغيل محول صوت دائم يمكن لأي شخص التحدث فيه. الإعداد واضح:

ميكروفون USB في موضع التقاط كلي الاتجاهات (أو وجهه حيث يقف الناس)
سكريبت Python دائم التشغيل (خدمة systemd)
إخراج صوت USB إلى مكبر صوت Bluetooth محمول أو مكبر صوت سلكي مع مضخم
تحريك LED أو servo اختياري عبر GPIO عند تجاوز مستوى الصوت عتبة

تحريك LED/servo الذي يتم تشغيله بمستوى الصوت هو إضافة شهيرة. PyAudio يوفر مستوى الصوت مباشرة من RMS لكل مخزن مؤقت:

rms = np.sqrt(np.mean(data**2))
is_speaking = rms > THRESHOLD   # set THRESHOLD by experiment

قم بتوصيل boolean is_speaking بإخراج GPIO وليس لديك روبوت يفتح “فمه” عندما يتحدث شخص ما فيه.

تحسين زمن التأخير لتغيير الصوت في الوقت الفعلي

الكمون هو التحدي الهندسي الرئيسي في أي محول صوت في الوقت الفعلي، Pi أو خلاف ذلك. يصبح إدراك الإنسان للتناقض المتزامن مع الشفاه ملحوظاً حول 50 ms ومزعجاً فوق 80 ms. لتطبيقات الصوت فقط (بدون فيديو)، الكمون حتى 150 ms مقبول؛ بالنسبة للمحادثة، أقل من 50 ms يشعر طبيعياً.

مصادر الكمون على Raspberry Pi

Source	Typical Value	Reducible?
ALSA input buffer	10-30 ms	Yes, reduce buffer size
Python processing (librosa, 1024 samples)	23 ms	Yes, reduce chunk size
ALSA output buffer	10-30 ms	Yes
USB audio roundtrip overhead	5-15 ms	Partially
Bluetooth audio (if used)	50-150 ms	No — avoid for real-time

نصائح الضبط

تقليل CHUNK: الذهاب من 2048 إلى 512 عينة يقطع كمون المعالجة من 46 ms إلى 12 ms في 44100 Hz. المقابل هو استدعاءات معاودة اتصال Python أكثر في الثانية، مما يزيد من حمل CPU.
استخدام sounddevice بدلاً من PyAudio: مكتبة sounddevice لها تكامل ALSA أنظف على Linux وغالباً ما تحقق كمون أقل مع عدم وجود underrun مخزن مؤقت.
تجنب librosa.load() داخل معاودة الاتصال: جميع الإعداد (معدل العينة، معاملات النموذج) يجب أن يحدث قبل بدء معاودة الاتصال الصوتية.
تعيين حاكم CPU للأداء: sudo cpufreq-set -g performance يمنع Pi من خنق CPU في منتصف التدفق.
استخدم محول صوت USB سلكي: Bluetooth يضيف 50-150 ms. صوت USB السلكي يضيف فقط 5-15 ms.

محول صوت Raspberry Pi مقابل البرنامج المخصص

إذا كان هدفك النهائي هو تغيير الصوت على Discord أو دردشة الألعاب أو Twitch أو تطبيقات Windows، فمن الجدير أن تكون واضحاً حول مشروع Pi المناسب مقابل أداة مخصصة لـ Windows.

Scenario	Raspberry Pi (Python)	Windows Dedicated Software
Cosplay helmet / wearable prop	Ideal	Not applicable
Tabletop robot prop	Ideal	Not applicable
Retro gaming prop / standalone	Ideal	Not applicable
Discord / game chat on Windows PC	Workaround (USB audio loopback)	Much simpler
Twitch / YouTube stream voice	Possible with JACK routing	VoxBooster or similar is simpler
AI voice conversion quality	Limited (Pi compute)	Much better (GPU/CPU on PC)
Latency on PC	40-80 ms on Pi	Under 10 ms on modern PC
Setup time	Hours	Minutes
Cost	$55-$80 (Pi alone)	Subscription or one-time

بالنسبة لأي شخص يبني دعامة أو ملابس قابلة للارتداء، Pi هو بالفعل الأداة الصحيحة ويعطيك هذا الدليل نقطة بداية كاملة. بالنسبة لأي شخص وصل هنا أثناء البحث عن محول صوت Discord أو البث وانتهى على برنامج تعليمي Pi بالصدفة - انظر خيار Windows أصلي بدلاً من ذلك. يقوم VoxBooster بإنشاء ميكروفون افتراضي مباشرة في رسم بياني الصوت Windows، معالجة مع زمن تأخير أقل من 10ms، ويستغرق حوالي خمس دقائق للإعداد. يمكنك أيضاً أن تنظر إلى محول صوت Linux إذا كنت تقوم بتشغيل جهاز البث على Linux بدلاً من Windows.

بالنسبة لمشاريع عملية لا تتعلق بـ Raspberry Pi على الإطلاق، برنامج تعليمي محول صوت Audacity يغطي التعديل الطبقي غير المتصل، و ألعاب ودعامات محول الصوت يغطي خيارات الأجهزة المدمجة مسبقاً لـ cosplay.

بالنسبة لمشاريع قائمة على microcontroller مع عوامل شكل أصغر حتى، انظر محول صوت Arduino - النهج مختلف (Arduino يتعامل مع تأثيرات أبسط وتناظرية) لكن حالات الاستخدام تتداخل في بناء الدعائم.

الأسئلة المتكررة

هل يمكن لـ Raspberry Pi تشغيل محول صوت في الوقت الفعلي؟

نعم. Raspberry Pi 4 أو 5 لديه قوة CPU كافية لتشغيل تحويل الطبقة الخفيفة مع PyAudio و Sox بزمن تأخير 20-40 ms. تحويل الصوت العصبي AI أثقل ويتطلب إما Pi 5 أو خطوة استدلال مفرغة، لكن تأثيرات الطبقة الأساسية والصيغة وصوت الروبوت تعمل بشكل مريح في الوقت الفعلي على Pi 4.

ما أفضل ميكروفون USB يعمل مع Raspberry Pi لتغيير الصوت؟

أي ميكروفون USB يفضح واجهة معايير USB Audio Class (UAC) سيعمل بدون تثبيت برامج تشغيل إضافية على Raspberry Pi OS. تشمل الخيارات الشهيرة Blue Snowball iCE و Fifine K669B و Samson Go Mic. تجنب الميكروفونات التي تتطلب برامج تشغيل Windows ملكية - لن تعمل على Linux.

ما مكتبات Python التي أحتاجها لمحول صوت Raspberry Pi؟

المكدس الأساسي هو PyAudio (I/O الصوتي)، NumPy (رياضيات المصفوفات)، وإما librosa (تحليل طيفي وتحويل الطبقة) أو pysox (وصلات Sox) للتحولات. للحصول على جودة تحويل طبقة مثل Rubberband، ثبت pyrubberband بالإضافة إلى حزمة نظام rubberband-cli. SoundDevice هو بديل أنظف لـ PyAudio لـ ALSA على Linux.

كيف يمكنني تقليل زمن التأخير في محول صوت Python على Raspberry Pi؟

استخدم أحجام مخزن مؤقت صوتية صغيرة (512 أو 1024 عينة في 44100 Hz يعطي 12-23 ms). معالجة في إطارات متداخلة قصيرة مع نافذة Hann. تجنب librosa’s load() داخل معاودة الاتصال الصوتية - احسب المعاملات مسبقاً خارجاً. Sox عبر subprocess يضيف تكلفة الأنابيب؛ فضل المكتبات في العملية للحصول على أقل تأخير.

هل يمكنني استخدام محول صوت Raspberry Pi لبناء Cosplay أو الدعائم؟

بالتأكيد. Pi Zero 2W أو Pi 4 يناسب داخل خوذة أو صندوق دعائم، مدعوم ببطارية USB. قم بتوصيل ميكروفون USB داخل الخوذة، قم بتشغيل سماعة صغيرة أو إخراج صوت Bluetooth، وقم بتشغيل سكريبت محول الصوت Python عند الإقلاع عبر خدمة systemd. يمكن للوحدة بأكملها أن تعمل بدون رأس بدون لوحة مفاتيح أو شاشة.

ما الفرق بين تحويل الطبقة وتحويل الصوت على Raspberry Pi؟

تحويل الطبقة يغير التردد الأساسي لإشارة الصوت، مثل رفع أو خفض الطبقة الموسيقية. يحل تحويل الصوت محل خصائص صوتية صوتية واحدة بأخرى باستخدام نماذج التعلم الآلي. يعمل تحويل الطبقة في الوقت الفعلي على أي Pi 4؛ يتطلب تحويل الصوت استدلال أثقل ويعمل بشكل أفضل على Pi 5 أو مع معجل USB مثل Google Coral.

هل يعمل VoxBooster على Raspberry Pi؟

لا. VoxBooster هو تطبيق سطح مكتب Windows 10/11 ويعمل على أجهزة x86-64. بالنسبة لمشاريع Linux أو Raspberry Pi، فإن خطوط أنابيب قائمة على Python مع PyAudio و librosa و rubberband هي الطريقة الصحيحة. إذا كان هدفك النهائي هو إعداد Discord أو البث على جهاز Windows، فإن VoxBooster خيار أبسط وأقل كمون.

الخلاصة

محول صوت Raspberry Pi هو أحد أكثر المشاريع الصوتية المدمجة رضا يمكنك بناؤها - الأجهزة رخيصة، ومكتبة Python لـ DSP الصوت نضجة، والنتائج النهائية تتراوح من بناءات دعائم وظيفية إلى تثبيتات تفاعلية مثيرة للإعجاب حقاً. خط الأنابيب الأساسي (PyAudio → معالجة NumPy → PyAudio out) يحصلك على التشغيل في أقل من ساعة. إضافة pyrubberband ترفع الجودة بشكل ملحوظ، وبناء كل شيء في خدمة systemd يجعل الشيء كله يقلع تلقائياً مثل جهاز المستهلك.

Pi 4 يصل إلى حده مع تحويل الصوت العصبي الثقيل، لكن لتحويل الطبقة وتعديل الحلقة وصوت الروبوت وتأثيرات الشخصيات لديه أكثر من كافية قوة حصان. إذا تجاوزت Pi، نفس كود Python يعمل على أي جهاز Linux - والمفاهيم تنقل مباشرة إلى فهم ما تفعله الأدوات المخصصة مثل VoxBooster تحت الغطاء عندما تحقق كمون أقل من 10 ميلي ثانية على Windows مع تحويل صوت AI كامل.

بناء الخوذة. قم بتشغيل الروبوت. اخرج الدعامة في المؤتمر القادم.

تنزيل VoxBooster - تجربة مجانية مدتها 3 أيام لـ Windows، بدون الحاجة إلى بطاقة ائتمان.