sprachausgabe
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Nächste Überarbeitung | Vorherige Überarbeitung | ||
sprachausgabe [2019/12/01 16:32] – angelegt varnholt | sprachausgabe [2025/01/30 22:12] (aktuell) – [PWM 3.5mm Klinke Problem] varnholt | ||
---|---|---|---|
Zeile 5: | Zeile 5: | ||
Bei der Snips AI Sprachsteuerung habe ich gelernt, dass man die Ausgabedateien auf dem Raspberry puffern kann, damit man nicht jedes mal auf den Mac muss. | Bei der Snips AI Sprachsteuerung habe ich gelernt, dass man die Ausgabedateien auf dem Raspberry puffern kann, damit man nicht jedes mal auf den Mac muss. | ||
- | Aktuell nutze ich das vorgehen aber nicht, sondern gebe die Sprache auf dem Bluetooth Lautsprecher aus. Falls der Mac nicht erreichbar ist, werde ich informiert und die Sprachausgabe geht vom Raspberry aus mittels ... war das espeak? | + | Aktuell nutze ich das vorgehen aber nicht, sondern gebe die Sprache auf dem Bluetooth Lautsprecher aus. Falls der Mac nicht erreichbar ist, werde ich informiert und die Sprachausgabe geht vom Raspberry aus mittels |
+ | Normalerweise kommt nur ein Beep, wenn man 'Hey Snips' sagt. Das kann man in dem Ordner / | ||
+ | |||
+ | === Tonausgabe an meinen Raspberries === | ||
+ | |||
+ | Auch ein Thema, dass irgendwie schwerer als gedacht ist. Am Pi3 ist jetzt eine Soundkarte dran (so ein USB-Stick) und zwei Micro-Ton-Würfel mit bescheidenem Sound. Die rauschten so lange, bis ich deren USB Strom Versorgung nicht mehr am Raspberry hatte. Den anderen Pi hatte ich mit einer günstigen Mono Bluetooth Kugel angeschlossen. Funktionierte hervorragend, | ||
+ | Als Alternative die "Boom 2" wieder ausgepackt. Ich wusste, dass die ein Problem hat und sich zum Stromsparen alle 10 Sekunden abschaltet. Erst wenn ca. 0,3 Sekunden Signale kommen, schaltet sie sich wieder ein. Bis mir was anderes einfällt, wird jetzt vor jede Sprachausgabe ein kurzes Schnipsel von 0,3 Sekunden gesetzt, damit man den eigentlichen Text auch ganz hört. | ||
+ | Da die Qualität der anderen Brüllwürfel so schlecht war, hab ich die Boom 2 dort angeschlossen. Nur, wie bekomme ich jetzt den Ton von einem auf den anderen Raspberry. Nach ein bisschen Forschung mache ich einfach einen | ||
+ | < | ||
+ | cat / | ||
+ | </ | ||
+ | Wie man ssh dazu bekommt, nicht nach dem Kennwort zu fragen habe ich im setup weit unten beschrieben. | ||
+ | |||
+ | |||
+ | ==== espeak und mehr ==== | ||
+ | Um 2025 auch chatGPT auf meinem rhasspy Rechner nutzen zu können, habe ich wieder klein angefangen und mit espeak experimentiert. Der Aufruf von espeak ging nicht über den angeschlossenen Lautsprecher, | ||
+ | < | ||
+ | aplay -L | ||
+ | espeak -vde "Hallo Welt" --stdout |aplay -D hw | ||
+ | </ | ||
+ | Jetzt noch mbrola, also bessere Stimmen importieren - ging natürlich nicht, man musste | ||
+ | < | ||
+ | cd ~/espeak | ||
+ | wget https:// | ||
+ | sudo dpkg -i mbrola.deb | ||
+ | </ | ||
+ | und dann | ||
+ | < | ||
+ | sudo apt install mbrola-de6 (beste deutsche männliche Stimme) | ||
+ | sudo apt install mbrola-de7 (beste deutsche weibliche Stimme) | ||
+ | espeak -vmb-de7 "Hallo Welt" --stdout |aplay -D hw | ||
+ | </ | ||
+ | |||
+ | ==== espeak-ng und mehr ==== | ||
+ | https:// | ||
+ | ist die Ablösung von espeak, habe es installiert, | ||
+ | |||
+ | |||
+ | ==== PWM 3.5mm Klinke Rauchen Hochfrequenz Problem ==== | ||
+ | Der Lautsprecher wird von USB mit Strom versorgt. Die Tonausgabe geht über den Klinkenstecker. Man hört rauschen und teilweise die CPU arbeiten. | ||
+ | |||
+ | USB Soundausgabe braucht zu viel CPU. Andere Ausgabe muss man kaufen. Entstörfilter in das Kabel (galvanische- magnetische- (?) Trennung) kostet 20€. | ||
+ | |||
+ | ChatGPT schlug mir einen Tiefpassfilter mit falschen Werten vor, die Idee ist aber gut. DeepSeek kam auf andere werte. Gemeinsam kamen wir dann auf 10k und 1nF (Cutoff Frequenz 16kHz, wenn es stimmt was Chat sagt). | ||
+ | |||
+ | Alternativ kam ich auf die Idee, Software Tiefpass einzustellen. Ich habe in ALSA 4kHz 8kHz und 16kHz reduziert, je höher, je mehr. | ||
+ | |||
+ | < | ||
+ | sudo apt install libasound2-plugin-equal | ||
+ | nano ~/.asoundrc | ||
+ | pcm.!default { | ||
+ | type plug | ||
+ | slave.pcm " | ||
+ | } | ||
+ | pcm.equalized { | ||
+ | type equal | ||
+ | slave.pcm " | ||
+ | } | ||
+ | ctl.equalized { | ||
+ | type equal | ||
+ | } | ||
+ | reboot | ||
+ | alsamixer -D equalized | ||
+ | </ | ||
+ | |||
+ | Andere Alternative, | ||
+ | * Find a low-pass filter plugin, such as lv2fil or caps. | ||
+ | * Load the filter using JACK or ALSA. | ||
+ | < | ||
+ | sudo apt install ladspa-sdk | ||
+ | ecasound -i alsa -o alsa -el: | ||
+ | </ | ||
+ | |||
+ | (Stand Januar 2025) | ||
+ |
sprachausgabe.1575217960.txt.gz · Zuletzt geändert: 2019/12/01 16:32 von varnholt