Benutzer-Werkzeuge

Webseiten-Werkzeuge


sprachausgabe

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

Link zu der Vergleichsansicht

Nächste Überarbeitung
Vorherige Überarbeitung
sprachausgabe [2019/12/01 16:32] – angelegt varnholtsprachausgabe [2025/01/30 22:12] (aktuell) – [PWM 3.5mm Klinke Problem] varnholt
Zeile 5: Zeile 5:
 Bei der Snips AI Sprachsteuerung habe ich gelernt, dass man die Ausgabedateien auf dem Raspberry puffern kann, damit man nicht jedes mal auf den Mac muss. Bei der Snips AI Sprachsteuerung habe ich gelernt, dass man die Ausgabedateien auf dem Raspberry puffern kann, damit man nicht jedes mal auf den Mac muss.
  
-Aktuell nutze ich das vorgehen aber nicht, sondern gebe die Sprache auf dem Bluetooth Lautsprecher aus. Falls der Mac nicht erreichbar ist, werde ich informiert und die Sprachausgabe geht vom Raspberry aus mittels ... war das espeak?+Aktuell nutze ich das vorgehen aber nicht, sondern gebe die Sprache auf dem Bluetooth Lautsprecher aus. Falls der Mac nicht erreichbar ist, werde ich informiert und die Sprachausgabe geht vom Raspberry aus mittels pico2waveIch fand espeak noch schlechter.
  
 +Normalerweise kommt nur ein Beep, wenn man 'Hey Snips' sagt. Das kann man in dem Ordner /usr/share/snips/assistant/custom_dialogue/sound/ ändern. Der ganze Ordner(!) wird aber bei einem Update überschrieben, also sichern.
 +
 +=== Tonausgabe an meinen Raspberries ===
 +
 +Auch ein Thema, dass irgendwie schwerer als gedacht ist. Am Pi3 ist jetzt eine Soundkarte dran (so ein USB-Stick) und zwei Micro-Ton-Würfel mit bescheidenem Sound. Die rauschten so lange, bis ich deren USB Strom Versorgung nicht mehr am Raspberry hatte. Den anderen Pi hatte ich mit einer günstigen Mono Bluetooth Kugel angeschlossen. Funktionierte hervorragend, auch wenn ich ein Script schreiben musste, dass die Verbindung immer mal wieder prüft oder wiederherstellt. Die hat diese Woche (Jan 2021) das Zeitliche gesegnet - Bluetooth geh noch, kommt aber kein Ton mehr raus. 
 +Als Alternative die "Boom 2" wieder ausgepackt. Ich wusste, dass die ein Problem hat und sich zum Stromsparen alle 10 Sekunden abschaltet. Erst wenn ca. 0,3 Sekunden Signale kommen, schaltet sie sich wieder ein. Bis mir was anderes einfällt, wird jetzt vor jede Sprachausgabe ein kurzes Schnipsel von 0,3 Sekunden gesetzt, damit man den eigentlichen Text auch ganz hört.
 +Da die Qualität der anderen Brüllwürfel so schlecht war, hab ich die Boom 2 dort angeschlossen. Nur, wie bekomme ich jetzt den Ton von einem auf den anderen Raspberry. Nach ein bisschen Forschung mache ich einfach einen 
 +<code>
 +cat /usr/share/scratch/Media/Sounds/Vocals/Sing-me-a-song.mp3|ssh pi@192.168.178.20 mpg123 -
 +</code>
 +Wie man ssh dazu bekommt, nicht nach dem Kennwort zu fragen habe ich im setup weit unten beschrieben.
 +
 +
 +==== espeak und mehr ====
 +Um 2025 auch chatGPT auf meinem rhasspy Rechner nutzen zu können, habe ich wieder klein angefangen und mit espeak experimentiert. Der Aufruf von espeak ging nicht über den angeschlossenen Lautsprecher, erst folgendes hat funktioniert.
 +<code>
 +aplay -L
 +espeak -vde "Hallo Welt" --stdout |aplay -D hw
 +</code>
 +Jetzt noch mbrola, also bessere Stimmen importieren - ging natürlich nicht, man musste
 +<code>
 +cd ~/espeak
 +wget https://raspberry-pi.fr/download/espeak/mbrola3.0.1h_armhf.deb -O mbrola.deb
 +sudo dpkg -i mbrola.deb
 +</code>
 +und dann
 +<code>
 +sudo apt install mbrola-de6 (beste deutsche männliche Stimme)
 +sudo apt install mbrola-de7 (beste deutsche weibliche Stimme)
 +espeak -vmb-de7 "Hallo Welt" --stdout |aplay -D hw
 +</code>
 +
 +==== espeak-ng und mehr ====
 +https://wiki.ubuntuusers.de/eSpeak_NG/
 +ist die Ablösung von espeak, habe es installiert, klingt aber genauso gut/schlecht
 +
 +
 +==== PWM 3.5mm Klinke Rauchen Hochfrequenz Problem ====
 +Der Lautsprecher wird von USB mit Strom versorgt. Die Tonausgabe geht über den Klinkenstecker. Man hört rauschen und teilweise die CPU arbeiten.
 +
 +USB Soundausgabe braucht zu viel CPU. Andere Ausgabe muss man kaufen. Entstörfilter in das Kabel (galvanische- magnetische- (?) Trennung) kostet 20€.
 +
 +ChatGPT schlug mir einen Tiefpassfilter mit falschen Werten vor, die Idee ist aber gut. DeepSeek kam auf andere werte. Gemeinsam kamen wir dann auf 10k und 1nF (Cutoff Frequenz 16kHz, wenn es stimmt was Chat sagt).
 +
 +Alternativ kam ich auf die Idee, Software Tiefpass einzustellen. Ich habe in ALSA 4kHz 8kHz und 16kHz reduziert, je höher, je mehr.
 +
 +<code>
 +sudo apt install libasound2-plugin-equal
 +nano ~/.asoundrc
 +  pcm.!default {
 +      type plug
 +      slave.pcm "equalized"
 +  }
 +  pcm.equalized {
 +      type equal
 +      slave.pcm "plughw:0,0"
 +  }
 +  ctl.equalized {
 +      type equal
 +  }
 +reboot
 +alsamixer -D equalized
 +</code>
 +
 +Andere Alternative, die ich noch nicht ausprobiert habe: LADSPA Plugins
 +* Find a low-pass filter plugin, such as lv2fil or caps.
 +* Load the filter using JACK or ALSA.
 +<code>
 +sudo apt install ladspa-sdk
 +ecasound -i alsa -o alsa -el:lowpass,1000,2 // 1000Hz low-pass filter with a slope of 2.
 +</code>
 +
 +(Stand Januar 2025)
 + 
sprachausgabe.1575217960.txt.gz · Zuletzt geändert: 2019/12/01 16:32 von varnholt