Entwicklungen

Dies ist eine alte Version des Dokuments!

Sprachausgabe

Der Textstring wird an einen Node-Server auf meinem iMac geschickt. Dort wird 'say' aufgerufen und das mp3-File wieder zurück geliefert. Damit erreiche ich eine hohe Qualität der Sprache, ohne ins Internet zu gehen.

Bei der Snips AI Sprachsteuerung habe ich gelernt, dass man die Ausgabedateien auf dem Raspberry puffern kann, damit man nicht jedes mal auf den Mac muss.

Aktuell nutze ich das vorgehen aber nicht, sondern gebe die Sprache auf dem Bluetooth Lautsprecher aus. Falls der Mac nicht erreichbar ist, werde ich informiert und die Sprachausgabe geht vom Raspberry aus mittels pico2wave. Ich fand espeak noch schlechter.

Normalerweise kommt nur ein Beep, wenn man 'Hey Snips' sagt. Das kann man in dem Ordner /usr/share/snips/assistant/custom_dialogue/sound/ ändern. Der ganze Ordner(!) wird aber bei einem Update überschrieben, also sichern.

Tonausgabe an meinen Raspberries

Auch ein Thema, dass irgendwie schwerer als gedacht ist. Am Pi3 ist jetzt eine Soundkarte dran (so ein USB-Stick) und zwei Micro-Ton-Würfel mit bescheidenem Sound. Die rauschten so lange, bis ich deren USB Strom Versorgung nicht mehr am Raspberry hatte. Den anderen Pi hatte ich mit einer günstigen Mono Bluetooth Kugel angeschlossen. Funktionierte hervorragend, auch wenn ich ein Script schreiben musste, dass die Verbindung immer mal wieder prüft oder wiederherstellt. Die hat diese Woche (Jan 2021) das Zeitliche gesegnet - Bluetooth geh noch, kommt aber kein Ton mehr raus. Als Alternative die „Boom 2“ wieder ausgepackt. Ich wusste, dass die ein Problem hat und sich zum Stromsparen alle 10 Sekunden abschaltet. Erst wenn ca. 0,3 Sekunden Signale kommen, schaltet sie sich wieder ein. Bis mir was anderes einfällt, wird jetzt vor jede Sprachausgabe ein kurzes Schnipsel von 0,3 Sekunden gesetzt, damit man den eigentlichen Text auch ganz hört. Da die Qualität der anderen Brüllwürfel so schlecht war, hab ich die Boom 2 dort angeschlossen. Nur, wie bekomme ich jetzt den Ton von einem auf den anderen Raspberry. Nach ein bisschen Forschung mache ich einfach einen

cat /usr/share/scratch/Media/Sounds/Vocals/Sing-me-a-song.mp3|ssh pi@192.168.178.20 mpg123 -

Wie man ssh dazu bekommt, nicht nach dem Kennwort zu fragen habe ich im setup weit unten beschrieben.

espeak und mehr

Um 2025 auch chatGPT auf meinem rhasspy Rechner nutzen zu können, habe ich wieder klein angefangen und mit espeak experimentiert. Der Aufruf von espeak ging nicht über den angeschlossenen Lautsprecher, erst folgendes hat funktioniert.

aplay -L
espeak -vde "Hallo Welt" --stdout |aplay -D hw

Jetzt noch mbrola, also bessere Stimmen importieren - ging natürlich nicht, man musste

cd ~/espeak
wget https://raspberry-pi.fr/download/espeak/mbrola3.0.1h_armhf.deb -O mbrola.deb
sudo dpkg -i mbrola.deb

und dann

sudo apt install mbrola-de6 (beste deutsche Stimme)
espeak -vmb-de6 "Hallo Welt" --stdout |aplay -D hw

(Stand Januar 2021)