Texte online in Sprache umwandeln

Heute will ich Euch mein kleines Projekt OTAC vorstellen.

OTAC (Online Text to Audio Converter) ist ein auf Linux und Open Source Software basierender Webservice, der Texte online in gesprochene Sprache umwandelt:

otac1 windows web service wav umwandlung text2speech sprachroboter sprache skript shell script robo otac open source linux language internet free service free firefox festival convert browser bash audio

In einem Artikel im September 2009 (“Wir basteln uns einen Sprachroboter“) habe ich ja mal eine einfache Methode vorgestellt (“robo”, mehr Infos im Artikel und auf der Homepage), wie man mit Hilfe der Software Festival Texte in Sprache umwandeln kann (auch skriptgesteuerte, dynamisch erzeugte Texte). Um sich z.B. die aktuelle Kernelversion vorlesen zu lassen, würde man das Skript robo z.B. so nutzen:

robo `uname -r`

Lässt sich auch alles schön mit Cron kombinieren. Diese Methode ist auch für Linux-Einsteiger eine wirklich simple Angelegenheit und in ca. 5 Minuten eingerichtet.

Manch einer will aber nur mal schnell einen kurzen Text in Sprache umwandeln, z.B. um die Mitteilung beim Erhalt einer E-Mail anzupassen (“Attention: New mail!“). Oder es fehlt ihm an grundlegendem Wissen über Linux bzw. er nutzt gar ein anderes Betriebssystem, wie z.B. Windows.

Da ist es natürlich praktischer, auf einer Webseite einfach nur einen Text einzugeben und ihn umgehend in eine Audio-Datei umgewandelt zu bekommen. Und das ist genau das, was OTAC (hoffentlich) tut.

Eine bahnbrechende Neuheit ist das natürlich nicht. Ähnliche Angebote gibt es im Netz schon länger.

otac2 windows web service wav umwandlung text2speech sprachroboter sprache skript shell script robo otac open source linux language internet free service free firefox festival convert browser bash audio

Und so funktioniert’s hinter den Kulissen (verkürzt dargestellt):

Die Texteingabe wird importiert, gefiltert und dann weitergeleitet. Der gefilterte Text bekommt eine 16-stellige Zufalls-ID zugeordnet. Dann wird der Text (ähnlich wie bei “robo”) in eine WAV-Datei umgewandelt und gespeichert (mit der ID im Dateinamen). Ein HTML-Code wird generiert, der dem Nutzer als Rückmeldung einen Link zu seiner Audio-Datei präsentiert, die er dann herunterladen kann oder (entsprechende Unterstützung durch den Browser vorausgesetzt) direkt abspielen kann.

Einschränkungen: OTAC ist beta und nutzt eine englische männliche Stimme. Wer also deutsche Texte eingibt, wird keine realistischen Ergebnisse bekommen (oder hat was zum Lachen). Selbst mit der englischen Sprache kann es vorkommen, dass das darunterliegende Sprachsynthesesystem von Festival schon mal eine eigenwillige Interpretation vornimmt. Auch werden etliche Sonderzeichen (noch) nicht korrekt erkannt.

Aktuell ist die Eingabe auf 256 Zeichen begrenzt. Bei einfach gehaltenen Texten in Englisch solltet ihr zu brauchbaren Ergebnissen kommen. Für Rückmeldungen zur (Nicht-)Funktion wäre ich dankbar, insbesondere zu Ladezeiten, Browserverhalten (Mobile Geräte?), sprachliche Unzulänglichkeiten usw.

Viel Spaß beim Testen auf otac.netz10.de!

Comments

  1. Ich finde google translate für solche Aufgaben sehr gut. Leider sind auch dort die Sprachausgaben auf wenige Zeichen begrenzt. Die Wiedergabe finde ich dort allerdings auch in deutsch verhältnismäßig “natürlich”.

Comments are closed