Der Mannheimer Morgen, auflagenstärkste Tageszeitung der Metropolregion Rhein-Neckar, berichtet am 05.03.14 über „Alex“, Aristechs Computerstimme.

In der Rubrik „IT“ zeigt sich das Blatt beeindruckt über die Qualität und Verbreitung der in Heidelberg entwickelten synthetischen Stimme, die beispielsweise auch für Stauhotlines der größten öffentlich-rechtlichen Radiosender eingesetzt wird.

Hier der gesamte Text des Artikels:

Die menschliche Computerstimme
Wer die SWR-Stauhotline anruft, hat „Alex“ am Apparat – kein Mitarbeiter, sondern eine Software von Aristech aus Heidelberg.

VON LARA FEDER

Sein Wortschatz erweitert sich jeden Tag. Inzwischen kennt „Alex“ nicht nur die meisten Orte in Süddeutschland, sondern weiß auch, wie er mit Müllerwik, Itzehoe und Zurow
umzugehen hat. Denn mittlerweile vertont „Alex“, die Computerstimme der Firma Aristech, nicht nur Verkehrsmeldungen für die SWRHotline, sondern auch für den Norddeutschen Rundfunk (NDR).

Die Wiege seiner Worte ist ein Büro im Heidelberger Stadtteil Rohrbach. Dort hat Sprecher Alexander Edler, nach dem die Computerstimme benannt ist, mehr als 3000 Sätze eingesprochen. Nach dem Baukastenprinzip lassen sich daraus alle Wörter entnehmen und wieder neu zusammensetzen. „Je mehr Sätze gespeichert sind, desto besser ist es. Dann wird es genauer“, erklärt Aristech-Gründer und -Geschäftsführer Michael Mende, der ursprünglich Germanist ist.

Richtig betont trägt „Alex“ jetzt nicht nur Staumeldungen aus dem Effeff vor. Kürzlich hat ihm Mende auch Rebsorten beigebracht – als Spielerei und aus Interesse. „Chardonnay“, „Merlot“ und „Bordeaux“ sind schon für manchen Menschen eine Herausforderung.  Für eine Software, die nur Rechenbefehle kennt und auf jede Ausnahme programmiert werden muss, erst recht. Per Mausklick verlängert Mende die letzte Silbe. „Bordoo“, tönt „Alex“ aus den Lautsprechern und zieht das „O“ dabei zu sehr in die Länge. Kein Problem, Mende klickt noch einmal am Regler. Und schon bringt „Alex“ ein wohlgeformtes „Bordo“ hervor. „Seine Worte menscheln, oder?“, fragt Michael Mende. „Viele Anrufer erkennen gar nicht, dass sie mit einem  Computer telefonieren. Das liegt an Kleinigkeiten, die ins Gewicht fallen.“ Bei einer Falschfahrer- Meldung zum Beispiel ist das Tempo etwas schneller als sonst. „Beinahe panisch hört sich das dann an“, sagt Mendes Tochter Carolin. Die Diplom- Mathematikerin ist seit 2010  im Projekt-Management der Firma tätig. Als „wahnsinnig spannend“ bezeichnet sie den deutschen Markt.

Während Sprachsoftware in anderen Ländern schon früher boomte, wussten hierzulande bislang vor allem Menschen mit Behinderung diese Technik für sich zu nutzen. Carolin Mende führt die allgemeine Zurückhaltung auf Berührungsängste mit Maschinen und auf eine zu geringe Toleranz bei Fehlern zurück. Denn für einen Sprachcomputer gehört Deutsch mit zu den schwersten Sprachen: Konjugationen und  Deklinationen sorgen dafür, dass die Anzahl der Wortvariationen sehr hoch ist. „Wenn man nur mal den eher seltenen Begriff ,Lebensart’ nimmt – im Englischen setzt der sich aus drei getrennten häufig vorkommenden Worten zusammen: ,way of living’“, erklärt Mende. In Deutschland holt die Industrie nun im Eiltempo auf. „Steve Jobs Text hatte da mit der Spracherkennungssoftware ,Siri‘ quasi eine weltweite Schlüsselfunktion.“

Längst gehören Stimmen zur Corporate Identity. Und als Teil der Firmenidentität soll dieselbe Stimme auf allen Kanälen zu hören sein: bei einem Verkehrsunternehmen beispielsweise nicht nur als Ansage im Fahrzeug, sondern auch bei sprechenden Automaten und erst recht an der Hotline. Ohne Sprachsoftware – nur mit  einem Sprecher – kaum machbar.

Die Technik kann auch im Beruf Erleichterung bieten: Ganz ohne Tippen könnten etwa Ärzte in Zukunft bei der Visite im Krankenhaus Blutdruck, Puls oder Temperatur dokumentieren. Eine entsprechende Anwendung (App) fischt sich aus dem Gesprochenen die Informationen und pflegt sie in eine Datenbank ein. Spracherkennung und Text-to-Speech-Optionen kommen auch in Autos immer häufiger zum Einsatz: „Alex“ liest während der Fahrt Textnachrichten vor, der Fahrer kann seine Antwort diktieren. Mittlerweile holpert die Betonung von „Alex“ kaum mehr. Verständigungsschwierigkeiten bereite eher die Gegenseite, erzählt Mende lachend: „Wenn Leute, die Dialekt sprechen, versuchen dem Sprachcomputer ihren Namen auf Hochdeutsch zu diktieren, versteht der oft gar nichts mehr. Wenn sie einfach frei von der Leber weg schwätzen,
macht das weniger Probleme.“

Aristech
Michael Mende studierte in Heidelberg Germanistik und wollte zunächst Schriftsteller werden – entdeckte dann aber die Computerlinguistik für sich.  Seit zehn Jahren bietet seine Firmengruppe Software vor allem für Spracherkennung und Text-to-Speech-Lösungen, also die Vertonung von Schriftdokumenten wie etwa Staunachrichten an. Die Firma Aristech gibt es seit fast zwei Jahren. Sie beschäftigt acht Mitarbeiter, darunter vor allem Computerlinguisten, aber auch Physiker.  Zu den Kunden gehören neben SWR, WDR und NDR, deren Stau-Hotlines „Alex“ seine Stimme leiht, unter anderem auch SAP (Software für Krankenhäuser) und Kabel-BW (Kundenhotline). laf