Sprachsynthesesystem HADIFIX

HADIFIX

Universität Bonn ,Institut für Kommunikationsforschung und Phonetik

Das Sprachsynthesesystem HADIFIX erzeugt aus normaler Schrift gesprochene Sprache. Bei der Entwicklung stand eine möglichst gute Qualität der Ausgabe im Vordergrund. Hierzu trägt die Art und Weise der eigentlichen Synthese entscheidend bei. Einsatzbereiche sind Ansagedienste, Dialogsysteme, Blindenarbeitsplätze usw.

Das Sprachsynthesesystem HADIFIX ist am Institut für Kommunikationsforschung und Phonetik der Universität Bonn entwickelt worden. Es erzeugt aus einer orthographischen Eingabe ein Sprachsignal. Zuerst wird die Eingabe in Lautschrift umgesetzt und symbolisch eine Betonung und eine Phrasierung erzeugt. Bei der eigentlichen Synthese wird auf eine Bibliothek von kleinen Abschnitten natürlicher Sprache zugegriffen; diese Abschnitte werden aneinandergehängt. Als Sprachabschnitte werden Halbsilben und ähnliche Einheiten verwendet; sie umfassen alle Konsonanten vor dem Vokal und den Anfang des Vokals (Anfangshalbsilbe) bzw. das Ende des Vokals und die folgenden Konsonanten (Endhalbsilbe). Das Wort 'Strolch' wird beispielsweise aus 'Stro' und 'olch' gebildet.

Zur Erzeugung von Sprache muß nicht nur die Lautfolge wiedergegeben werden, also was man spricht, es muß auch gesteuert werden, wie man spricht. Hierzu gehört die Betonung und die Phrasierung. Im wesentlichen wirkt hier die Tonhöhe als Parameter. Sie fällt während einer Äußerung ab (Deklination), Steigt aber bei vielen Fragen am Ende noch einmal stark an. Auch werden betonte Silben höher als unbetonte gesprochen. Den 'Singsang' einer Sprache adäquat zu modellieren, das gehört zu den größten Problemen bei der Sprachsynthese. Bei HADIFIX wird hier ein Verfahren eingesetzt, so daß bei jeder betonten Silbe die Tonhöhe ansteigt; dadurch wird die Silbe auch tatsächlich als betont wahrgenommen.

telepolis@mlm.extern.lrz-muenchen.de