Spracherkennungsprogramme im Test
Diktieren statt Tippen
Hannover, 3. März 1998 - Um Texte
möglichst schnell auf den Bildschirm zu bekommen, brauchen Sie keinen
Finger mehr krumm zu machen. Mit modernen Spracherkennungssystemen
hört der Computer aufs Wort.
Die digitalen Assistenten erfassen das gesprochene Wort und können
zudem Programme starten, Dateien speichern oder Texte ausdrucken. Man
unterscheidet diskrete Spracherkenner, die nur einzelne Wörter
erkennen und eine stockende Sprechweise erfordern und kontinuierliche
Spracherkennungssysteme, die auch flüssig gesprochene Texte umsetzen
können.
Fünf digitale Schreibkräfte standen in der Redaktion der
Computerzeitschrift c't bereit zum Diktat: Drei diskrete
Spracherkennungssysteme: VoiceType, das im Betriebssystem OS/2
integriert ist, Voice Type Simply Speaking Gold 3.5, beide von IBM,
und Dragon Dictate von Dragon Systems. Außerdem wurden die
beiden kontinuierlichen Diktiersysteme Via Voice von IBM und
NaturallySpeaking von Dragon Systems unter die Lupe genommen.
Spracherkennungstools haben gewisse menschliche Züge - sie verstehen
nicht immer sofort und alles. Ohne ein gutes und immer gleich
positioniertes Mikrofon geht die Erkennungsleistung aller Sprachpakete in
die Knie. Auch spielt die vorhandene Hardware-Ausstattung eine nicht
unbedeutende Rolle. Jede bislang verfügbare Spracherkennungssoftware
verlangt Training, bevor man sie sinnvoll einsetzen kann. Die Software
muß sich mit den Eigenheiten der Sprechweise, der Aussprache und der
Stimme des Anwenders vertraut machen. Hat man ausreichend geübt,
meistert der Spracherkenner die allgemeine Korrespondenz jedoch recht
passabel. Anders sieht es mit Manuskripten aus, die mit Fachbegriffen
gespickt sind. Hier ist Geduld gefragt.
Wie leistungsfähig die inzwischen erschwinglichen Softwarepakete von
IBM und Dragon Systems sind, ist in der aktuellen Ausgabe 5/98 der c't
nachzulesen.
Alles in allem ist der berufliche oder private Einsatz von Diktiersystemen
auf dem PC nicht nur aufgrund der jüngsten Preissenkungen interessant:
Die Erkennungsleistungen aller getesteten Programme sind so hoch, daß
man bei größeren Textmengen von einer ernstzunehmenden
Arbeitserleichterung und Zeitersparnis sprechen kann. Von einem Umgang im
lockeren Plauderton ist man jedoch noch weit entfernt.
Ihre Ansprechpartnerin für Rückfragen
Ulrike Kuhlmann (c't-Redaktion)
Telefon: 05 11/53 52-300
Fax: 05 11/53 52-417
E-Mail: uk@ct.heise.de