30 Oktober 2007

Fernsehbeitrag: Ratgeber Technik - Computer zum Diktat! - Möglichkeiten und Grenzen aktueller Spracherkennungssoftware

Am 27.3. lief im Ersten der ARD Ratgeber Technik mit einem Beitrag über "Computer zum Diktat! - Möglichkeiten und Grenzen aktueller Spracherkennungssoftware".

Erste Reaktion: Können die sich eigentlich mal einen anderen Titel für solche Beiträge einfallen lassen? "Computer zum Diktat" ist ungefähr so originell wie "Lufthansa-Aktie im Sinkflug". Nächste Reaktion: Lach- und Sachgeschichten für Erwachsene. Wie Computer und Sekretärin im Boxring gegeneinander antreten, ist für einen öffentlich-rechtlichen Sender grenzwertig. Aber egal, schauen wir auf den Inhalt -

- und da zeigt sich, dass der Tester das Expertenwissen eines, nun ja, Journalisten an den Tag legt. No offence meant, aber offenbar hat er sich mal ein paar Tage oberflächlich mit Spracherkennung auseinandergesetzt und dabei mehr Energie in die Präsentation gesteckt als in die Recherche. Dem geübten Auge entgeht z.B. nicht, dass er für die ersten beiden Tests betont langsam diktiert, um den Rechner dann mit einem - seiner Meinung nach extrem schnellen - Diktat aus dem Konzept zu bringen.

Ich kann dazu nur sagen: Abgesehen davon, dass ich keine Schlagertexte diktiere, spreche ich normalerweise so schnell wie er im "Härtetest" und habe eine sehr gute Erkennung. Wenn man aber beim Ablesen des Trainingstextes langsam liest und auch sonst langsam diktiert, wird eine Spracherkennung beim schnellen Sprechen Schwierigkeiten haben müssen - wie übrigens auch umgekehrt. Wenn ich schnell vorlese und danach langsam diktiere, erkent mein Drache mich auch nur halb so gut. Aber wie heißt es in dem Teil des Trainingstextes, der nur von uns Schnellesern erreicht wird: "Das wichtigste ist eine deutliche und konstante Aussprache. Versuchen Sie, Ihre Gedanken zu ordnen, bevor Sie mit dem Diktieren beginnen" - ein Rat, der übrigens für alle Textproduzenten gilt :-)

Ein Test der Rechtschreibung ist völlig am Thema vorbei. Wenn ich Kunden beeindrucken will, lasse ich den Computer "schwierige Wörter" erkennen. Wenn ich zeigen wollte, was die Spracherkennung nicht kann, nehme ich "einfache", alltägliche Wörter, die ähnlich wie andere häufige Wörter klingen - "einen" vs."einem" zum Beispiel.

Spracherkennung macht systembedingt keine Tippfehler! Ich habe schon Schreibkräfte gesehen, die das Dragon-Wörterbuch zum Nachschlagen benutzen. Natürlich muss das Programm die Wörter kennen - aber das ist bei einer Sekretärin auch nicht anders.

Und jetzt grundsätzlich: "Mensch gegen Maschine"-Kämpfe, erst recht gegen Spitzenleister, sind so alt wie die mAschinen. Ich erinnere nur mal an John Henry. Und dass die Sekretärin mit "jahrelanger Erfahrung" von der Software eingeholt wird, weist doch eher darauf hin, dass sie so gut ist wie eine Sekretärin - Training vorausgesetzt, von Spracherkennung, Diktant und Sekretärin. Insofern ist das Fazit der Sendung nur zum Schein beruhigend - der Mensch hat gewonnen, weil die Versuchsanordnung auf ihn abgestimmt war.

Und der zitierte Praxistest (im Begleittext) ist auch wenig aussagekräftig: wer aus genau einem Beispiel eine Regel herleiten will, hat wenig von Statistik verstanden. Da muss man schon mehr analysieren - aber wer tut das schon? Zugegebenermaßen hat außer den Herstellern keiner ein Interesse daran, und die werden nur eindeutig für sie positive Daten veröffentlichen.

Mein Fazit zum Beitrag lautet: wer nur konsequent die falschen Kriterien anlegt, erhält das schlechte Ergebnis, das er erwartet. Aber was erwartet man von jemand, der die Spracherkennung unter Vista erst gar nicht ans Laufen bekommt?

(Dank an Ronny Jaekel u.a. für Input)

1 Kommentar:

MeyerK hat gesagt…

Danke für Ihr Blog... lese regelmäßig mit und lerne immer wieder Neues. Die Vorurteile gegenüber der Spracherkennung höre ich auch immer wieder, ich selber bin aber mit dem Drachen sehr zufrieden. Ich habe das Gefühl, dass die Leute einfach nicht bereit sind, das Training zu akzeptieren... die Hersteller wiederum sind nicht ehrlich, wenn sie behaupten, die Software wäre auch ohne Training sofort voll einsatzbereit... ich habe ungefähr ein halbes Jahr gebraucht, bis ich eine vernünftige Erkennungsleistung hatte.

Danke und weiter so!
K.Meyer