27 November 2007

FAZ, 27.11.2007: Spracherkennung als Erfolgsgeschichte

Die FAZ berichtet heute über das derzeit wohl größte Spracherkennungsprojekt Deutschlands: die Ausstattung von ca. 900 Richtern im Lande Hessen mit Spracherkennung durch die 4voice AG.

Entstanden ist der Artikel bei einer Schulung, die ich vor ein paar Wochen gehalten habe. Bei diesen Schulungen werden Richter als Multiplikatoren ausgebildet, die dann in ihren Dienststellen das Training und die Schulung weiterer Richter durchführen sollen.

Dort nahm man kein Blatt vor den Mund: Spracherkennung soll die durch massiven Personalabbau extrem gestiegene Belastung der sog. Serviceeinheiten (d.h. Schreibbüros) reduzieren, die Richter möglichst viel der anfallenden Arbeiten selbst erledigen. Dass dies nicht überall auf Gegenliebe stößt, ist zu erwarten; bei dem Schulungstermin wurde denn auch massiv Kritik geübt.

Allerdings zeigte sich eben auch, dass eine gute Schulung notwendig ist, um Spracherkennung gewinnbringend einzusetzen. "Vokabular und Schulung sind entscheidend für die Akzeptanz" - heißt die Unterzeile, und man muss kein Dragon-Dienstleister sein, um das unterschreiben zu können. Denn dann...

stellt sich [...] ein Aha-Erlebnis ein: Schulungsleiter Stephan Küpper diktiert ganze Absätze fehlerfrei, ohne jede Schummelei. Wir haben viel gelernt an diesem Tage, obwohl Dragon bei uns seit Jahren im Einsatz ist. Und man sollte auf eine solche Schulung durch Profis nicht verzichten. Nun trauen sich etliche Teilnehmer, ihre positiven Erfahrungen zu schidern. Ein Richer ist mit Dragon sehr zufrieden und beschreibt den immensen Gewinn an Freiheit, und damit meint er die Unabhängigkeit von den Launen des Schreibbüros. Jetzt könne er bis zum Fristende an der Akte arbeiten.

Dies, so sei hinzugefügt, ist kein Einzelfall. Andere Richter loben, dass mit Spracherkennung die Akte nach dem Diktat tatsächlich abgeschlossen sei und nicht Wochen später noch einmal durchgesehen werden müsste - auch dies ein nicht zu unterschätzender Vorteil.

Schließlich zum Vokabular:

4voice hat für die einzelnen juristischen Spezialgebiete wie Arbeits- oder Familienrecht eigene Vokabulare von Linguisten mit bis zu 50.000 weiteren Einträgen herstellen lassen. Dazu wurden repräsentative Texte der Justizbehörden ausgewertet und beispielsweise alle Entscheidungen des Oberlandesgerichts Frankfurt in der Landesrechtsprechungsdatenbank komplett eingewiesen. Wer Dragon im Kaufhaus erwirbt und damit nur auf das Standardvokabular zurückgreifen kann, ist jedenfalls als Jurist falsch beraten. Auf die Feinheiten kommt es an: für einen Strafrichter oder Staatsanwalt sind Begriffe wie "Angeklagter" wichtiger als einen Zivilrichter, der mehr mit "Klägern" und "Beklagten" konfrontiert ist.

Wie immer: wer die FAZ nicht liest und heute nicht kaufen will, schreibe mir an stephan.kuepper [at] 4voice.de. Sie erhalten eine Kopie umgehend per E-Mail.

16 November 2007

Heiser!

Wirklich erstaunlich: während der ganzen Messe bin ich schwer erkältet und heiser. Trotzdem versteht Dragon mein Diktat so wie immer. Die Spracherkennung wird wirklich immer stabiler - ich bin mal wieder begeistert!

Was mich daran erinnert, dass ich vor kurzem einen chinesischen Arzt am Stand hatte, der sich einfach mein Mikrofon griff und losdiktierte - mit einer Genauigkeit, die so gut war wie meine, und trotz seines Akzents. Respekt!

Mondegreen (Wumbaba auf Englisch)

Heute morgen auf der Medica wollte ich meine Kollegen beeindrucken und ein wenig auf Englisch diktieren. Dies tue ich im wahren Leben nicht wirklich, habe aber für alle Fälle einen Benutzer angelegt.

Welcher Satz würde sich für diese Situation besser eignen als der Klassiker aus der Rocky Horror Picture Show: "I see you shiver with anticipation"? Spreche ich den Satz mit normaler Intonation aus, wird er wunderbar verstanden. Mit der herrlich zerdehnten Pause, die Tim Curry im Wort "antici - pation" macht, schreibt Dragon folgende köstliche Variante:
I see you shiver with aunties who patiently ...

Ist das nicht schön?

13 November 2007

Testbericht: Headsets in der c't

In der aktuellen c't, Heft 24/2007, befindet sich ein ausführlicher Test von Stereo-Headsets, eigentlich unter dem Gesichtspunkt Musik und Games, aber auch mit einer Sektion zum Thema Diktat. In den Test geht unter anderem der Audio-Assistent von Dragon NaturallySpeaking ein.

Überraschend gut bewertet wurden zwei Modelle, die mir bisher noch nicht aufgefallen waren: das Sony DR-260 USB zum Preis von 50 €, als einziges der getesteten Geräte mit einer Mikrophon-Lautstärkeregelung und einem Wert von 23 im Audio-Assistenten; sowie das Microsoft Lifechat LX-3000 zum Preis von nur 30 € und einem Wert im Audioassistenten von 22. Dies ist allerdings laut Test vom Sound "für Musik, Filme und Spiele ungeeignet".

Ich habe mich bis jetzt immer nur mit Mono-Headsets auseinander gesetzt, weil ich gerne ein Ohr während der Arbeit frei habe, um nötigenfalls auch mal telefonieren zu können, während ich hätte tragen. Wer aber beides sucht, Diktat und Musik, sollte sich den Test mal genauer ansehen.

Dass der Wert im Audio-Assistenten nicht alles ist, wissen meine geneigten Leser allerdings seit diesem Beitrag.

Tipps und Tricks: Wörter verteilen über das Custom-Verzeichnis

Wer mit mehreren Benutzern auf dem selben PC arbeitet, hat das Problem, dass er Wörter und Befehle von einem zum anderen Benutzer transferieren möchte. Zumindest geht es mir so: einige Sprachbefehle und zahlreiche Wörter (z.B. meinen Namen) benötige ich eigentlich in jedem Wortschatz, unabhängig davon, ob es mein Arbeits-Vokabular ist, ein medizinisches Vorführvokabular oder ein Testwortschatz.

Dragon NaturallySpeaking Professional 9 stellt ein Werkzeug bereit, welches sich Data Distribution Tool nennt. Man findet es im Programm-Menü unter "Start - alle Programme - Dragon NaturallySpeaking - Dragon NaturallySpeaking-Werkzeuge - Data Distribution Tool". Wer sich darein einarbeiten will, ist mit der Hilfe-Funktion ganz gut bedient. Wer technischer veranlagt ist, kann auch das NSAdmin-Werkzeug nutzen, was schon in älteren Versionen enthalten ist, allerdings nicht unbedingt den besten Ruf genießt.

Hier der Hinweis, wie man Befehle und Wortlisten auch ohne Data Distribution Tool ganz einfach verteilen kann:

Legen Sie folgendes Verzeichnis an:

C:\Dokumente und Einstellungen\All Users\Anwendungsdaten\Nuance\NaturallySpeaking9\Custom\deu

(Für Dragon NaturallySpeaking 9 unter Windows XP)

Exportieren Sie alle benutzerdefinierte Wörter in einer Wortliste im Format TXT in dieses Verzeichnis. Am einfachsten geht das in Dragon NaturallySpeaking über das Menü "Wörter - exportieren" oder über den Sprachbefehl "Wörter exportieren". Fortgeschrittene Benutzer können dort aber natürlich auch eine eigene Wortliste erstellen, die exportierte Wortliste bearbeiten und dergleichen mehr.

Wird jetzt ein neuer Benutzer geöffnet, werden die Wörter aus dieser Wortliste in das Vokabular des neuen Benutzers importiert und erscheinen dort mit einem roten Stern als vom Benutzer neu hinzugefügte Wörter. Natürlich funktioniert das auch, wenn sich mehrere Benutzer denselben PC teilen. So können zum Beispiel zwei Ärzte in einer Praxis die Wörter, die sie hinzufügen, an den jeweils anderen weitergeben.

Achtung: wer Fachvokabulare einsetzt, exportiert unter Umständen sämtliche Wörter eines Fachvokabulars, nämlich dann, wenn diese Wörter als benutzerdefiniert mit einem roten Stern gekennzeichnet wurden. Das ist natürlich wenig zielführend, zumal das Sprachmodell nicht mit exportiert wird und daher ein neuer Benutzer mit den Wörtern alleine nicht viel anfangen kann.

[Edit:] Das gleiche funktioniert auch mit Befehlen, allerdings nur bei neu angelegten Benutzern. Um Befehle von einem vorhandenen Nutzer zu einem anderen vorhandenen zu transferieren, muss das Data Distribution Tool benutzt werden.

Um Befehle eines Users für alle anderen, in der Zukunft noch zu erstellenden User bereitzustellen, gehen Sie so vor:

Gehen Sie in das Befehlcenter von Dragon NaturallySpeaking über "Extras - Befehlcenter" oder sagen Sie einfach "Befehlcenter öffnen". Unter "Verwalten" haben Sie eine Liste aller verfügbaren Befehle. Markieren Sie die, welche sie exportieren wollen, und exportieren Sie sie ebenfalls in dieses Verzeichnis im Format DAT.

Wenn man routinemäßig neu hinzugefügte Wörter in dieses Verzeichnis exportiert, hat man seine benutzerdefinierten Einträge immer auf dem neuesten Stand. Dabei kann man die vorhandene Wortliste einfach überschreiben - Dragon NaturallySpeaking exportiert immer alle benutzerdefinierte Wörter, auch wenn sie vorher über eine Liste hinzugefügt wurden.