23 Oktober 2008

Test: Dragon NaturallySpeaking Legal 10

Seit kurzem ist Dragon NaturallySpeaking Legal 10 erhältlich, und ich habe mir diese speziell für Juristen zugeschnittene Version über meine Dragon NaturallySpeaking Professional installiert. Bestehende Nutzer bleiben dabei erhalten. Daher habe ich jetzt die Möglichkeit, einige Unterschiede in diesen beiden Editionen mehr hervorzuheben:

Dragon NaturallySpeaking Legal ergänzt Dragon NaturallySpeaking Professional um ein juristisches Fachvokabular. Worin allerdings die Unterschiede zwischen den juristischen und dem allgemeinen Vokabular (das im Dragon NaturallySpeaking Legal ebenfalls enthalten ist) bestehen, darüber kursieren verschiedene Auskünfte. Der Hersteller gab vor Jahren einmal an, dass das juristische Vokabular im Verhältnis zum allgemeinen Vokabular um 80.000 Einträge erweitert worden sei. Dies kommt uns schon deswegen merkwürdig vor, weil der aktive Wortschatz eines Dragon NaturallySpeaking-Vokabulars in der Regel immer rund 150.000 Wörter beträgt - diese 80.000 Wörter können also allenfalls teilweise in den aktiven Wortschatz übergegangen sein. Dazu kam, dass der Hersteller bei der Markteinführung der analog positionierten Dragon NaturallySpeaking Medical Edition explizit keine Zahl nennen wollen, sondern darauf hingewiesen wurde, dass das Vokabular aus ganz anderem Material gewonnen wurde.

Dies ist auch bei Dragon NaturallySpeaking Legal der Fall. Daher möchte ich hier auf ein ganz wichtiges Konzept hinweisen, was vielen Anwendern gar nicht bewusst ist:

Das Sprachmodell.

Ein Sprachmodell enthält statistische Informationen über den Gebrauch bestimmter Wörter und Ausdrücke in einem bestimmten Kontext, ihre Häufigkeit und Wahrscheinlichkeit. Da Spracherkennung letztlich ein statistisches Verfahren ist, bei dem die Software jedes Mal rät, welches Wort wohl am wahrscheinlichsten dem Geräusch entspricht, welches durch das Mikrofon aufgenommen wurde, hat das Sprachmodell eine immense Bedeutung für die Genauigkeit der Spracherkennung.

Bei meinen ersten Diktaten mit Dragon NaturallySpeaking Legal zeigte sich genau dies: alltägliche Wörter und Wortverbindungen wurden häufig nicht erkannt zu Gunsten von juristischen Fachausdrücken, die ganz ähnlich klangen. Dies ist kein Mangel der Software, sondern ein Vorteil: das juristische Vokabular erwartet juristisches Diktat, kein allgemeines.

Und hier zeigt sich auch der Vorteil der Legal-Version für Rechtsanwälte, die oftmals meinen, die paar Fachausdrücke auch selbst zum Wortschatz hinzufügen zu können:

Das Legal-Sprachmodell gibt den professionellen Sprachgebrauch eines Juristen wesentlich genauer wieder als das allgemeine Sprachmodell. Es geht nicht nur um das Lernen einiger Ausdrücke, sondern um eine ganze Fachsprache mit ihren spezifischen Wendungen, die Dragon NaturallySpeaking Legal neben dem allgemeinen deutschen Sprachgebrauch beherrscht, andere Editionen aber nicht.

Einige andere Dinge kommen hinzu: so formatiert Dragon NaturallySpeaking Legal Ausdrücke wie "§ 32 Abs. 4 S. 2" (zumindest in der Theorie) korrekt; Aufzählungen mit "1., 2., 3." werden direkt mit Zahlen geschrieben, Gesetzesfundstellen werden im entsprechenden Kontext korrekt abgekürzt, und was dergleichen mehr Eigenheiten sind, die ein juristischer Schriftsatz wesentlich häufiger braucht als, sagen wir, eine durchschnittliche geschäftliche E-Mail.

Fazit: Juristen profitieren von Dragon NaturallySpeaking Legal, weil das Sprachmodell wesentlich genauer auf ihre spezifischen Bedürfnisse zugeschnitten ist und daher sehr viel schneller und ohne Modifikationen eine gute Erkennungsgenauigkeit erreicht werden kann. Bei den durchschnittlichen Stundensätzen eines Juristen dürfte sich damit die Investition recht schnell bezahlt machen.

Hier noch die Adresse eines Berliner Spezialisten für juristische Wortschätze:
www.cs-spracherkennung.de

22 Oktober 2008

Testbericht: Grundig Digta Cordex

Seit einer Woche ziert das Grundig Digta Cordex meinen Schreibtisch, ein - Grundig sagt: das 1. - schnurloses Mikrofon zum digitalen Diktat und für Spracherkennung. Mikrofon und Ladestation machen optisch einen sehr ansprechenden Eindruck, das Mikrofon liegt auch gut in der Hand, der Schiebeschalter wurde noch einmal gegenüber dem anderen Grundig-Mikrofone verbreitert und lässt sich sehr gut bedienen. 3 Funktionstasten oberhalb des Schalters sind sehr gut zu erreichen, die anderen 3 Funktionstasten liegen zu weit unten, als dass man sie ohne Umgrifen erreichen könnte. Das Gewicht des Geräts und die Größe sind sehr angenehm, so dass ein Diktat auch über einen längeren Zeitraum hinweg den Sprecher nicht belastet.

Die Bedienung der mitgelieferten digitalen Diktatsoftware ist sehr logisch gestaltet und kann komplett über das Mikrofon erfolgen. Interessant ist die Lösung, den Schiebeschalter zur Auswahl in den Software-Menüs zu verwenden.

Auch für Spracherkennung ist das CordEx sehr gut geeignet. Es gilt hier wie bei jedem Handmikrophon die Einschränkung, dass man genau in das Mikrofon sprechen muss, um eine optimale Erkennungsgenauigkeit zu erzielen, diese ist dann aber wirklich sehr gut.

Das Gerät wird mit einem Akku geliefert, der in der Ladestation geladen wird. Leider muss sie dazu mit dem Netz verbunden werden; ein Laden allein über den USB-Anschluss des Computers ist nicht möglich.

Das Digta Cordex lässt sich auch mit mehreren Ladestationen verbinden, so dass ein Wechsel zum Beispiel von einem Behandlungszimmer z.B. in einer Arztpraxis möglich ist. Ganz ohne Umstände gilt dies allerdings nicht ab.

Vorbildlich ist dafür die Behandlung, wenn man sich mit dem Gerät einmal zu weit vom Computer entfernt: Das Gerät ist mit einem internen Speicher für bis zu 1 Minute Diktat ausgestattet, so dass man auch bei vorübergehender Verbindungsunterbrechung zum Rechner Diktate aufnehmen kann. Wenn also die Verbindung einmal abbricht, kann man ohne Angst vor Verlusten weiter diktieren; sobald das Mikrofon sich wieder mit dem Computer verbindet, wird das Diktat übertragen. Dies funktioniert auch wunderbar mit Spracherkennung. Man kann dann zu sehen, wie sie vor 1 min gesprochenen Wörter Schritt für Schritt am Bildschirm transferiert werden.

Eine Einschränkung im Betrieb mit Spracherkennung ist eigentlich keine: Dragon NaturallySpeaking macht es nicht ohne weiteres möglich, die Spracherkennung über das Mikrofon ein- und auszuschalten (mit einer Zusatzsoftware wie der 4voice Local geht das aber). Jedoch kann man die Spracherkennung einmal ausschalten und dann den Schiebeschalter dazu verwenden, das Mikrofon stumm zu schalten - Dragon hört dann zwar noch weiter zu, es kommt aber kein Signal an, was außerdem zur Folge hat, dass nach einer längeren Diktierpause die Spracherkennung wesentlich schneller reagiert als wenn sie abgeschaltet ist.

Es bleibt abzuwarten, wie die Akzeptanz des Grundig Digta Cordex sein wird: mit einem empfohlenen Verkaufspreis von 499 € empfiehlt es sich eher für den gehobenen Geschmack. Die ersten Exemplare sollen demnächst an Händler ausgeliefert werden.

17 Oktober 2008

Test: Plantronics Callisto Bluetooth-Headset

Gerne würde ich an dieser Stelle Erfreuliches über das Plantronics Calisto-Headset berichten, welches in Dragon NaturallySpeaking 10 Wireless Edition mitgeliefert wird. Ein solches Gerät habe ich seit zwei Wochen zum Test; vorher hatte mein Kollege es bereits - und uns fiel beiden dasselbe auf:

Wenn es uns gelingt, das Gerät anzuschließen, erkennt es recht ordentlich. Die Schwierigkeit besteht aber im Anschließen des Geräts.

Hier bestätigt sich meine alte Bluetooth-Phobie: es ist mir niemals gelungen, ein Bluetoothgerät dauerhaft und problemlos mit einem PC zu verbinden. Diese Geschichte zieht sich seit Jahren durch meine Erfahrungen - schon das erste spracherkennungstaugliche Bluetooth-Headset, dass Sony HBH-300, ließ sich zwar verwenden, gab auch eine sehr gute Erkennungsqualität, musste aber jeden Morgen aufs neue mit dem Rechner gepaart werden. Mit anderen Headsets wie dem Parrott Bluetooth-Headset habe ich ebenfalls qualitativ gute Erfahrungen gemacht, es aber niemals dauerhaft mit dem Rechner verbinden können. Mit einer Bluetooth-Maus was übrigens auch nicht anders - entweder es liegt an mir oder einem Bluetooth-Standard, aber wir beiden passen einfach nicht zusammen :-)

Auch bei den Calisto-Headset habe ich nach dem dritten oder vierten Versuch aufgegeben. Zwischenzeitlich war es mir gelungen, eine Verbindung herzustellen und zu diktieren, und es zeigte sich, dass das Diktat gut erkannt wurde, sofern ich das Headset als neu Diktierquelle eingerichtet hatte, das heißt also ein Kurztraining von 7 min Dauer durchgeführt hatte (wird in ein anderes Profil diktiert, dass nicht speziell auf dieses Headset zugeschnitten ist ist die Erkennungsgenauigkeit unter aller Kritik).

Ob es an mir oder am Gerät liegt - wer es zum Laufen bekommt, wird sicherlich damit glücklich werden, ich fühle mich in meinem Urteil bestätigt und werde weiterhin andere schnurlose Alternativen bevorzugen, wie zum Beispiel das Plantronics CS 60, das Jabra GN 9350 oder das neue Grundig Digta Cordex-Handmikrophon (Test folgt in Bälde).

Ein Hoch dem Nuance-Support!

Gestern hatte ich zum ersten Mal das Vergnügen, mit dem Nuance-Kundensupport zu sprechen. (Für Uneingeweihte: als Händler hat man einen eigenen Support, der als erstes die Dragon.log-Datei anfordert, um diese dann umgehend ad acta zu legen - daher der Wert der Foren, Distributoren und inoffizieller Quellen).

Problem: Bei einem Upgrade auf Dragon NaturallySpeaking 10 von 9 wollte die Installationsroutine einen "Security Key" zur Aktivierung haben. Gab es diesen nicht, so wurde die gesamte Installation rückgängig gemacht. Die Aktivierung wird normalerweise nach dem 1. Programmstart vorgenommen, so dass ich zuerst die Anforderung ignorierte - und dies mit drei Stunden fruchtloser Installationsversuche bezahlen musste.

Ein Anruf beim Kundensupport brachte unerwarteterweise des Rätsels Lösung: Während der Installation generiert Dragon einen Hardware-Key, aus dem dann mit der Seriennummer zusammen der Security Key generiert wird, welcher wiederum, bei der Aktivierung an Nuance übertragen wird. Dieser Hardware-Key war fehlerhaft. Dies war der freundlichen Dame in dem Moment klar, wo ich ihr den Key angab, und sie generierte auf der Stelle einen Security Key, mit dem ich problemlos die Installation abschließen konnte.

Fazit: Sollte während der Installation ein Security Key angefordert werden, 069 51 70 93 63 anrufen - hier werden Sie geholfen.

Übrigens auch zu loben: die Qualität der Computerstimme in der Warteschleife. Da hat Nuance Beachtliches geleistet - nur Dragon hat immer noch die viele Jahre alte "Vera", die einem Text vorquäkt.

02 Oktober 2008

Nuance übernimmt die Spracherkennungssparte von Philips

Nuance übernimmt die Spracherkennungssparte von Philips und will damit das Geschäft im Medizinmarkt vergrößern.

In Deutschland ist Philips mit SpeechMagic, vertreten u.a. durch die Firma Kuhlmann, der stärkste Mitbewerber von Nuance. In anderen Ländern tritt Nuance gar nicht an, weil Dragon in der Landessprache nicht verfügbar ist. Wenn Nuance Philips Speech Recognition jetzt übernimmt, sind sie auch in diesem Gebiet der Platzhirsch.

Ob beide Produktlinien weitergeführt werden, eine mit der Zeit verschwinden wird oder sich in die andere integriert, wird sich zeigen. Dragon ist eher auf den Consumer-Markt ausgerichtet und im Vergleich zu SpeechMagic wenig spezialisiert. Von daher ist für beide Produkte Platz.

Ich erinnere an zwei andere Übernahmen in den letzten Jahren. IBM Via Voice wurde nach der Übernahme in den Nuance-Vertrieb ausgehungert. Der Erwerb von Dictaphone und die anschließende Einführung des Powerscribe-Workflow in Deutschland waren nicht wirklich erfolgreich; Dragon und seine Fachhändler haben dies ganz gut überstanden. Hier hat es also der Markt, d.h. die fehlende Akzeptanz geregelt.

Welche Strategie Nuance mit dieser doch sehr spektakulären Übernahme weiter fahren wird, ist noch nicht bekannt. Bis auf weiteres soll sich für die Dragon-Händler nichts ändern - warten wir's ab. Im Moment ist es noch zu früh, etwas zu sagen.