12 September 2008

Dragon NaturallySpeaking 10 - erste Erfahrungen

Inzwischen habe ich Dragon NaturallySpeaking 10 Professional auf zwei Rechnern installiert und kann erste Erfahrungen mitteilen.

1. Installation:
Die Installation ging auf einem sauberen Rechner und als Upgrade gleichermaßen glatt, sofern man die setup.exe startet - DNS 10 erwartet eine Visual C++-Runtime, die der MSI-Installer nicht it installiert, die Setup.exe aber schon.
Das Upgrade der Sprecher schlug fehl, aber wohl deshalb, weil der eine ein 4voice (d.h. geschütztes) Vokabular hatte, das DNS allein nicht lesen kann. Bei den Rechnern handelt es sich zum einen um ein Notebook mit Windows XP Pro, Intel CoreDuo T2500 mit 2 GHz, 1 GB RAM; der andere ein Desktop PC mit Windows Vista, 2 GB RAM, AMD Sempron 3400+, 1,8 GHz,

Bei der benuterdefinierten Installation lassen sich jetzt Format- und allgemeine Optionen getrennt einstellen; die Komposita können schon hier abgewählt werden. Außerdem ist die umstrittene Datensammlung mit dabei, kann aber ebenfalls ausgeschaltet werden.

2. Erkennungsgenauigkeit:
Für einen ersten Vergleich zwischen der alten und neuen Version habe ich einfach zwei Mikrofone benutzt, eines (Olympus DR-1000) am Windows XP-Rechner, auf dem zu diesem Zeitpunkt noch Dragon 9.5 installiert war, das andere (VXI Parrott TalkPro-Headset) am Vista-Rechner mit DNS 10 angeschlossen. Den DNS 9-Benutzer habe ich seit Juni im täglichen Einsatz, der DNS 10-Nutzer war völlig neu angelegt.

Die Ergebnisse unterschieden sich zwar in den konkreten Fehlern, numerisch ist das Ergebnis gleich: jeweils 8 Fehler auf 671 Wörter. Nicht gewertet wurde die Zahlenformatierung (s.u.), in der DNS 10 klar die Nase vorn hat. Interessant ist, dass DNS 10 seinen Namen nicht erkennt: "Dragon NaturallySpeaking" wurde bei jedem Vorkommen anders geschrieben (was strenggenommen die Fehlerquote auf 14 erhöht hätte, doch habe ich das Wort nur einmal gewertet).

Bei diesem Test sprach ich bewusst deutlich. Bei undeutlicher Aussprache - wie sie sich im Laufe des Tages immer mehr einschleicht - kann ich noch keine genauen Aussagen treffen. Nach den Ergebnissen, die ich gestern Abend zwischen 21 und 22:00 Uhr hatte, scheint aber auch hier die Erkennung besser zu verlaufen. Eine gute Nachricht für alle Praktiker, die viel diktieren müssen, auch wenn sie müde sind, und bisher dafür mit schlechterer Erkennungsgenauigkeit bestraft wurden.

3. Systemressourcen:

Unter Windows Vista ließ sich DNS 10 mühelos installieren, meldete aber die Deaktivierung der natürlichen Sprachbefehle für Word und Excel aus Speichergründen. Offensichtlich ist diese Kombination also für Dragon 10 schon schwach. Die Erkennung lief allerdings flüssig und vom Tempo ähnlich wie auf dem XP-Notebook mit DNS 9.5.

Die eigentliche Überraschung: Die Installation auf dem XP-Notebook lief ohne Warnung vor mangelnden Ressourcen, und die Erkennung verläuft tatsächlich flüssiger als mit DNS 9.5! Offensichtlich ist Vista schuld, denn Michael Spehr berichtete mir dasselbe.

Überhaupt scheint die Spracherkennung nach allem, was man hört, wesentlich flüssiger zu verlaufen - auch aus anderen Ecken vermeldet man das gleiche. Schön, dass sich die Befürchtungen hier einmal nicht bewahrheitet haben - bisher hat Dragon NaturallySpeaking in jeder Version das System immer stärker in Anspruch genommen. im Task Manager belegt Dragon NaturallySpeaking jetzt allerdings ungefähr 200.000 KB Speicher, vorher waren es 140.000 KB.

4. Zahlen:
Fast alles, was uns geärgert hat, ist verschwunden: eine 53 jährige Patientin geht in beiden, aber eine drei bis 4 m lange Bremsspur, eine fünf bis 6 cm große Narbe oder gar ein 7 x 8 cm großes Bild wird von DNS 9.5 wie angezeigt geschrieben, von DNS 10 in allen Fällen korrekt. Auch das Datum scheint besser zu sein, mit Ausnahme des 23. EIne Folge von Ziffern wird korrekt geschrieben, also 089244104445 statt null acht neun zwei vier vier eins null vier vier vier fünf. Paragraph drei, Abs. 4, [Ziffer] 5 ist komplett identisch. Ein Fehler macht sich allerdings bei Maßeinheiten bemerkbar - im Kochrezept werden drei Eier, 4 g Mehl, 5 l Wasser (nein, Sie brauchen das nicht essen) als drei Eier ,4 g Mehl ,5 l Wasser geschrieben, das Komma also falsch gesetzt.

5. Neuigkeiten:
Alle Neuheiten habe ich noch gar nicht ausprobiert und kann sie daher auch nicht vermelden. Was wirklich Spaß macht, ist die Möglichkeit, mit einem einzigen Befehl ein Wort oder mehrere Wörter zu formatieren oder zu löschen. Man sagt in Microsoft Word zum Beispiel "fett Dragon NaturallySpeaking", und der Ausdruck wird sofort fett gesetzt. Analog funktioniert auch "lösche Dragon NaturallySpeaking", was eine Funktion ist, die schon von vielen Benutzern angefragt wurde - zumindest haben viele Leute, die ich trainiert habe, intuitiv versucht, mit diesem Befehl ein Wort zu löschen, und waren sehr enttäuscht, als es nicht ging.

Weitere Ergebnisse in Bälde!

4 Kommentare:

Anonym hat gesagt…

Da danke ich doch mal für den auführlichen Testbericht.
Mich würde natürlich noch interessieren wie das mit der Auslastung im Taskmanager gemeint war, die Zahlen sagen es ist mehr der Text vorher sagt aus es könnte weniger sein? Und wie undeutlich ist Ihre Aussprache zwischen 9 und 10uhr abends?

cola-cao hat gesagt…

Hallo!
Mich würde interessieren, ob dieses Gerät auch dafür geeignet wäre univorlesungen aufzunehmen und sie dann "abtippen zu lassen" (sofern ich mich in die erste Reihe setze).

Stephan Küpper hat gesagt…

Hallo cola-cao,

nein, geht nicht. Dragon NaturallySpeaking ist eine diktierte Software, wenn der Text nicht diktiert wird, wird er auch nicht ordentlich umgesetzt. Das fängt mit der mangelnden Tonqualität an und hört noch längst nicht damit auf, dass Professoren nur selten die Satzzeichen mit sprechen, wenn sie eine Vorlesung halten.

Ich empfehle allenfalls ein gutes digitales Diktiergerät, mit dem man sich dann hinterher die Vorlesung anhören kann. Es gibt inzwischen auch ganz interessante Stifte, die alles aufzeichnen, mit denen man sich Notizen machen kann, und dies sogar ermöglichen, die Aufnahme zu einer bestimmten Notiz nochmal anzuhören:

http://www.livescribe.com/de/

Viele Grüße!

CarstenKeth hat gesagt…

Hallo Herr Küpper,

ich arbeite mit dem DNS11 (das ich ohne Headset übers Internet bezogen habe).
Gleichzeitig benutze ich auf einigen Rechnern die im Windows 7 integrierte Spracherkennung.

Ihren Bericht entnehme ich nun, dass Sie mit dem serienmäßig mitgeliefert Plantronics® Calisto™-Headset keine gute Erfahrungen gemacht haben, mit dem Plantronics CS 60 hingegen jedoch offensichtlich gute.

Meine Frage an dieser Stelle: Kann ich das Plantronics CS 60 an einem normalen PC anschließen und als Diktiermikrofon verwenden?
Ich würde mich freuen wenn Sie mir in diesem Punkt weiterhelfen könnten.
Im Voraus vielen Dank für Ihre Mühe!

Mit freundlichen Grüßen

CARSTEN KETH
Financial Director f.d.OVB
Certified Financial Consultant (EAFM, St.Gallen)
-------------------------------
Mail: c.keth@ovb.de +Carsten.Keth.OVB@GMX. DE
www.keth.ovb.de