26 März 2009

Dragon NaturallySpeaking 10.1 erscheint - Stück für Stück

Nuance hat die Download-Seite für Dragon NaturallySpeaking 10.1 eingerichtet. Zunächst kann das Upgrade nur für die englischen Versionen von Dragon NaturallySpeaking Preferred und Dragon NaturallySpeaking Standard runtergeladen werden. Weitere Sprachen und Ausgaben werden folgen, bis Juli 2009 sollen alle Sprachen und alle Versionen bedient sein.

Das Upgrade ist kostenlos für alle Anwender von Dragon NaturallySpeaking 10. Inwieweit man zum Upgrade berechtigt ist, wird durch die Abfrage der Seriennummer festgestellt. Halten Sie die Seriennummer daher bereit, wenn Sie das Update durchführen wollen - denken Sie aber auch daran, dass es für Deutsch im Moment noch gar nicht verfügbar ist. Das Erscheinen wird beizeiten an dieser Stelle mitgeteilt.

17 März 2009

Sprachsteuerung und Spracherkennung am Computer für Behinderte mit Dragon NaturallySpeaking - ein Erfahrungsbericht

Sprachsteuerung und Spracherkennung am Computer für Behinderte mit Dragon NaturallySpeaking - ein Erfahrungsbericht von "Sitting Fool", durch eine Multiple Sklerose-Erkrankung komplett gelähmt.

Ich habe es beruflich und privat eigentlich nur mit Leuten zu tun, die Spracherkennung einsetzen, um sich die Arbeit zu erleichtern oder zu beschleunigen. Es gibt aber auch genügend Leute, die ohne Spracherkennung überhaupt keine Möglichkeit haben, mit dem Computer und der Welt zu kommunizieren. Dieser Erfahrungsbericht wirft ein Licht auf diese - inzwischen kommerziell vollständig unterrepräsentierte - Gruppe von Benutzern.

Wenn man davon ausgeht, das Dragon NaturallySpeaking irgendwann einmal genau zu diesem Zweck konstruiert wurde, man dann aber feststellte, das sich wesentlich mehr Geld mit Ärzten und Juristen verdienen lässt, wirft das ein bezeichnendes Licht auf uns alle. Ich gebe selbst zu, das ich mir nicht zutrauen würde, den Computer komplett ohne Hände zu bedienen und dass ich deswegen Kunden auch gerne an Spezialanbieter wie die Firma Humansystem verweise.

Die in Windows Vista eingebaute Spracherkennung ist übrigens, was die Bedienung des Computers angeht, vorbildlich und machte mir intuitiv mehr Spaß als Dragon NaturallySpeaking. Die Leistung beim Diktat ist allerdings nicht ganz so gut. Interessanterweise kann man beide Spracherkennungen parallel verwenden - also für die Steuerung des Computers die eingebaute Spracherkennung von Windows Vista, zum Diktat Dragon NaturallySpeaking. Wenn man dann aus Versehen beide Maschinen eingeschaltet hat, wird jeder Satz zweimal hingeschrieben - sehr schön, um einen direkten Vergleich zu erhalten :-)

15 März 2009

Dragon blog! - Speaking About Dragon - from Nuance

Wie ich gerade erfahre, habe ich Gesellschaft: es gibt jetzt ein Dragon blog direkt von Nuance! Erster Blogger ist kein Geringererer als Peter Mahoney, Senior Vice President and General Manager, Dragon, also quasi der oberste Drachenkämpfer.

Eine der neuesten Ankündigungen bezieht sich darauf, dass Dragon 10 bald auch in einer Version für 64-bit Windows Vista erhältlich sein wird. Mal schauen, ob bei der Gelegenheit auch weitere Wünsche umgesetzt werden, die das Service Pack 1 noch offen lässt.

Die Ankündigung hat überraschend viele Antworten hervorgerufen - ich wusste nicht, dass 64-bit Vista schon so verbreitet ist. Oder gilt das nur für Amerika?

07 März 2009

CeBIT News 2: Linguatec Voice Pro

Linguatec stellt mit der bereits erwähnten VoicePro 12-Software eine Lösung vor, die die Spracherkennung von Windows Vista benutzt, dem verbesserungsfähigen Diktat unter Vista aber durch erweiterte Sprachmodelle und Korrekturmöglichkeiten aufhilft. Nach Auskunft von Linguatec wurden heirzu ca. 15.000 Sprecher aufgenommen, um das deutsche Sprachmodell der Vista-Spracherkennung zu verbessern, und auf den Servern in Redmond adäquat verarbeitet. Die Live-Demonstration sah sehr gut aus.

Da die wirklich vorbildliche Vista-Sprachsteuerung verwendet wird, ließ sich einiges Erstaunliche zaubern, z.B. Die Toten Hosen aufs Wort loslärmen lassen und per Sprachbefehl lauter stellen. Die Sprachsteuerung ist m.E. ein echter Komfortgewinn - in der Vorbereitung auf den Messetermin hatte ich mich mal wieder an meinen Vista-Rechner gesetzt und gemerkt, wie gut er sich per Sprache bedienen lässt, solange die Programme von Microsoft sind. Auch dies soll Voice Pro besser machen und auch Nicht-Microsoft-Anwendungen bedienen.

Allen Versionen bis auf die Standard liegen zusätzliche Fachwortschätze bei, die, wie aus früheren Versionen von VoicePro bekannt,zum Grundwortschatz zugeschaltet werden können. So lässt sich auch eine Kombination aus z.B. Sport und Wirtschaft erealisieren; wie sinnvoll das ist und ob sich der Sprachgebrauch eines Sportreporters nicht doch in mehr als nur der Wortwahl von dem eines Managers unterscheidet, sei dahingestellt.

Dateien vom Diktiergerät kann VoicePro 12 ebenfalls umsetzen, allerdings nicht das DSS-Format. Hier wollte man wohl Lizenzgebühren sparen und verweist auf die DSS-Konverter, die jedem Profi-Diktiergerät beiliegen. Diktate können mitsamt Originalaufnahme abgespeichert werden, so dass ein Workflow in der Theorie möglich wäre (aber noch nicht ersthaft verfolgt wird).

Korrektur und Wortschatzbearbeitung wurden gegenüber Vista verbessert, jedoch konnte ich mir diese Bestandteile nicht live ansehen. Hier bleibt noch was zu testen, wenn die endgültige Version erscheint. Ich bin gespannt, ob die Benutzerfreundlichkeit hier so gut ist wie bei der Rechnersteuerung.

Übrigens wird es auch eine Wireless-Version geben, der das Wideband-Bluetooth-Headset Jabra MN5390 beiliegen soll.

Hier noch ein Bericht auf ZEIT Online.

CeBIT-News

Das GMX-Magazin erinnert an Exkanzler Gerhard Schröder, der sich zur CeBIT 1999 wünschte: "Ich mchte gerne einen Computer haben, in den ich reinsprechen kann." Zehn Jahre spter wartet GMX noch immer auf den Computer, der aufs Wort hört, - ich aber habe mir schon mal das eine oder andere in die Richtung angesehen.

Datatronic zeigte am Datev-Stand ihr Diktiersystem inkl. SpeechMagic-Spracherkennung, das sich v.a. durch seine Anbindung an Datev Phantasy auszeichnet.Auf derselben Basis, jedoch nach eingenen Angaben durch mehr Schnittstellen vielseitiger einsetzbar, ist DictaPlus, die nach der Übernahme von Philips Speech Recognition durch Nuance jetzt auch wieder in den medizinischen Sektor wollen und dazu in der kommenden Version 6.2 einige Schnittstellen versprechen.

Auf Dragon als Spracherkennung bauen die Diktiersysteme von Dictanet, WinScribe und Thax. Bei allen drei Herstellern war das mobile Diktat in das iPhone (nur Dictanet) und den Blackberry ein Thema. Der iPhone-Client von Dictanet und das Blackberry-Diktat von WinScribe sollen grundsätzlich auch in der Lage sein, an eine Spracherkennungngesendet zu werden, was mein heimlicher Traum ist: unterwegs diktieren und das geschriebene Diktat zuhause (oder gar per Mail auf dem mobilen Gerät) erhalten. Thax, die für Dictanet den Blackberry-Client liefern, arbeiten nach eigener Aussage auch daran, holten mich aber auf den Boden der Tatsachen zurück mit der Anmerkung, dass die Tonqualität wohl kaum für wirklich gute Spracherkennung ausreichen dürfte.

Während diese Hersteller sich auf juristische und medizinische Workflowlösungen spezialisiert haben, stellt Linguatec mit der neuen VoicePro 12-Software eine Lösung vor, die auch für den weniger spezialisierten Anwender - und Gerhard Schröder -interessant ist. VoicePro basiert auf der für sich genommen schon vorbildlichen Sprachsteuerung von Windows Vista und hilft dem noch deutlich verbesserungsfähigen Diktat unter Vista durch verbesserte Sprachmodelle und Korrekturmöglichkeiten auf. Mehr darüber im nächsten Post.

Über Spinvox habe ich hier bereits berichtet; was mir neu war, ist, dass die Technologie dahinter zumindest teilweise von dem ägyptischen Hersteller InfoDynamix. Dort ruft man tatsächlich einen Server an, der Sprache in Text verweandelt; die deutsche Dependance in Düsseldorf ist aber leider meist überlastet, so dass es nur selten gelingt, sich selbst eine Sprachnachricht zu diktieren,. Dies soll sich aber demnächst ändern, wie mir ein freundlicher Vertreter der Firma versprach - wollen wir es hoffen.

Schließlich benötigt man für gutes Diktat ein gutes Mikrofon. Plantronics stellt zwei neue schurlose Headsets von, die wahlweise an PC und Handy bzw. Festnetztelefon angeschlossen werden können, so dass man nur ein Gerät für beides braucht. Sie sollen im Laufe des Jahres unter der Bezeichnung Savi Office bzw. Savi Go erscheinen. Savi Office funkt per DECT, Savi Go mit Wideband Bluetooth, womit es dann auch für Spracherkennung tauglich sein sollte, wenn die Konnektivität stimmt.

02 März 2009

Dragon Service Pack 1: Mehr Erfahrungen

Ich habe mal einige der wichtigsten Verbesserungen zusammengestellt, die das Service Pack 1 für Dragon NaturallySpeaking 10 bringt:

- Zahlenformatierung (z.B. nach Komma) verbessert
- Daten werden etwas besser erkannt
- Einstellungen im Menü "Formatierung" werden i.d.R. beibehalten sowie benutzerspezifisch gemacht und ergänzt; insbesondere die Einstellungen für Zahlenformate und Komposita werden nicht mehr vergessen
- Fehler in der Zusammenarbeit mit Textcontrol-Fenster behoben
- Buchstabiermodus verbessert: keine überflüssigen Leerzeichen mehr
- Befehl "verbinde das" verbessert
- Beim Diktieren eines hinzugefügten Begriffs zu Beginn eines Absatzes wird dieser Begriff nicht mehr zwangsläufig groß geschrieben
- Seriennummer kann angezeigt werden
- Wörter werden nicht mehr hinterrücks ins Vokabular aufgenommen, sondern nur bei Korrektur über das Menü oder nach Befehl "verbinde..."

Letzteres ist vermutlich die beste Neuerung, weil das automatische Hinzufügen von Wörtern zum Wortschatz immer ein Ärgernis war, das Fehler ins Vokabular brachte. Obwohl ich mich fast daran gewöhnt hatte, einfach durch Übertippen von Erkennungsfehlern neue Wörter zum Wortschatz hinzuzufügen - aber der eine Tastendruck vorher und nachher ist ja wirklich kein Hindernis, verglichen mit der Kontrolle, die ich jetzt (endlich) habe.

Schließlich fiel mir (und anderen) auf, dass nach Installation die Erkennungsgenauigkeit zunächst nachlässt, dann aber nach ca. 1 h Diktat wieder das gewohnte Niveau erreicht oder soggar übertrifft - ich diktiere derzeit mit praktisch 100% Genauigkeit.

Also ein empfohlener Download!