21 Dezember 2006

Gastbeitrag: Spracherkennung in Windows Vista

"Ich habe jetzt einige Stunden mit der eingebauten Spracherkennung in Windows Vista (finale Version) experimentiert. Erste Beobachtungen: Es gibt ein empfehlenswertes Benutzertraining wie bei Dragon, ungefähr in der gleichen Länge. Anschließend ist die Erkennungsleistung sehr, sehr hoch. Ich schätze mal ungefähr so gut wie bei Dragon 9. Das gesamte Auftreten der Spracherkennung wirkt modern und frisch, manches wünscht man sich auch bei dem Drachen. Statt einer oberen Menüleiste existiert nur ein kleiner Indikator-Button, der den aktuellen Zustand anzeigt. Wie bei Dragon läßt sich das Vokabular durch Analyse der eigenen Word-Dokumente und E-Mails ergänzen. Das habe ich nicht getan, und trotzdem werden nicht alltägliche Begriffe wie "DSL-Gebühren" oder "Thyssen-Krupp" von Anfang an verstanden (offene Frage: wird dynamisch mit dem Erstellen neuer Text aktualisiert?). Insgesamt ist die Ausstattung so etwas wie "Dragon light". Es fehlen also viele Optionen und Möglichkeiten eines professionellen Systems und es wird Appetit gemacht auf "mehr". Man kann sich gut eine Plus-Version vorstellen. Mein gewichtigster Einwand gegen die Microsoft-Spracherkennung ist das Korrekturverhalten. Man kann falsch Verstandenes im Korrekturfenster mehrfach neu vorsprechen. Häufig wird es dann richtig erkannt. Aber es ist definitiv nicht möglich, schnell einen Eigennamen oder Fachbegriff per Tastatur einzugeben. Man muß vielmehr buchstabieren, und das ist eine Qual. Schon aus diesem Grund wird der professionelle Diktierer vorerst beim Drachen bleiben. Indes ist das alles ein sehr erfolgversprechender Anfang. Die Spracherkennung hat übrigens die Versionsnummer 8, die Textausgabe ist nur amerikanisch möglich. Das Parrot-Headset arbeitet nicht mit Vista zusammen, ich habe also mit dem Olympus-Diktiermikro DR-2000 gearbeitet. Dr. Michael Spehr, 19.12.06" 

Vielen Dank für den Beitrag!

18 Dezember 2006

Dragon 9 Service Pack 1

Das Service Pack 1 für Dragon NaturallySpeaking 9 ist da. 
Hier findet sich die Ankündigung und Technote bei Nuance

Willi Sander hat einen direkten Download-Link und eine teilweise Übersetzung hier bereitgestellt:
http://www.fachvokabulare.de/
und dann Klick auf "Programme".

Hier noch seine Ankündigung und eine kleine Forumsdiskussion über die richtige Installation.

Interessant für Entwickler ist v.a. die Bearbeitung des VocTools, mit dem jetzt hoffentlich wieder möglich ist, ein Vokabular inkrementell, also Schritt für Schritt aufzubauen.

Nach der Installation kann ich für meinen Teil feststellen, dass zumindest das Zahlenformat, welches angeblich jetzt besser laufen soll, immer noch nicht ganz alltagstauglich ist - "22 per Dezember 2006" kommt immer noch genauso häufig wie 22.12.2006.  

10 Dezember 2006

FAZ-Test von Linguatec Voice Pro

Hier noch der Nachtrag zu den letztlich gebloggten Kritiken von Linguatec Voice Pro 11: 

Michael Spehr, FAZ-Spezialist fürs digitale Diktat, hat Voice Pro in der Ausgabe vom 5.12.2006 getestet. Sein Fazit: zu loben sind die hohe Erkennungsrate, der günstige Preis von 200 € und die verhältnismäßig bescheidenen Systemanforderungen (Kunststück – der verwendete Erkenner ist ViaVoice 10.5, das ist drei der vier Jahre alt). Auch die Arbeit mit Anwendungen, die im Browser laufen, gehe flüssiger als mit Dragon. Outlook Web Access funktioniert laut Testbericht mit VoicePro besser als mit Dragon. Im professionellen Einsatz sei Linguatec VoicePro jedoch keine Alternative zu Dragon NaturallySpeaking: der Lernprozess der Software sei deutlich komplizierter, und das zu erzielende Lernergebnis in der Spracherkennung niedriger.

Dies deckt sich mit meinen Erfahrungen, die ich vor Jahren mit Voice Pro 10 gemacht habe: die Ansätze sind gut, die Erkennung schwankte zwischen fehlerfrei und völlig indiskutabel, und die Korrektur war gewöhnungsbedürftig. Mir fielen außerdem schon damals die vielen kleinen Ärgerlichkeiten auf, die der Tester auch jetzt wieder erwähnt – viele Funktionen sind einfach nicht sauber umgesetzt, das Wechseln zwischen den Fenstern dauert elend lange, die Kompatibilität mit Word war nur im Prinzip gewährleistet, und was dergleichen Bugs mehr sind.

05 Dezember 2006

Linguatec VoicePro 11 im Test

Gut, das Nuance-Forum ist nicht unbedingt der Ort, an dem man Lob von ViaVoice, 
und sei es in seiner Inkarnation als Linguatec Voice Pro,  erwarten würde. Insofern stimmt ganz hoffnungsvoll, dass einige Anwender durchaus ein positives Wort darüber verlieren - auch wenn der Drache weiterhin für sie erste Wahl bleibt.

So schreibt Willi Sander:

Wie nicht anders zu erwarten war, verbirgt sich hinter VoicePro 11 die 10.5er Engine von ViaVoice. Trotzdem ist die Erkennungsgenauigkeit erstaunlich gut. [...] Die Bearbeitung der benutzerdefinierten Wörter ist immer noch ein Krampf, das Austauschen von Wortlisten ist nicht möglich.
Alles in Allem eine Alternative für Hobbyanwender [...].
Rolf Richter:

Seit fast zwei Wochen bin ich im Besitz der Version 11 von ViaVoice.  [...] Die Firma Linguatec hat ziemlich gute Arbeit geleistet, die befürchteten Defizite waren meist nicht mehr vorhanden.
[...] 
Trotzdem, wenn ich ein Resümee ziehen sollte-ich bleibe natürlich bei Dragon, dies ist doch die bessere Alternative. Die Genauigkeit bei der Erkennung ist um einiges besser, auch die Korrektur ist schneller bewerkstelligt, die Übernahme neuer Wörter in das Vokabular ist ungleich effektiver, den größten Vorteil finde ich, dass man direkt in das Vokabular gehen kann, um dort Veränderungen vorzunehmen, zum Beispiel löschen usw. es ist bei ViaVoice eigentlich kaum möglich.  [...] Dieser Beitrag wurde mit ViaVoice verfasst, ohne größere Verzweiflung.
Georg Eisenmann:

Nach einem recht langen Training, bei dem das erste Wort eines Satzes oft nur schwer vestanden wurde, habe ich dann drauf los diktiert. Leider war das Ergebnis nicht berauschend. In jedem Satz mehrere Fehler. Nicht einmal das Wort VoicePro wurde verstanden. Darüber recht geschockt versuchte ich mich anschließend mit dem neuen Mikrofon (von Sennheiser) an Dragon. Hier wurde dann weitaus mehr verstanden, dann und wann ein Fehler im Satz, aber passabel.
Der kurze Vergleich war fair: Weder VoicePro noch Dragon wurde mit alten Dokumenten gefüttert oder anderweitig optimiert wurde. Es fand auch nur jeweils das Anfangstraining statt (ca. 5 Minuten bei Dragon und bestimmt 15 Minuten bei Voicepro. Ein echter Test war das natürlich nicht.
Wie mir mein Vater gerade sagt, steht auch in der FAZ heute ein Test, der ähnliche Ergebnisse liefert - das Diktat ist an sich nicht schlecht, das Vokabular lässt sich aber nur umständlich bearbeiten. So muss fast jedes neue Wort trainiert, d.h. vorgesprochen werden - das hatten wir doch überwunden geglaubt? Sobald ich den Test vorliegen habe, trage ich ihn hier nach.

Einen eigenen Test werde ich aber wohl kaum durchführen können, wo ich doch jetzt bei der Konkurrenz bin, Rike...

04 Dezember 2006

Elektronischer Dolmetscher erhöht die Glaubwürdigkeit - ?!?

Das US-Militär testet den elektronischen Dolmetscher Englisch-Arabisch "Mastor" von IBM - so vermeldet die PC-Welt online.  

Der Anwender, beispielsweise ein US-Soldat, würde dann ganz normal in das Mikrophon sprechen, worauf die IBM-Software simultan mit der Übersetzung beginnt und den Inhalt auf Arabisch per Lautsprecher ausgibt. Umgekehrt wird die Antwort auf Arabisch ins Englische übersetzt. Darüber hinaus werden die Sätze zu Kontrollzwecken sowohl in der Originalsprache als auch in der Übersetzung auf dem Display angezeigt und der übersetzte Satz wird zugleich in die Originalsprache zurück übersetzt, um es dem Originalsprecher zu ermöglichen, Missverständnisse oder falsche Übersetzungen schnell zu erkennen und gegebenenfalls zu korrigieren.
Ob das funktioniert? Meine Ergebnisse mit Dragon-Spracherkennung und PROMT-Übersetzung waren nicht wirklich alltagstauglich. Auch die Rückübersetzungsfunktion scheint mir nicht 
die beste Kontrollmöglichkeit, ob das Gegenüber wirklich das Gemeinte verstanden hat. Wer die einschlägigen Seiten für maschinelle Übersetzung kennt, weiß, dass hier gerne mal "Stille Post" gespielt wird. Legendär die Hin- und Her-Übersetzung des "Adobe Acrobat Reader" als "Lehmziegel Seiltänzer Leser" oder noch schöner "Ziegelsteinseiltänzerleser". Den Ernstfall möchte man sich nicht wirklich vorstellen. 

Einerseits: wenn die US Army mit dem entsprechenden Kapital dahintersteckt, kommt ja vielleicht wirklich was dabei rum...

Andererseits: eine kurze Recherche fördert diesen Artikel der Netzeitung zutage. Wenn es darum geht, dass eine Maschine vertrauenswürdiger [sic!] 
übersetzt als ein Mensch, und das auch noch jemand glaubt (!), 
dann sind wir wirklich weit gekommen - aber nicht unbedingt technologisch.

03 Dezember 2006

Der Blaupapagei

Seit einer Woche diktiere ich mit dem Bluetooth-Headset B150 GTX von VXI (auch unter BlueParrott bekannt) und kann nur sagen: so viel Spaß hatte ich selten beim Diktieren. Sehr guter Tragekomfort, ausgezeichnete Erkennung und kein Kabel - bei dem Gerät werde ich in der nächsten Zeit bleiben. Für mich allein schon wegen des Tragekomfort wesentlich besser als Xovox, auch wenn ein Kopfbügel natürlich nicht jedermanns Sache ist.

Das Gerät ist sehr robust gebaut, mit einem metallenen Kopfbügel und einem stabilen Mikrofonarm. Auch das Ohrpolster ist aus robustem Kunstsoff, lediglich der Mikrofonschutz sitzt - wie immer bei VXI - etwas locker und sollte fixiert werden. Am Headset selbst git es drei Tasten - eine Multifunktionstaste für an, aus, pairing; je eine für lauter bzw. leiser, wobei ein viersekündiger Druck auf die "Lauter"-Taste das Mikro stumm schaltet.

Die Reichweite des Headsets habe ich mit Skype ausprobiert. Sie beträgt mit dem Anycom-Dongle ca. 10m, wobei die Wände nicht zu dick sein sollten. Aus dem Nebenzimmer funktioniert es, aber über den Flur wird es langsam kritisch, und die Übertragungsqualität sinkt rapide. Aus der Entfernung wird aber niemand diktieren wollen.

Einen kleinen Abstrich musste ich beim Ladegerät machen, das für den mobilen Einsatz konzipiert ist und daher nicht sehr standfest ist. Die Handelsausgabe wird mit einem stabilen Ladegerät geliefert (s. Bild).

Dafür habe ich einen Anschluss an den Zigarettenanzünder, so dass man das Headset zur Not auch im Auto laden kann - wer's fürs Handy braucht. (Persönliche Meinung: fürs Handy ist es zu schade, zum Telefonieren tuts jedes billige Ding, aber für Spracherkennung - und die geht nicht wirklich im Auto - muss es was Gutes sein.) Es gelten natürlich wie immer die üblichen Abstriche für Bluetooth, also dass man zum Beispiel bei jedem Start des Rechners wie auch nach dem Laden die Verbindung neu herstellen muss.

Obwohl Dragon 9 explizit Bluetooth-Headsets unterstützt, habe ich das Gerät als Standard Mic-Line In angelegt, und es hat nicht geschadet. (Hintergrund: gelegentlich speichere ich Diktate zur späteren Korrektur, und dann fordert Dragon dasselbe Eingabegerät, welches auch zum Diktieren benutzt wurde. Ich habe schon erlebt, dass Korrekturplätze nicht gearbeitet haben, wenn nicht das Original Philips Speechmike dranhing. Mit Mic/Line in ist man da auf der sicheren Seite: kein Qualitätsverlust beim Diktieren, und bei der Korrektur wird nur abgeprüft, ob eine interne Soundkarte vorhanden ist.) Das Diktat läuft sehr flüssig und mit minimaler Fehlerrate. Im Vergleich zum VXI Parrott TalkPro USB, meinem ehemaligen Standardmikro, konnte ich eher eine leichte Qualitätsverbesserung feststellen, v.a. in der Geschwindigkeit der Umsetzung.

Eine Vorschau des Headsets gibt es unter http://www.jolodata.de/vxi/parrottb150gtx_deutsch.htm, dort hoffentlich bald auch Preise.