21 Dezember 2006

Gastbeitrag: Spracherkennung in Windows Vista

"Ich habe jetzt einige Stunden mit der eingebauten Spracherkennung in Windows Vista (finale Version) experimentiert. Erste Beobachtungen: Es gibt ein empfehlenswertes Benutzertraining wie bei Dragon, ungefähr in der gleichen Länge. Anschließend ist die Erkennungsleistung sehr, sehr hoch. Ich schätze mal ungefähr so gut wie bei Dragon 9. Das gesamte Auftreten der Spracherkennung wirkt modern und frisch, manches wünscht man sich auch bei dem Drachen. Statt einer oberen Menüleiste existiert nur ein kleiner Indikator-Button, der den aktuellen Zustand anzeigt. Wie bei Dragon läßt sich das Vokabular durch Analyse der eigenen Word-Dokumente und E-Mails ergänzen. Das habe ich nicht getan, und trotzdem werden nicht alltägliche Begriffe wie "DSL-Gebühren" oder "Thyssen-Krupp" von Anfang an verstanden (offene Frage: wird dynamisch mit dem Erstellen neuer Text aktualisiert?). Insgesamt ist die Ausstattung so etwas wie "Dragon light". Es fehlen also viele Optionen und Möglichkeiten eines professionellen Systems und es wird Appetit gemacht auf "mehr". Man kann sich gut eine Plus-Version vorstellen. Mein gewichtigster Einwand gegen die Microsoft-Spracherkennung ist das Korrekturverhalten. Man kann falsch Verstandenes im Korrekturfenster mehrfach neu vorsprechen. Häufig wird es dann richtig erkannt. Aber es ist definitiv nicht möglich, schnell einen Eigennamen oder Fachbegriff per Tastatur einzugeben. Man muß vielmehr buchstabieren, und das ist eine Qual. Schon aus diesem Grund wird der professionelle Diktierer vorerst beim Drachen bleiben. Indes ist das alles ein sehr erfolgversprechender Anfang. Die Spracherkennung hat übrigens die Versionsnummer 8, die Textausgabe ist nur amerikanisch möglich. Das Parrot-Headset arbeitet nicht mit Vista zusammen, ich habe also mit dem Olympus-Diktiermikro DR-2000 gearbeitet. Dr. Michael Spehr, 19.12.06" 

Vielen Dank für den Beitrag!

18 Dezember 2006

Dragon 9 Service Pack 1

Das Service Pack 1 für Dragon NaturallySpeaking 9 ist da. 
Hier findet sich die Ankündigung und Technote bei Nuance

Willi Sander hat einen direkten Download-Link und eine teilweise Übersetzung hier bereitgestellt:
http://www.fachvokabulare.de/
und dann Klick auf "Programme".

Hier noch seine Ankündigung und eine kleine Forumsdiskussion über die richtige Installation.

Interessant für Entwickler ist v.a. die Bearbeitung des VocTools, mit dem jetzt hoffentlich wieder möglich ist, ein Vokabular inkrementell, also Schritt für Schritt aufzubauen.

Nach der Installation kann ich für meinen Teil feststellen, dass zumindest das Zahlenformat, welches angeblich jetzt besser laufen soll, immer noch nicht ganz alltagstauglich ist - "22 per Dezember 2006" kommt immer noch genauso häufig wie 22.12.2006.  

10 Dezember 2006

FAZ-Test von Linguatec Voice Pro

Hier noch der Nachtrag zu den letztlich gebloggten Kritiken von Linguatec Voice Pro 11: 

Michael Spehr, FAZ-Spezialist fürs digitale Diktat, hat Voice Pro in der Ausgabe vom 5.12.2006 getestet. Sein Fazit: zu loben sind die hohe Erkennungsrate, der günstige Preis von 200 € und die verhältnismäßig bescheidenen Systemanforderungen (Kunststück – der verwendete Erkenner ist ViaVoice 10.5, das ist drei der vier Jahre alt). Auch die Arbeit mit Anwendungen, die im Browser laufen, gehe flüssiger als mit Dragon. Outlook Web Access funktioniert laut Testbericht mit VoicePro besser als mit Dragon. Im professionellen Einsatz sei Linguatec VoicePro jedoch keine Alternative zu Dragon NaturallySpeaking: der Lernprozess der Software sei deutlich komplizierter, und das zu erzielende Lernergebnis in der Spracherkennung niedriger.

Dies deckt sich mit meinen Erfahrungen, die ich vor Jahren mit Voice Pro 10 gemacht habe: die Ansätze sind gut, die Erkennung schwankte zwischen fehlerfrei und völlig indiskutabel, und die Korrektur war gewöhnungsbedürftig. Mir fielen außerdem schon damals die vielen kleinen Ärgerlichkeiten auf, die der Tester auch jetzt wieder erwähnt – viele Funktionen sind einfach nicht sauber umgesetzt, das Wechseln zwischen den Fenstern dauert elend lange, die Kompatibilität mit Word war nur im Prinzip gewährleistet, und was dergleichen Bugs mehr sind.

05 Dezember 2006

Linguatec VoicePro 11 im Test

Gut, das Nuance-Forum ist nicht unbedingt der Ort, an dem man Lob von ViaVoice, 
und sei es in seiner Inkarnation als Linguatec Voice Pro,  erwarten würde. Insofern stimmt ganz hoffnungsvoll, dass einige Anwender durchaus ein positives Wort darüber verlieren - auch wenn der Drache weiterhin für sie erste Wahl bleibt.

So schreibt Willi Sander:

Wie nicht anders zu erwarten war, verbirgt sich hinter VoicePro 11 die 10.5er Engine von ViaVoice. Trotzdem ist die Erkennungsgenauigkeit erstaunlich gut. [...] Die Bearbeitung der benutzerdefinierten Wörter ist immer noch ein Krampf, das Austauschen von Wortlisten ist nicht möglich.
Alles in Allem eine Alternative für Hobbyanwender [...].
Rolf Richter:

Seit fast zwei Wochen bin ich im Besitz der Version 11 von ViaVoice.  [...] Die Firma Linguatec hat ziemlich gute Arbeit geleistet, die befürchteten Defizite waren meist nicht mehr vorhanden.
[...] 
Trotzdem, wenn ich ein Resümee ziehen sollte-ich bleibe natürlich bei Dragon, dies ist doch die bessere Alternative. Die Genauigkeit bei der Erkennung ist um einiges besser, auch die Korrektur ist schneller bewerkstelligt, die Übernahme neuer Wörter in das Vokabular ist ungleich effektiver, den größten Vorteil finde ich, dass man direkt in das Vokabular gehen kann, um dort Veränderungen vorzunehmen, zum Beispiel löschen usw. es ist bei ViaVoice eigentlich kaum möglich.  [...] Dieser Beitrag wurde mit ViaVoice verfasst, ohne größere Verzweiflung.
Georg Eisenmann:

Nach einem recht langen Training, bei dem das erste Wort eines Satzes oft nur schwer vestanden wurde, habe ich dann drauf los diktiert. Leider war das Ergebnis nicht berauschend. In jedem Satz mehrere Fehler. Nicht einmal das Wort VoicePro wurde verstanden. Darüber recht geschockt versuchte ich mich anschließend mit dem neuen Mikrofon (von Sennheiser) an Dragon. Hier wurde dann weitaus mehr verstanden, dann und wann ein Fehler im Satz, aber passabel.
Der kurze Vergleich war fair: Weder VoicePro noch Dragon wurde mit alten Dokumenten gefüttert oder anderweitig optimiert wurde. Es fand auch nur jeweils das Anfangstraining statt (ca. 5 Minuten bei Dragon und bestimmt 15 Minuten bei Voicepro. Ein echter Test war das natürlich nicht.
Wie mir mein Vater gerade sagt, steht auch in der FAZ heute ein Test, der ähnliche Ergebnisse liefert - das Diktat ist an sich nicht schlecht, das Vokabular lässt sich aber nur umständlich bearbeiten. So muss fast jedes neue Wort trainiert, d.h. vorgesprochen werden - das hatten wir doch überwunden geglaubt? Sobald ich den Test vorliegen habe, trage ich ihn hier nach.

Einen eigenen Test werde ich aber wohl kaum durchführen können, wo ich doch jetzt bei der Konkurrenz bin, Rike...

04 Dezember 2006

Elektronischer Dolmetscher erhöht die Glaubwürdigkeit - ?!?

Das US-Militär testet den elektronischen Dolmetscher Englisch-Arabisch "Mastor" von IBM - so vermeldet die PC-Welt online.  

Der Anwender, beispielsweise ein US-Soldat, würde dann ganz normal in das Mikrophon sprechen, worauf die IBM-Software simultan mit der Übersetzung beginnt und den Inhalt auf Arabisch per Lautsprecher ausgibt. Umgekehrt wird die Antwort auf Arabisch ins Englische übersetzt. Darüber hinaus werden die Sätze zu Kontrollzwecken sowohl in der Originalsprache als auch in der Übersetzung auf dem Display angezeigt und der übersetzte Satz wird zugleich in die Originalsprache zurück übersetzt, um es dem Originalsprecher zu ermöglichen, Missverständnisse oder falsche Übersetzungen schnell zu erkennen und gegebenenfalls zu korrigieren.
Ob das funktioniert? Meine Ergebnisse mit Dragon-Spracherkennung und PROMT-Übersetzung waren nicht wirklich alltagstauglich. Auch die Rückübersetzungsfunktion scheint mir nicht 
die beste Kontrollmöglichkeit, ob das Gegenüber wirklich das Gemeinte verstanden hat. Wer die einschlägigen Seiten für maschinelle Übersetzung kennt, weiß, dass hier gerne mal "Stille Post" gespielt wird. Legendär die Hin- und Her-Übersetzung des "Adobe Acrobat Reader" als "Lehmziegel Seiltänzer Leser" oder noch schöner "Ziegelsteinseiltänzerleser". Den Ernstfall möchte man sich nicht wirklich vorstellen. 

Einerseits: wenn die US Army mit dem entsprechenden Kapital dahintersteckt, kommt ja vielleicht wirklich was dabei rum...

Andererseits: eine kurze Recherche fördert diesen Artikel der Netzeitung zutage. Wenn es darum geht, dass eine Maschine vertrauenswürdiger [sic!] 
übersetzt als ein Mensch, und das auch noch jemand glaubt (!), 
dann sind wir wirklich weit gekommen - aber nicht unbedingt technologisch.

03 Dezember 2006

Der Blaupapagei

Seit einer Woche diktiere ich mit dem Bluetooth-Headset B150 GTX von VXI (auch unter BlueParrott bekannt) und kann nur sagen: so viel Spaß hatte ich selten beim Diktieren. Sehr guter Tragekomfort, ausgezeichnete Erkennung und kein Kabel - bei dem Gerät werde ich in der nächsten Zeit bleiben. Für mich allein schon wegen des Tragekomfort wesentlich besser als Xovox, auch wenn ein Kopfbügel natürlich nicht jedermanns Sache ist.

Das Gerät ist sehr robust gebaut, mit einem metallenen Kopfbügel und einem stabilen Mikrofonarm. Auch das Ohrpolster ist aus robustem Kunstsoff, lediglich der Mikrofonschutz sitzt - wie immer bei VXI - etwas locker und sollte fixiert werden. Am Headset selbst git es drei Tasten - eine Multifunktionstaste für an, aus, pairing; je eine für lauter bzw. leiser, wobei ein viersekündiger Druck auf die "Lauter"-Taste das Mikro stumm schaltet.

Die Reichweite des Headsets habe ich mit Skype ausprobiert. Sie beträgt mit dem Anycom-Dongle ca. 10m, wobei die Wände nicht zu dick sein sollten. Aus dem Nebenzimmer funktioniert es, aber über den Flur wird es langsam kritisch, und die Übertragungsqualität sinkt rapide. Aus der Entfernung wird aber niemand diktieren wollen.

Einen kleinen Abstrich musste ich beim Ladegerät machen, das für den mobilen Einsatz konzipiert ist und daher nicht sehr standfest ist. Die Handelsausgabe wird mit einem stabilen Ladegerät geliefert (s. Bild).

Dafür habe ich einen Anschluss an den Zigarettenanzünder, so dass man das Headset zur Not auch im Auto laden kann - wer's fürs Handy braucht. (Persönliche Meinung: fürs Handy ist es zu schade, zum Telefonieren tuts jedes billige Ding, aber für Spracherkennung - und die geht nicht wirklich im Auto - muss es was Gutes sein.) Es gelten natürlich wie immer die üblichen Abstriche für Bluetooth, also dass man zum Beispiel bei jedem Start des Rechners wie auch nach dem Laden die Verbindung neu herstellen muss.

Obwohl Dragon 9 explizit Bluetooth-Headsets unterstützt, habe ich das Gerät als Standard Mic-Line In angelegt, und es hat nicht geschadet. (Hintergrund: gelegentlich speichere ich Diktate zur späteren Korrektur, und dann fordert Dragon dasselbe Eingabegerät, welches auch zum Diktieren benutzt wurde. Ich habe schon erlebt, dass Korrekturplätze nicht gearbeitet haben, wenn nicht das Original Philips Speechmike dranhing. Mit Mic/Line in ist man da auf der sicheren Seite: kein Qualitätsverlust beim Diktieren, und bei der Korrektur wird nur abgeprüft, ob eine interne Soundkarte vorhanden ist.) Das Diktat läuft sehr flüssig und mit minimaler Fehlerrate. Im Vergleich zum VXI Parrott TalkPro USB, meinem ehemaligen Standardmikro, konnte ich eher eine leichte Qualitätsverbesserung feststellen, v.a. in der Geschwindigkeit der Umsetzung.

Eine Vorschau des Headsets gibt es unter http://www.jolodata.de/vxi/parrottb150gtx_deutsch.htm, dort hoffentlich bald auch Preise.

29 November 2006

Macht Vista-Spracerkennung den Netscape mit Nuance?

Microsoft Vista to silence IBM ViaVoice, Nuance - titelte der Inquirer schon vor einiger Zeit. Keine Ahnung mehr, ob ich den Artikel damals gebloggt habe, gelesen hab ich ihn auf jeden Fall schon mal.

Wird Spracherkennung jetzt eine Massenanwendung, einfach weil sie so vielen Nutzern kostenlos zur Verfügung steht? Und wird Microsoft damit dasselbe mit Nuance / Dragon machen, was sie im Browserkrieg mit Netscape gemacht haben? Die Antowrt hängt m.E. davon ab,

- wie gut die Spracherkennung wirklich ist, und das heißt: wie alltagstauglich für den ungeschulten Anwender;
- wenn sie es ist: wie viele Leute den Nutzen von Spracherkennung zu schätzen lernen, und ob damit eine so kritische Masse erreicht wird, dass es wirklich ein Massenphänomen wird wie damals das Internet
- und das wird ein Graswurzelphänomen sein: "Probier das mal aus, das ist klasse".
- womit wir wieder beim ersten Punkt wären: Jeder Depp muss mit Vista diktieren können, damit es ein Erfolg wird.

QED: Hat irgendwer wirklich die Spracherkennung von MS Office XP genutzt?

Übrigens: Laut Chuck Runquist, der es wissen muss, hat Nuance / Scansoft keinen Code geliefert, sondern die Entwicklung hat MS allein gemacht - wenn auch unter Berücksichtigung von L&H-Technologie.

Dass sich Vista in vielem wie Dragon benimmt und z.B. auf dieselben Befehle hört, scheint also eher eine Marketing-Entscheidung zu sein.

21 November 2006

Are you talking to me? No! I'm talking to my computer! Check out this new Voice Recognition program.

Endlich hatte ich Zeit, mir dieses Video anzusehen: Spracherkennung in Windows Vista (Englisch, natürlich).

Den Stil der Darbietung muss man mögen - Frage und Antwort dienen hier eigentlich mehr zur zweistimmigen Präsentation der Spracherkennung in Windows Vista. Aber so ist Amerika. Viel beeindruckender sind die Möglichkeiten, die gezeigt werden - und die Dragon NaturallySpeaking alle schon seit Urzeiten enthält :-)

Wirklich schön ist die Tatsache, dass man anscheinend zwei Sprachbefehle direkt hintereinander sagen kann, ohne eine Pause machen zu müssen. Das funktioniert in Dragon NaturallySpeaking nun wirklich nicht.

Auch der Rest - nicht ganz neu, aber beeindruckend. Nun gehen wir natürlich davon aus, dass ein amerikanischer Interviewer, wenn er schon in diesem Stil das Gespräch führt, nicht daran interessiert ist, Fehler zu zeigen. Aber wenn es noch halbwegs in Echtzeit aufgenommen wurde, was da präsentiert wird, so ist die Leistung wirklich sehr gut. Und wenn nicht, wenn ist die Umsetzung in den Film immer noch gelungener als die beiden Nuance, wo der Diktant Herr Meyer "Neue Zeile" sagt und die Spracherkennung einen neuen Absatz macht.

Also: nehmen Sie sich 12 Minuten Zeit und sehen Sie sich das Video an. Interessant ist es auf jeden Fall. Und im Hause Nuance, wenn man keinen Geheimvertrag mit Microsoft abgeschlossen hat (worauf allerdings manche Details schließen lassen), sollte man sich jetzt warm anziehen.

14 November 2006

Wozu man Spracherkennung wirklich braucht (Video)

Nuance hat ein paar Videos bei YouTube eingestellt, von denen Büro Meier - Hilfe endlich zeigt, wozu man Spracherkennung wirklich braucht.

Der Liebesbrief hat auch was, ihm fehlt aber ein wenig der Realitätsbezug - ich nehm das Headset vorher ab :-)

Und die Beschwerde ist vorhersagbar...

Und zum Schluss die Kapitalismuskritik: hier finden sich alle drei Videos in einem schon weniger basisdemokratischen Kontext.

01 November 2006

Aufnahme unerwünschter Wörter in das Vokabular

Die Aufnahme unerwünschter Wörter in das Vokabular kann mit einem Tool von Willi Sander namens dns.comfort.local unterbunden werden. Dieses Werkzeug listet am Ende einer Sitzung alle neu hinzugefügten Wörter auf und lässt die Aufnahme ins Vokabular bestätigen. Auch nicht schlecht; und wohl ein Spin-off von Speechpool, welches diselbe Funktion enthält (aber für die Aufnahme in den Pool, nicht nur ins individuelle Vokabular). Anfragen unter www.oa-sa.de, eine direkte Bestellmöglichkeit gibt es leider nicht.

Noch ein Hinweis auf das Forum, das Willi Sander unterhält - mit guten Tipps, und wenig Diskussion.

Patch A für Dragon 9

Willi Sander weist auf den Patch A für Dragon 9, und zwar für alle Sprachversionen, hin. Dieser Patch verhindert laut Eintrag in der Nuance Knowledge Base das Einfrieren von Dragon während langer zusammenhängender Äußerungen. Den Patch gibt es dortselbst zum Download.

Herr Sander meint, dass der Patch noch ein paar Probleme mehr behebt. Ich kam bisher auch ohne ganz gut zurecht, werde es aber nachher mal probieren.

Nachtrag:
Dragon für 4voice läßt sich damit nicht aktualisieren - ist schon drin, sagt der Installer. Die Nuance-Version hab ich gerade nicht greifbar.

Ich bin jetzt bei der 4voice AG

Persönliche Neuigkeit: ab heute bin ich bei der 4voice AG als Technical Sales Consltant (whatever that means) tätig. Geneigte Leser erreichen mich also ab sofort unter stephan.kuepper [at] 4voice.de.

Natürlich spekuliere ich gern weiter über Fragen, warum der Drache das tut, was er tut, und welches Headset jetzt das beste ist (demnächst im Test das neue BlueParrott). Mein Geld verdiene ich aber mit der Beratung zur Anschaffung größerer Systeme.

Bei der Gelegenheit sollte ich vielleicht noch ein paar Sachen nachtragen, die während des Jobwechsels vergessen wurden oder zu kurz kamen:

- Dictanet macht den Vertrieb jetzt wieder komplett über die Software AG, nachdem die Vertriebs-GmbH fast komplett zu Philips gegangen ist. Zur Strafe verkauft Dictanet jetzt keine Philips-Mikros mehr, sondern rät zu Olympus. Ich höre Philips weinen.

- In der Frankfurter Allgemeinen Sonntagszeitung war letztlich ein Test von Dragon 9, wieder von Michael Spehr. Ich habe drauf verzichtet, ihn großartig zu bloggen, es steht nämlich nichts neues drin (schade, Herr Stückmann, aber die FAZ und FAS wird eben nicht von Dragon-Profis gelesen).

(Danke an Arnd Müller)

26 Oktober 2006

Linguatec berücksichtigt jetzt de Oberbayern

Im Technology Review spricht Dr. Reinhard Busch, Chef von Linguatec, über das neue Linguatec Voice Pro 11 und die verbesserten Akustikmodelle. Einerseits beschreibt er sehr schön die Neuheiten in den verwendeten "akustischen Profilen" (die offensichtlich also nicht auf einer veränderten Spracherkennungsengine beruhen), gibt aber auch für Anfänger interessante Hinweise über die Technik hinter der Spracherkennung (hier noch mehr).

Bisher ist Voice Pro 11 noch gar nicht ausgeliefert. Wenn sich die ersten Erfahrungen einstellen, kommt vielleicht auch ein neuer Post dazu -)

Abhilfe gegen die Aufnahme unerwünschter Wörter in das Vokabular

Im Nuance-Forum werde ich nicht nur zitiert :-) sondern auch ergänzt:

Um Dragon davon abzuhalten, unerwünschte Wörter heimlich ins Vokabular aufzunehmen, kan man nicht nur unter "Optionen" den Haken bei "Dem Vokabular Wörter automatisch hinzufügen" herausnehmen (und dann manche Wörter, z.B. Komposita, manuell hinzufügen müssen). Willi Sander bietet auch ein Tool namens dns.comfort an, welches diese und andere Aufghaben übernimmt. Auf der Website www.oa-sa.de ist das Tool allerdings nicht zu finden. Wem die Forumsdiskussion Appetit gemacht hat, der wendet sich am besten direkt an Herrn Sander.

Übrigens unterhält er auch ein Forum mit vielen interessanten Tricks.

19 Oktober 2006

Linguatec Voice Pro 11 kommt!

Totgesagte leben länger: Linguatec bringt die Spracherkennung Voice Pro in Version 11 auf den Markt - mit einer überarbeiteten Erkennungsmaschine von IBM ViaVoice! Und alle sagen, IBM arbeitet nicht mehr an der Diktiersoftware, sondern konzentriert sich auf Server und Embedded-Lösungen.

VIaVoice ist bei IBM nach wie vor auch nicht als Produkt gelistet, auch Nuance kennt nur VV 10 - die wollen ja auch Dragon verkaufen. Linguatec hat aber immer gute Verbindungen zu IBM gehabt (war ja mal eine Tochtergesellschaft), und da hat man die Entwickler wohl doch noch zur Arbeit an der Diktiersoftware bewegen können.

Linguatec hat nach eigener Aussage die Oberfläche so gelassen, wie sie ist, aber die Erkennung deutlich verbessert. Man ist gespannt, wie es sich in der Praxis schlägt. Die andere Frage ist immer noch, wie es mit der Bedienung aussioeht - da war Dragon immer besser und schneller.

(Mit Dank an Ronny Jaekel)

18 Oktober 2006

C´t über Vista´s Spracherkennung

"Die Diktierfunktion kann noch nicht mit fortgeschrittenen Lösungen wie Dragon NaturallySpeaking mithalten, blamiert sich aber auch nicht.
Immerhin folgt Vista deutschen Befehlen ... und blendet auf das Wort "Mausraster" ein durchnummeriertes Gitter an, das Anwender per Stimme ansteuern können."

(C´t 21/2005)

Rike Bacher hat´s auf Deutsch getestet und war positiv überrascht, auch wenn in ihrer Beta die Befehle nicht funktionierten. V.a. Die Kommandozentrale hatte es ihr angetan.

04 Oktober 2006

KnowBrainer Forum neu designt!

Das KnowBrainer Forum, das beste Dragon-Forum im Internet, hat endlich ein neues, zeitgemäßeres Design. Leider ist es jetzt nicht mehr so einfach zu lesen :-)

Dafür ist es aber weit strukturierter; und man soll die Hoffnung nicht aufgeben, dass vielleicht irgendwann so etwas wie eine FAQ-Liste aus den immer wiederkehrenden Themen erwächst. T3echnisch sollte es jetzt zu realisieren sein. Unter http://speechwiki.org/SR/NaturallySpeakingFAQ.html stelt Ian (Natajus), ein eifriger Mitleser und -schreiber, aber gerade welche zusammen, und deutschsprachige Leser kennen vielleicht auch die Dragon-FAQs bei abitz.com, die vom Autor dieser Zeilen zusammengestellt wurden.

22 September 2006

VXI Roadwarrior Bluetooth-Headset

Die Firma VXI ist bekannt für ihre robusten Headset-Lösungen, die darüber hinaus eine hervorragende Tonqualität für Spracherkennung mit Dragon NaturallySpeaking bieten. Das VXI Parrott TalkPro ist seit längerer Zeit das Headset meiner Wahl, weil es bequem sitzt und unter günstigen Umständen eine praktisch hundertprozentige Erkennung meiner Sprache garantiert. In Amerika sind schon länger Bluetooth-Lösungen von VXI auf dem Markt, von denen die ersten Geräte jetzt auch in Deutschland getestet werden. Ich hatte die Möglichkeit, ein solches Gerät - blueparrott RoadWarrior B150 - vom Distributor Jolo Data zum Test zu erhalten. Das Headset selbst wendet sich, wie der Name schon sagt, eigentlich an Lkw-Fahrer, die unterwegs mobil telefonieren möchten und eventuell auch den Computer nützen möchten - zumindest ist auf der Verpackung ein rustikal aussehender Herr im Führerhaus eines Lkw mit einem Notebook auf den Schoß zu sehen.

Die solide Ausführung des Headset bezieht sich also auf den potentiellen Einsatzbereich. Jedoch wurde das Headset auch von Nuance für Dragon NaturallySpeaking zertifiziert; um es mit einem PC zu verwenden, muss diese entweder Bluetooth-fähig sein oder man benötigt einen Bluetooth-Adapter. In kurzer Zeit soll aber ein fertiges Paket mit Headset und Bluetooth-Adapter lieferbar sein.

Voraus schicken muss ich, dass Bluetooth und ich zwei verschiedene Welten sind. Es ist mir noch nie gelungen, ein Bluetooth-Gerät auf Anhieb anzuschließen und zu benutzen. Vor diesem Hintergrund ging es erfreulich schnell, das Headset mit meinem PC zu verbinden. Nachdem es über Nacht aufgeladen wurde, ließ es sich problemlos verbinden und als Standard-Gerät einstellen.

Auch der Einsatz mit der Spracherkennung Dragon NaturallySpeaking gestaltet sich verhältnismäßig unproblematisch. Wichtig ist, das Bluetooth-Headset als zusätzliche Diktierquelle anzulegen. Man muss man leider noch einmal ein vollständiges Benutzertraining absolvieren, bevor man anfangen kann zu diktieren. Es hilft nicht, einfach nur den Audio-Assistenten auszuführen - die Erkennungsgenauigkeit ist danach absolut unzureichend.

Auch beim Anlegen des Bluetooth-Headset als neuer Diktierquelle hatte ich das Problem, dass am Anfang die Übertragung anscheinend nicht ausreichend war. Zumindest erschien im Audio-Assistent beim Einstellen der Lautstärke eine Fehlermeldung, es war unmöglich, weiter zu gehen. Im letzten Schritt erzielte ich dann immerhin 17 Punkte. Dies ist etwas unter meinem gewöhnlichen Durchschnitt.

Zunächst mal kann ich sagen, dass das Headset sehr bequem sitzt. Es wird nicht am Ohr befestigt, sondern mit einem Überkopf-Bügel, welcher anscheinend derselbe ist wie beim VXI Parrott TalkPro. Jedenfalls ist das Gerät sehr bequem. Optisch etwas gewöhnungsbedürftig ist die relativ große Sendestation am Ohr, die darüber hinaus während der Arbeit blinkt - die Kollegin beschwert sich schon über die Leuchtzeichen, die ich aussende. Das Gewicht und der ausgeübte Druck sind auf jeden Fall sehr gut auch über längere Zeit zu ertragen.

Am Gerät selbst sind drei Knöpfe - ein Multifunktions-Knopf, mit dem sich zum Beispiel das Headset stummschalten oder auch Telefongespräche annehmen lassen, zwei Knöpfe zur Lautstärkeregelung.

Jetzt zur Qualität der Spracherkennung. Das erste System, auf dem das Gerät getestet wurde, ist ein Computer mit einem Pentium vier-Prozessor, 3,4 GHz, 1 GB RAM. Der verwendete Bluetooth-Strecke stammt von der Firma BlueSoleil - zu meiner Schande sei's gesagt, aber es ist ein einfacher Aldi-Rechner. Die erste Zählung von Wörtern und die Ermittlung des Fehlerquotienten ergibt:

516 Wörter, 13 Erkennungsfehler (wenn man die regelmäßige Fehlerkennung von Bluetooth als Lotus nur einmal wertet) - also eine Erkennungsgenauigkeit von 97,5% nach der Formel 100-(Fehler*100/Wörter) = Erkennungsrate in %.

Ein Test auf einem Notebook (Pentium M. 1,8 GHz, 1 GB RAM) ergibt ein ähnliches Bild. die Erkennung läuft hier etwas schneller als auf dem Desktop-PC, bei der Konfiguration beziehungsweise beim Benutzertraining ergab sich dasselbe Problem mit der Lautstärke Einstellung des Mikrophons.

Als Bluetooth-Stack kommt ein Dongle zum Einsatz, das ursprünglich für die Verbindung mit einem Sony Ericsson-Headset vorgesehen war (im Paket als Xovox Communicator erhältlich). Angeblich ist dieser Bluetooth-Stack besonders gut zur Zusammenarbeit mit Spracherkennung geeignet. Im übrigen habe ich das Sony Ericsson-Headset früher mit beiden Rechnern verwendet, konnte aber keine großen Unterschiede in der Qualität auf dem einen oder anderen Rechner feststellen.

Bezüglich der Spracherkennungsqualität lässt sich feststellen, dass die Übertragung um einiges schneller geht als bei dem Olympus-Mikrophon, welches ich sonst verwendet hatte. Der gesprochene Text erscheint schneller auf dem Bildschirm. Allerdings machten sich bei beiden Testrechnern Verzögerungen bei der Erkennung von Befehlen bemerkbar. Dies ist in Dragon NaturallySpeaking 91 bekanntes Problem. (Auch wie diese ärgerliche Zusammensetzung von einer Zahl und dem unbestimmten Artikel zu einer anderen Zahl - aber dazu gibt es ja Tricks, wie man es vermeiden kann. Man muss nur daran denken, zum Beispiel "Dragon NaturallySpeaking 9 Leertaste ein bekanntes" zu sagen.)

Auffällig ist in dieser Kombination, dass nicht nur die Geschwindigkeit der Spracherkennung besser ist, sondern auch die Qualität. Abgesehen von völlig unbekannten Wörtern wird mein Diktat nach DragonPad mit fast 100 prozentiger Genauigkeit erkannt. (Und auch hier zeigt sich wieder eine Schwäche von Dragon NaturallySpeaking: sobald man anfängt, dass Programm zu loben, macht es Fehler.)

Nach Korrektur aller Erkennungsfehler und Abzug der Wörter, die nicht im Wörterbuch enthalten sind, ergibt sich eine Erkennungsgenauigkeit von 98%.

Inwiefern also ratsam ist, eine bestimmte Bluetooth-Software zu verwenden, sei einmal dahingestellt; ein Unterschied von einem halben Prozent in der Erkennungsgenauigkeit ist hier nicht wirklich aussagekräftig, schon gar nicht, wenn zwei verschiedene Rechner verwendet werden. Jedenfalls lässt sich schon nach einer oberflächlichen Betrachtung sagen, dass das VXI Roadwarrior-Headset eine gute Wahl ist, wenn man ein robustes, bequem zu tragendes schnurloses Headset sucht. Wenn dann demnächst der entsprechende Bluetooth-Adapter mitgeliefert wird, könnte es mein neues Lieblings-Headsets werden.

Huh!

"Endlich versteht dich jemand" - wirbt Nuance für Dragon NaturallySpeaking 9. Politisch korrekt ist die Verständnis heuchelnde Dame aber nicht :-)

Und eine hübsche Sammlung von Missverständnissen aus dem medizinischen Bereich (Englisch) gibt es beim Knowbrainer.

20 September 2006

Wie Zahlen funktionieren

Wie das Diktat von Zahlen funktioniert, erklärt Dieter Ruckstuhl von Mevotec im Dragon-Forum. Hilfreich auch die Hinweise von D. Peters und Carsten Stückmann in Antwort-Postings bezüglich der alten Probleme des Diktats von 20ern, Daten, und dem unbestimmten Artikel vor oder nach einer Zahl. Immer noch Workarounds, aber es geht.

Was mir auffiel, ist dass das Diktat von Ordnungszahlen in DNS Legal 9 einwandfrei funktioniert, in Professional hingegen nicht :-(

11 September 2006

Interview with Oliver Scholz: Vista Speech UX Program Manager at istartedsomething

Interview with Oliver Scholz: Vista Speech UX Program Manager at istartedsomething


Long Zheng's Blog heute mit einem Interview: Oliver Scholz, Produktmanager bei Microsoft und verantwortlich für die "User Experience" (d.h. die Benutzerführung bzw. Bedienbarkeit) der Spracherkennung in Windows Vista, hat eine Menge dazu zu sagen.

Richtig interessant wird die Spracherkennung wohl erst in ein, zwei Jahren, wenn Makro-Unterstützung, Vokabularfähigkeit und Mehrsprachigkeit eingebaut sind ... aber ich bin gespannt.

08 September 2006

Dinge, die die Welt nicht braucht

Nuance integriert Spracherkennung Dragon NaturallySpeaking in Tulip-Ego-Designernotebooks - und zwar DNS Standard in ein Notebook für schlappe 3.975,00 € - hier kann man es sich ansehen. Wenn man lange genug sucht, findet man auch die technischen Spezifikationen - 1 GB RAM, untere Grenze für DNS 9, und ein AMD Turion Prozessor.

Ist das jetzt die Reaktion auf die Spracherkennung in Vista? Immerhin bekommt man einen Zebra-Skin für das Notebook gratis dazu (normal 375 €), wenn man mal so richtig auffallen will. Ich seh Paris Hilton schon intime Details in ihr Zebra quatschen.

07 September 2006

Auffälliges Korrekturverhalten in Dragon

Unter phorum - Unofficial NaturallySpeaking Public Forum - Re: Revision and error correction revisited berichtet David Peters von folgendem Phänomen:

Diktiert man ein Wort, welches nicht im Vokabular von Dragon NaturallySpeaking enthalten ist, markiert man sodann dieses Wort und gibt man direkt das richtige Wort ein, ohne die Korrekturfunktion von Dragon NaturallySpeaking zu benutzen, so wird das Wort in das Vokabular aufgenommen! Dies gilt für Dragon NaturallySpeaking 8.

Das wollte ich immer schon einmal testen. In Dragon NaturallySpeaking 9 habe ich daher das Wort "Vattenfall" aus gegebenem Anlass ein diktiert und korrigiert. Ergebnis: wenn in den Optionen die Option "Wörter automatisch zum Vokabular hinzufügen" aktiviert ist, wird dieses Wort tatsächlich hinzugefügt!

Das heißt:

- ich diktiere "Vattenfall", Dragon schreibt "Daten Fall".

- ich sage "korrigier das", Dragon markiert die Phrasen und öffnet das Korrekturmenü.

- ich tippe einfach das Wort "Vattenfall" über die Markierung.

Ich diktiere noch einmal "Vattenfall", Dragon schreibt es korrekt und übernimmt das Wort mit einem roten Stern markiertes Vokabular.

Und jetzt die wirklich schlechten Neuigkeiten: Dragon NaturallySpeaking macht das auch, wenn ich ein diktiertes Wort nicht per Sprachbefehl markiere oder den Korrekturbefehl benutze, sondern wenn ich das Wort per Tastatur markiere und überschreibe. Damit nicht genug - selbst wenn ich das Wort lösche, welches Dragon NaturallySpeaking geschrieben hat, und danach eine Korrektur von Hand mache, wird das Wort in den Wortschatz aufgenommen!

Unter diesen Umständen kann ich nur empfehlen, die Option "automatisch Wörter hinzufügen" abzustellen. Wenn amn sich vorstellt, dass auch die Korrektur nur einiger Buchstaben dann in das Vokabular übernommen wird, wird einen ganz anders - und man versteht plötzlich, wo her die vielen, vielen benutzerdefinierten Müll-Einträge kommen, die sich im Laufe der Jahre ansammeln.

05 September 2006

"Wunderbare Erfahrungen!" FAZ-Rezension von Dragon 9

Heute erschien in der FAZ die Rezension von Dragon NaturallySpeaking 9. Aus urheberrechtlichen Gründen kann ich sie nicht ganz wiedergeben, daher hier nur einige Höhepunkte:

Der Rezensent (Dr. Michael Spehr) ist von Dragon NaturallySpeaking 9 begeistert. Zwar merkt er an, dass die Erkennungsgenauigkeit der Software sehr stark vom Diktierstil abhängt, nur unter bestimmten Bedingungen zu erreichen sind. "Der ungeübte Nutzer mit einem reichhaltigen Vokabular, ein Schriftsteller etwa, wird eher bei 95% liegen." Dafür hält er es für möglich, dass ein Arzt oder Rechtsanwalt mit einem klar definierten Wortschatz und häufig wiederkehrenden Formulierungen eine Genauigkeit von 100% erreicht. Übrig bleibt natürlich der Anspruch an den Diktanten, "druckreif" zu formulieren, also nicht die Gedanken erst niederzuschreiben und dann zu ordnen.

Nach Meinung des Rezensenten ist es nötig, das Benutzertraining mit Dragon NaturallySpeaking zu absolvieren, auch wenn die Software inzwischen ohne Training nur mit der Einstellung des Mikrophons gute Ergebnisse liefert. Außerdem empfiehlt er die Dokumentenanalyse von E-Mails und eigenen Dateien, um Dragon NaturallySpeaking mit dem eigenen Vokabular und der eigenen Schreibweise vertraut zu machen. [Dieser Analyse halte ich so, wie sie im Benutzerassistenten vorgenommen wird, sogar für schädlich: es wird wesentlich mehr Schrott aufgenommen als Wörter, die man tatsächlich braucht. Besser ist es, später im Erkennungscenter eine Analyse ausgewählter Dokumente vorzunehmen.] Die Wichtigkeit der Korrektur wird hervorgehoben; das Fehlen eines USB-Mikrophon zu angemerkt.

Positiv fällt auch auf, dass Dragon NaturallySpeaking 9 offensichtlich besser und schneller lernt als die Vorversionen.

Einige Hinweise gibt es auch zur Verwendung mit Diktiergeräten. Dragon NaturallySpeaking unterstützt in der aktuellen Version zusätzliche Audioformate wie MP3, WMA und WAV, und die Qualität der Umsetzung von mit einem digitalen Diktiergerät aufgenommene Diktate hat sich deutlich verbessert. Allerdings muss man gerade hier darauf achten, sauber zu diktieren, möglichst wenige Nebengeräusche zu produzieren und einen gleichmäßigen Abstand zwischen Mund und Diktiergerät einzuhalten. Dann erreicht man "sehr gute Resultate bei der Umsetzung von Aufnahmen, die im fahrenden Auto entstanden".

Weitere Neuerungen sind die Anwendung von Bluetooth-Mikrophonen, das Speichern der Benutzerdateien in einem Netzwerk und die automatische Umsetzung von Aufnahmen, die in einem vorher definierten Verzeichnis abgelegt werden.

Schließlich macht die verbesserte Kompatibilität von Dragon NaturallySpeaking mit zahlreichen Programmen viel Freude. Manchmal (wie z.B. beim Diktat dieses Eintrags) ist es allerdings auch noch nötig, dass Diktierfenster von Dragon NaturallySpeaking zu benutzen, in das sich doch sehr viel besser diktieren lässt als in nicht vollständig unterstützte Anwendungen. Dieses Diktierfenster ist allerdings - entgegen der Rezension - keine Neuerung in der aktuellen Version. Kritisch wird noch angemerkt, dass das Diktierfenster durchaus auch in einigen Anwendungen benötigt wird, die eigentlich unterstützt werden sollten - so gibt es im Internet Explorer oder in Firefox immer mal wieder Probleme.

Schließlich zitieren wir noch den letzten Absatz, der sich anhört, als käme er direkt aus der Marketing-Abteilung :-)

"Das neue Dragon ist also sehr empfehlenswert. Es gibt keine bessere Spracherkennung, und das Update auf Version 9 lohnt in jedem Fall."

PS Hier gibt's den Artikel, in DNS gelesen und ordnungsgemäß transkribiert von Willi Sander.

01 September 2006

Sneak Preview: Empfehlungen für Dragon NaturallySpeaking 9

Soeben fertig geworden und online gestellt:

- Empfehlungen beim Upgrade auf Dragon NaturallySpeaking
- Software- und Hardware-Empfehlungen

(beides als PDF).

Feedback bitte!

media|NRW - Nachricht: Sprachbarrieren in Europa überwinden

media|NRW - Nachricht: Sprachbarrieren in Europa überwinden

Neuen Nachrichten von meinem anderen Hobby - maschinelle Übersetzung, diesmal in Zusammenarbeit mit Spracherkennung. An so einem automatischen Dolmetscher arbeitet man ja mit unterschiedlichen Erfolgen schon seit längerer Zeit, wir erinnern nur an das damals viel zu früh gekommene (und verschiedene) Verbmobil-Projekt. Zum Spaß habe ich so etwas auch schon einmal mit Dragon NaturallySpeaking und @promt™ programmiert.

So, und jetzt eröffne ich die Diskussion über die Qualität einer Maschine, bei der beide Komponenten dafür bekannt sind, gerne einmal Fehler zu produzieren, die einem Menschen niemals unterlaufen würden. (Dass Menschen ganz andere Fehler unterlaufen, der eine Maschine niemals machen würde, steht auf einem anderen Blatt.)

Siehe dazu auch unten den Link zu der Übersetzung eines Forumsbeitrags :-)

Windows Vista bringt Nuance und IBM zum Schweigen

Microsoft Vista to silence IBM ViaVoice, Nuance

Der Inquirer sieht die Zukunft von Dragon und ViaVoice in dunklen Tönen. Die Integration von Spracherkennung in Windows ist er habe denselben Effekt wie der Internet Explorer ihn damals auf Netscape gehabt habe - Anwender werden nicht etwa das bessere Produkt auswählen, weil sie die Wahl zischen zwei Produkten haben, sondern sie werden gar nicht wählen und stattdessen das Produkt nehmen, das bereits auf Ihrem Rechner installiert ist.

Gleichzeitig fragt er, wie so IBM die Entwicklung von IBM ViaVoice praktisch eingestellt hat und damit zum Beispiel der Linux-Gemeinde Spracherkennung grundsätzlich vor enthält, wieso die Entwicklung bei Microsoft wesentlich zielstrebiger vor sich zu gehen scheint als bei Nuance, wieso Nuance sich nicht auf alternative Betriebssysteme konzentriert- um im bilde zu bleiben, schlägt er Nuance damit eine Art Mozilla-Rolle vor, also ein alternatives, besseres Produkt für mehr Plattformen, welches die Nische besetzt, die der Platzhirsch nicht bedienen kann oder will.

Die Reaktion von Nuance sieht allerdings, wie der Artikel berichtet, eher aus wie die Reaktion, die man ansonsten vom Platzhirsch erwarten würde: das Produkt sei überlegen, enthalte juristische und medizinische Wortschätze, welche der Konkurrenz fehlten, sei erhältlich für mehrere Sprachen... abgesehen davon, dass auch die Spracherkennung im Windows Vista in mehreren Sprachen erhältlich sein wird (deutsch ist eine von ihnen), mag es ja vielleicht sein, dass Ärzte und Juristen eine spezialisierte Anwendung verwenden werden. Genauso wird in Firmen ein Dokumenten-Management eingesetzt, aber der Heimanwender benutzt einfach den Windows Explorer (wenn er denn überhaupt so weit denkt).

IBM, früher der Pionier für Spracherkennung, hat bereits vor 10 Jahren ein Betriebssystem entwickelt, welches sich über Sprache steuern ließ. Dies ist aber komplett untergegangen. Eine Linux-Distribution von IBM ViaVoice ist ebenfalls seit längerer Zeit nicht mehr erhältlich (auch wenn einige Linux-Freunde immer mal wieder darauf hinweisen). Auch hier zitiert der Artikel nur ausweichende Stellungnahmen von IBM.

Der Hinweis auf diesen Artikel kommt aus einem Blog eines Microsoft-Entwicklers - immerhin. Dem darf man natürlich unterstellen, dass er sein eigenes Produkt besser findet als die der Konkurrenz. Ist ja auch sein gutes Recht. Umso mehr rechnen wir ihm an, dass er noch auf einige andere Punkte hinweist, die Dragon NaturallySpeaking im Moment Windows ist er voraus hat. So liegt Dragon NaturallySpeaking der Spracherkennung ein Headset bei (wobei ein Headset dieser Qualität nun wirklich kein Vorteil ist :-) Schon wesentlich interessanter sind die Makro-Fähigkeiten von Dragon NaturallySpeaking. Allerdings, wie man nicht ohne Grund anmerkt, liefert Microsoft ein SdK an Entwickler kostenlos aus, wohingegen das von Nuance richtig teuer ist, und auch OEM-Hersteller werden sich nicht nehmen lassen, ihren Computern demnächst Headsets beizulegen, gegen vielleicht sogar besser sind als die in einer Schachtel mit Dragon NaturallySpeaking (was ja, wie gesagt, auch nicht weiter schwer ist).

Meine Meinung: ich fürchte, sie haben recht. Nuance wird sich etwas ausdenken müssen, um das Produkt entsprechend zu positionieren. Das Schlimmste, was natürlich passieren kann, ist das die Microsoft Spracherkennung beim durchschnittlichen Benutzer dieselben Ergebnisse liefert wie in jener Produktdemonstrationen, und das Spracherkennung damit mal wieder für die nächsten Jahre von der Agenda verschwindet. Und es soll keiner glauben, dass Nuance dann sagen kann: "nehmt Dragon NaturallySpeaking, es funktioniert im Gegensatz zu Windows Vista". Die Leute werden immer nur sagen, dass Spracherkennung erwiesenermaßen eben nicht funktioniert.

Wie ich darauf komme? Fünf Jahre Telefon.

(diktiert mit Dragon NaturallySpeaking 9)

28 August 2006

Neuigkeiten in Dragon NaturallySpeaking 9 - Teil 3

Wenn man erst einmal mit der Arbeit beginnt, fallen einem dann die kleinen Sachen auf, die in der neuen Version entweder nicht verbessert worden oder sich anders verhalten als gewöhnt. Hier einige Auszüge:

- Getwords-Putwords funktioniert nicht mehr.
- das Befehlcenter sieht jetzt ganz anders aus und ist wesentlich schneller. Die Bearbeitung ist noch gewöhnungsbedürftig, es scheint aber einfacher zu gehen als in der Vorversion.
- das Thema Ordinalzahlen ist leider immer noch nicht gelöst. In Dragon NaturallySpeaking Legal mit dem juristischen Wortschatz funktioniert es, mit dem normalen Wortschatz nicht.
- ähnlich sieht es mit "§2" usw. aus - mit dem Wortschatz von Dragon NaturallySpeaking Professional lässt sich dieses Symbol mit der Zahl zusammen nicht ohne Eingriffe diktieren. (kleiner Tipp: man kann die Eigenschaften des Wortes Paragraph editieren, so dass es vor einer Zahl immer korrekt als § erscheint; eine genaue Anleitung veröffentliche ich vielleicht später).
- der Befehl "verbinde das" funktioniert nicht immer zuverlässig - mancher verbindet er nämlich gar nichts.
- auch das Problem mit dem Diktat von Zahlen nach Microsoft Excel ist noch nicht gelöst. Hier ist aber von dritter Seite eine Lösung in Sicht.

Noch etwas: eine maschinelle Rohübersetzung der Hinweise zur Bearbeitung des Vokabulars für das Upgrade nach Dragon NaturallySpeaking 9 findet sich unter f. Adresse:
http://tinyurl.com/rz5l4

(übersetzt mit PROMT, www.promt.info)

leider muss man "Periode" mal durch "Rechtschreibung" und mal durch "." Ersetzen, um den Sinn richtig zu verstehen - soweit ist die maschinelle Übersetzung leider noch nicht. Auf der Basis arbeite ich aber an einem Dokument, das die staunende Öffentlichkeit demnächst zur Kenntnis nehmen darf.

Ich darf übrigens ergänzen, dass ich diesen Beitrag natürlich diktiere - und zwar direkt nach Opera, wo er schnell und genau geschrieben wird. Das ist auch gut so, weil die Korrektur nämlich in diesem Fenster nicht funktioniert :-) aber wozu auch?

Hints for cleaning up your Word List.

Hinweise zur Bearbeitung einer Wortliste für den Import nach DNS 9 (englisch) gibt DSteiNeuro, einer der größten Gurus im Knowbrainer-Forum (s. Link rechts).

Jetzt ist die Chance da, all die Bugs und Fehler auszumerzen, die uns die letzten Monate genervt haben!

Mehr Neuigkeiten zu Dragon 9

Nach ein paar weiteren Installationsversuchen hier noch ein paar Erfahrungen:

1. einen Roaming User kann man doch updaten, wenn man eine Verbindung mit dem Server-Laufwerk hat, auf dem er gespeichert ist. Mit der lokalen Kopie geht das nicht. Allerdings ist es mir bei zwei Usern nur mit einem gelungen, also vielleicht doch lieber erst den Roaming User in der alten Version als lokalen Benutzer importieren, oder - noch besser - in DNS 8 eine Wortliste exportieren, in DNS 9 einen neuen Benutzer anlegen und die Wortliste importieren.

Perfektionisten werden einen Benutzer upgraden, sein Vokabular komplett mit Verwendungsinformationen exportieren, einen neuen Benutzer anlegen und das Vokabular importieren. Der Zwischenschritt muss sein, weil DNS 9 kein Vokabular aus DNS 8 direkt importieren kann (das wäre mal ein Feature, das man wirklich braucht). Weil aber die Algorithmen in jeder Version angepasst werden, ist nur ein Nutzer, der mit der aktuellen Version angelegt wurde, wirklich auf dem neuesten Stand.

2. Während der Installation gibt es eine Option: "Einstellungen für alle Benutzer verändern". Kreuzt man sie an, so werden alle unter "Optionen" gewählten Einstellungen für alle Benutzer auf diesem Rechner übernommen (z.B. Zugriffstasten, Anzeige oben oder in Taskleiste usw.) Sehr praktisch für Leute wie mich, die mehrere Benutzer auf einem Rechner haben und stark in die Programmoptionen eingreifen.

3. Ebenso lässt sich schon während der Information das Verzeichnis für den Roaming User eingeben - einfach die Option "Administrative Einstellungen verändern" ankreuzen.

25 August 2006

Erste Erfahrungen mit Dragon NaturallySpeaking 9

Zuerst die gute Nachricht:

Die Erkennungsgenauigkeit von Dragon NaturallySpeaking 9 ist von Anfang an sehr gut. Interessanterweise hatte ich bessere Resultate, wenn ich den Benutzer nicht trainiert habe. Nach 1. Rückmeldungen von Kollegen gibt es verschiedene Erfahrungen - alle sagen zwar, dass auch ohne Training die Erkennungsgenauigkeit bereits beeindruckend sei, einige raten jedoch trotzdem zu Training, während andere der Meinung sind, dass man jetzt gut darauf verzichten könnte. Möglicherweise hängt es davon ab, wie konzentriert man den Trainingstext vorliest - nachdem ich ihn beinahe auswendig kann, neige ich dazu, beim Lesen schlampig zu werden. Das wirkt sich dann natürlich auf die Qualität des Diktates aus.

Jetzt einige Beobachtungen und Hinweise für das eigentliche Upgrade. Ich habe zunächst auf einem Notebook, 1 GB Arbeitsspeicher, Centrino-Prozessor mit 1,8 GHz, die neue Version installiert und mehrere neue Benutzer angelegt sowie vorhandene Benutzer zumindest versucht in die neue Version zu übernehmen.

Die Installation einer Vollversion über eine bestehende Installation von Dragon NaturallySpeaking funktioniert problemlos. Da die Upgrades noch nicht angekommen sind, ist im Moment noch nicht ganz klar, was passiert, wenn man eine Upgrade-Version versucht auf einem Rechner ohne Installation von Dragon NaturallySpeaking neu zu installieren. In früheren Versionen musste man zuerst die alte Version installieren, um dann das Upgrade vornehmen zu können; gerüchteweise reicht es jetzt, die alte Programm-CD bei der Hand zu haben.

Vorhandene Benutzer im Standard-Verzeichnis werden schon am Ende der Installation auf den neuesten Stand gebracht, wenn man das will. Ansonsten gibt es wieder wie schon in Version 8 einen Upgrade-Assistenten, mit dem vorhandene Benutzer aktualisiert werden können. Einstellungen werden dabei übernommen, auch mehrere Vokabulare oder mehrere Diktierquellen.

Gescheitert bin ich dabei, Roaming Users zu aktualisieren. Wenn man das Standardverzeichnis angibt, in dem die Roaming Users gespeichert sind, erhält man eine Fehlermeldung. Es hilft auch nicht, sie in das "Users"-Verzeichnis zu kopieren. Offensichtlich müssen sie erst aus Version 8 exportiert werden, damit man sie nach Version 9 importieren kann.

Was aber hervorragend funktioniert, ist der Export und Import von benutzerdefinierten Wörtern. Wählt man "Wörter - exportieren", so erzeugt Dragon NaturallySpeaking 1 Wortliste im Textformat, die sich abspeichern lässt und unter Dragon NaturallySpeaking 9 über "Wörter - importieren" in einer neu angelegten Benutzer importiert werden kann - und zwar mit gesprochenen Formen.

Jetzt zum Thema Ressourcen: die Systemanforderungen für Dragon NaturallySpeaking 9 sind gegenüber denen von Dragon NaturallySpeaking 8 noch einmal gestiegen. In der Praxis macht sich allerdings auf meinem Notebook kein Unterschied in der Geschwindigkeit des Diktierens bemerkbar - wenn das Diktat erst einm das dauert nämlich deutlich länger. Während des Diktates wird der Arbeitsspeicher allerdings stark beansprucht - 30 bis 40% Auslastung sind Durchschnitt, während Korrekturen kann es auch schon einmal zu Spitzen von 100% kommen. Ein neuer Rechner muss also nicht unbedingt her.

In der Bedienung fallen einige Verbesserungen gegenüber der Vorversion auf - hier sind also offensichtlich bekannte Fehler beseitigt worden.

1. das Diktat von Ordinalzahlen funktioniert wieder. Es lassen sich also wieder per Sprachbefehl nummerierte Listen erstellen. Dafür werden jetzt allerdings wieder mehr Zahlen in den Fließtext eingebaut, was vor allem beim unbestimmten Artikel unschön ist.
2. nach einem Punkt wird in Word jetzt wieder korrekt weiter geschrieben, auch wenn zwischendurch korrigiert wurde. Der neue Satz fängt also korrekt mit einem Großbuchstaben und nicht mit einem kleinen Buchstaben an.
3. das Hinzufügen neuer Wörter zum Wortschatz während des Diktates ist jetzt eine Option. Dies wurde in verschiedenen Foren bereits heiß diskutiert - tendenziell ist es eine Fehlerquelle, dass Dragon NaturallySpeaking während des Diktates selbstständig Wörter zum Wortschatz hinzufügt, teilweise ohne den Benutzer zu fragen. Dies war vor allem bei Komposita ein Problem, weswegen ich die Option "Komposita selbstständig bilden" auch ausgeschaltet hatte und stattdessen lieber 2 Wörter mit dem Befehl "verbinde das" zusammengefügt habe. Ein derart gebildetes Kompositum wird jetzt automatisch zum Wortschatz hinzugefügt - für mich eine Erleichterung. Andere gehen vielleicht lieber anders vor, deaktivieren das automatische Hinzufügen von Wörtern zum Vokabular und lassen die eigenständige Komposita Bildung lieber eingeschaltet.

Wie sich Dragon NaturallySpeaking 9 tatsächlich in der Praxis bewährt, werde ich erst in der nächsten Woche ausführlich testen. Weitere Beiträge stehen also bevor.

Schließlich: diesen Beitrag habe ich parallel mit 2 Mikrophonen in 2 Rechner diktiert, der eine mit Dragon NaturallySpeaking 8, der andere mit Dragon NaturallySpeaking 9. Zieht man die Erkennungsfehler der Version 9 ab, die daraus resultieren, dass ich noch nicht den Wortschatz vollständig angepasst habe, ergibt sich ein Verhältnis von:

Dragon NaturallySpeaking 8 mit einem Benutzer, der seit einiger Zeit im Einsatz ist: 18 Fehler
Dragon NaturallySpeaking 9 mit einem neu angelegten, trainierten Benutzer: 14 Fehler (die ich aber weitgehend korrigiert habe :-)
Für mich eine eindeutige Verbesserung "out of the box".

24 August 2006

Schnittstelle zwischen Olympus DSS-Player und Dragon 9

Eine Schnittstelle für den Olympus DSS Player pro zu Dragon NaturallySpeaking 9 enthält die neueste Version 4.8.5 des DSS-Player, die unter folgender Adresse heruntergeladen werden kann:

http://www.olympus.de/consumer/2590_software.cfm

(Dort die entsprechende Software auswählen).

Außerdem wurden einige Bugs beseitigt.

22 August 2006

"Doppelt die Killer": heise online über Microsofts Panne mit Vistas Spracherkennung

Das zugehörige Video kursiert ja schon in den einschlägigen Foren, ist ja auch nett anzusehen. Der Mehrwert des Heise-Berichts (Danke, Frau Wiegand!) liegt aber im Kommentar: Das Problem, das der Microsoft-Spezialist hat, ist wohl jedem Anwender von Spracherkennung schon mal passiert, worauf dankenswerterweise hingewiesen wird.

Allerdings meist nicht in einem solchen Rahmen :-)

Außerdem danke für den Hinweis, dass die Vista-Spracherkennung zwar für Deutsch "fest geplant" ist, jedoch noch nicht fest steht, ab wann. Das passt dazu, dass die Ankündigung - wie schon gebloggt - eine Zeit lang auf der österreichischen MS-Site zu sehen war, dann wieder nicht, und dass Beta-Tester schon über die ersten Erfahrungen mit Spracherkennung berichtet haben.

Ach übrigens: Willkommen zurück. Nach Krankheit und Urlaub werden die Meldungen jetzt wieder häufiger kommen. Demnächst z.B. über die ersten Erfahrungen mit DNS 9 - die Installation läuft gerade auf dem Notebook.

18 Juli 2006

11 Juli 2006

Effizient korrigieren mit Dragon NaturallySpeaking

Die Korrektur von Erkennungsfehlern ist der einzige Weg, die Erkennungsgenauigkeit von Dragon NaturallySpeaking weiter zu verbessern. Noch mehr als das: wird ein Erkennungsfehler nicht korrigiert, geht Dragon NaturallySpeaking davon aus, das Wort korrekt erkannt zu haben. Der Fehler setzt sich also fest! Schon aus diesem Grunde sollten Sie jeden Erkennungsfehler konsequent korrigieren.

1. Korrektur per Sprachbefehl

Wenn Sie konsequent alles per Sprachbefehl machen wollen, werden Sie den Befehl "korrigier [Wort oder Wörter]" benutzen. Dieser Befehl markiert das Wort, welches Sie korrigieren wollen, und öffnet ein Fenster, in dem Ihnen verschiedene Korrekturen angeboten werden. Sagen Sie "nimm 1" oder "nimm 2" usw., um die korrekte Alternative auszuwählen, oder "schreib das", wenn sie nicht dabei ist. Es öffnet sich ein Fenster, in welches Sie das Wort einbuchstabieren können. Sie können die Buchstaben sagen oder - besser - das Buchstabieralphabet nützen, also z. B. "Anton" für "a", "Berta" für "b". Vor einem Großbuchstaben sagen Sie "Groß", also z.B. "groß Anton" oder "groß a" für "A". Sie können aber auch in dieses Fenster tippen - die meisten Leute finden das schneller und bequemer. Sie können auch die Rücktaste, Leertaste, Löschtaste und die Pfeiltasten benutzen. Mit der Eingabetaste übernehmen Sie die Korrektur in den Text.

2. Korrektur mit Tastatur und Maus

Schneller, bequemer und sicherer als per Sprachbefehl öffnen Sie das Korrekturmenü mit einer Funktionstaste. Markieren Sie das Wort, das Sie korrigieren möchten, und rufen Sie das Korrekturmenü mit einem Druck auf die Minustaste am Ziffernblock ganz rechts auf Ihrer Tastatur auf. Im Menü "Optionen" können Sie die Tastenbelegung ändern und eine andere Taste benutzen.

Im Korrekturmenü markieren Sie einfach die korrekte Alternative mit den Pfeiltasten und drücken Sie die Eingabetaste, um die Korrektur in Ihren Text zu übernehmen. Wenn die richtige Alternative nicht dabei ist, drücken Sie einfach noch einmal die Minustaste am Ziffernblock, um das Buchstabierfenster zu öffnen.

Lange bevor sich die Maus als Eingabegerät für den Computer durchsetzte, konnte man mit der Tastatur schon ganze Wörter, Sätze und Absätze markieren. Das funktioniert auch heute noch! Probieren Sie es einmal aus: Drücken Sie die Steuerungstaste, halten Sie sie gedrückt und drücken Sie die Pfeiltasten, um in Ihrem Text schnell vom Anfang eines Wortes zum nächsten Wortanfang zu springen.

Um ein Wort oder mehrere Wörter zu markieren, setzen Sie den Cursor neben das erste Wort, drücken Sie die Steuerungstaste, die Umschalttaste und die jeweilige Pfeiltaste und markieren Sie das gewünschte Wort beziehungsweise die gewünschten Wörter. Drücken Sie dann die Minustaste am Ziffernblock, um das Korrekturmenü aufzurufen. Weiter geht es wie oben beschrieben.

Vorteil dieser Methode: Markieren mit der Tastatur geht meist viel schneller als Markieren mit der Maus, und genauer ist es außerdem. Und ein paar Tastaturbefehle zu lernen sollte wirklich keinen überfordern!

Das Ziel ist, Erkennungsfehler möglichst schnell zu korrigieren. Benutzen Sie deswegen die Methode, die Ihnen am bequemsten und schnellsten erscheint. Das ist wahrscheinlich eine Mischung aus Sprachbefehl, Tastatur und Maus. Je effizienter Sie korrigieren, desto schneller sind Sie bei der Arbeit!

07 Juli 2006

Wie mache ich intelligente Fehler?

Common sense boosts speech software - berichtet das TRNmag. Forscher des MIT haben eine Technologie entwickelt, die verspricht, einer Spracherkennung ein gewisses Weltwissen beizubringen. So werden Kontextinformationen zur Auswahl der korrekten Alternative herangezogen, und bei der Korrektur erscheinen die Alternativen ganz oben, die im Zusammenhang am plausibelsten erscheinen (und nicht die phonetisch ähnlichen).

Natürlich treten auich weiterhin Erkennungsfehler auf, aber die Fehler folgen einem dem menschlichen Denken vertrauteren System.

"One surprising thing about testing interfaces like this is that sometimes, even if they don't get the absolutely correct answer, users like them a lot better," said Lieberman [der Entwickler]. "This is because they make plausible mistakes, for example 'tennis clay court' for 'tennis player', rather than completely arbitrary mistakes that a statistical recognizer might make, for example 'tennis slayer'," he said.


Und seien wir ehrlich - wir verstehen auch nicht jedes Wort, bemühen uns aber so gut es geht um Sinnkonstanz, d.h. versuchen eine unverständliche Aussage so zu interpretieren, dass sie im gegebenen Kontext Sinn ergibt. Wieder ein Schritt auf dem Weg, den Computer dem Menschen anzunähern - und sei es in der Art der Fehler, die er macht.

[Quelle ursprünglich Jen's Weblog]

05 Juli 2006

Korrekturbefehl ändern in Dragon

Im Nuance-Forum findet sich ein Hinweis darauf, wie man den Dragon NaturallySpeaking-Befehl "korrigier das", welcher die letzte Eingabe korrigiert, beliebig ändern kann. Ich weiß nicht, ob man hier nicht ein wenig mit Kanonen auf Spatzen schießt und ob man den Befehl nicht auch im Befehlcenter umbenennen könnte (ich habe grade mal nachgesehen, der Befehl "korrigier das" kann nicht einfach editiert werden), aber möglicherweise ist das eine interessante Alternative für alle, die nicht immer das Wort "das" korrigieren wollen. Oder für Leute, die genau dieses Wort korrigieren möchten, weil der Drache ist mit der Rechtschreibung mal wieder nicht hatten und vergisst, dass das das [diese drei Worte hat er auf Anhieb richtig geschrieben!] mit Doppel-S nur nach einem Komma stehen kann. Schließlich vielleicht auch eine Alternative für alle, die in mehreren Sprachen diktieren, sich aber nicht immer neue Befehle angewöhnen wollen.

Wer übrigens nicht auf Dragon NaturallySpeaking 9 warten möchte, indem sich das Diktiertextfeld in Größe und Layout vollständig anpassen lässt, kann mich eventuell auch lieb darum bitten, dass ich ihm ein bisschen Hilfestellung gebe :-)

Ich diktiere gerade selbst mit dem modifizierten Diktiertextfeld in ein Opera-Browser Fenster, und der Vorteil besteht darin, dass man in diesem Feld auch mit Sprachbefehlen korrigieren kann. Der Nachteil besteht darin, dass es auch sehr nötig ist zu korrigieren - wenn mir irgend jemand erklären kann, wieso die Erkennungsgenauigkeit in manchen Programmen besser ist als in anderen, und ob sich daran etwas ändern lässt, wäre ich dieser Person zu ewigem Dank verpflichtet.

03 Juli 2006

Dragon NaturallySpeaking Hints, Articles, Recommendations, Softnet Systems, Inc., Speech Recognition Specialists

Unter dieser Adresse gibt es zahllose Hinweise zum Thema "Verbesserung der Erkennungsgenauigkeit von Dragon NaturallySpeaking". So kann man sie zusammenfassen:

- Benutzen Sie ein gutes Mikrofon und ein schnelles System
- Sprechen Sie klar und deutlich, v.a. gleichmäßig
- Benutzen Sie die Hilfsmittel, die Dragon zur Verfügung stellt.

Alle drei Punkte werden ausführlich diskutiert und enthalten für Anfänger und Fortgeschrittene zahlreiche Hinweise - leider nur auf Englisch, aber das Meiste passt auch auf uns deutschsprachige Diktatoren.

27 Juni 2006

heise online - Modell zur genauen Stimmanalyse entwickelt

Ein Physiker hat ein Modell zur genauen Stimmanalyse entwickelt. Damit soll es möglich sein, Stimmen eindeutig zu unterscheiden und Hintergrundgeräusche herauszufiltern.

Links zur Diskussion stehen beim Beitrag. Der interessanteste ist vermutlich http://www.heise.de/tr/artikel/74593. Ich zitiere:

„Wir erreichen beim Vergleich der Stimmen nahezu die Genauigkeit des menschlichen Gehörs“, sagt Rahman selbstbewusst.


Das klingt jetzt nicht gerade revolutionär, v.a. nicht als Beweismittel vor Gericht, wo die Methode schon eingesetzt wurde. Aber:

Und anders als eine Auswertung durch einen Phonetiker unterliege seine Methode keinem subjektiven Einfluss. Sie sei unabhängig von Sprache, Grammatik sowie Sprechrhythmus und brauche auch keine Proben mit dem gleichen Text; die Qualität von mitgeschnittenen Telefonaten reiche für aussagekräftige Ergebnisse.


Und wieder wollen wir uns um die Implikationen keine Gedanken machen :-(

22 Juni 2006

Die Nuance-Foren sind wieder da!

Das deutsche und englische Nuance-Forum für Dragon NaturallySpeaking ist wieder online und unter den bekannten URLs zu erreichen. Verändert hat sich anscheinend nichts, selbst die URL weist noch auf die uralte Lernout&Hauspie-Präsenz...

21 Juni 2006

Spracherkennung in Vista

Noch ein paar Links zum Thema Spracherkennung in Windows Vista:. Es mehren sich de Anzeichen, dass ach in der deutschen Version eine funktionstüchtige Spracherkennung enthalten ist. Irgendwie finde ich aber keine endgültige Bestätigung.

  • Microsoft selbst ist noch nicht ganz einig, was geht. Die deutsche Seite erwähnt Spracherkennung nicht. Auf Österreichisch ist Spracherkennung aber wohl definitiv integriert (Viele Grüße an Waltraud Voelter und Kurt Martin :-)

  • Windows Vista Speech Recognition Step-by-Step Guide (engl.):
    Dieses Dokument erläutert anhand eines einfachen Szenarios, wie sich mit Windows Vista Dokumente per Spracherkennung diktieren und editieren lassen. Aber wieder nur Englisch.

  • Der Vista-Beta-Test auf Orty.de hat nur Englisch.

  • Aber woanders sieht es besser aus. Ich zitiere das Forum auf www.traum-projekt.com:
    Hm, ich habe das [Vista] jetzt seit ein paar Tagen drauf und muss sagen, dass ich doch positiv überrascht bin.
    Besonders die integrierte Spracherkennung hat es mir angetan, diesen Text hier habe ich zum Beispiel nicht getippt sondern diktiert.
    Ansonsten: Das System kann ja Systemressourcen fressen wie kein Zweites. Ich habe ein Gigabyte Arbeitsspeicher und davon nur noch knapp 200 Megabyte zur Verfügung!


Übrigens: Entgegen einiger Presseberichte, die alle voneinander und aus Bill Gates' Keynote abschreiben und ansonsten weitgehend ahnungslos sind, wird in Vista nicht "erstmals" Spracherkennung eingeführt. Es gibt sie schon seit längerem in Office XP und Nachfolgern. Zum Schluss noch eine Quote eines ehemaligen Scansoft-Mitarbeiters aus dem Knowbrainer-Forum, von einem MS-Mitarbeiter geblogt:
"... I have to say that I am absolutely, unequivocally, and most definitely impressed with the latest version of MS speech. The difference is like night and day compared to any of the previous versions, including 2003. In addition, the current version compared to any of the previous versions is like the difference between DNS 2.0 and DNS 8.1. Microsoft is not only closing the gap between MS speech in DNS, it is very close to leapfrogging DNS."


Allerdings kommen auch Berichte, nach denen die Dragon-Spracherkennung der von Windows weiterhin überlegen ist - nicht unbedingt qualitativ, aber in der Unterstützung von Nicht-Microsoft-Anwendungen. Dazu habe ich schon etwas zitiert, und zwar aus dieser Quelle.

20 Juni 2006

Spracherkennung, Übersetzung, nur 50 € - was will man mehr?

Unter dem Titel Lost in Translation berichtet GMX bzw. ein affiliierter Pressedienst über eine neue Anwendung für, of all things, die Sony Playstation. Der Sony TalkMan ist ein elektronischer Dolmetscher - er analysiert eine gesprochene Eingabe (z.B. "Wo geht es zum Olympiastadion?") und liefert die Übersetzung per Sprachausgabe. Eigentlich eine coole Sache, wenn man es sich überlegt.

Und wenn es funktioniert. Und hier schlägt bei einem Preis von 50€ die Konsumenten-Falle zu, wie der Artikel ganz klar zeigt. Das Ding ist als Spiel positioniert, und dementsprechend wird es gewertet. Für 50€ gibt es im Spiele-Bereich aber sicherlich sehr viel mehr Gegenwert als bei diesem Gerät, das High-Tech m.o.w. verschleudert. Man fragt sich, ob ein höherer Preis nicht paradoxerweise ein weniger kritisches Publikum angezogen hätte, und ob Sony da nicht wieder einen Schnellschuss getan hat, der der Technologie mehr schadet als nutzt.

So hat die integrierte Spracherkennung nur ein sehr kleines Lexikon, was den Autor aber nicht weiter tangiert (von einem Lexikon hat er noch nichts gehört, sonst schriebe er "Dezibil" nicht so debil). Bei einer Anwendung dieser Art ist es erfahrungsgemäß ein Problem, wenn sie nur ausgewählte Sätze versteht. Schließlich will ich (d.h. der Kunde) mich ausdrücken, und nicht auf einen doch recht kleinen Fundus an Sätzen angewiesen sein. Das hat bei Büchern zwar nie geschadet, aber mit denen spricht man ja auch nicht.

Und hier treffen wir auf das alt bekannte Problem aller sprachgesteuerten Interfaces: Rede ich mit meinem Rechner, so vermenschliche ich ihn. Und daher erwarte ich eine menschliche Reaktion. Kommt nur eine maschinelle, so bin ich enttäuscht - egal wie großartig die Technik ist, und wie viel ich im Zweifelsfall damit anfangen kann.

(Insofern ist der Drache ein guter Mediator: ein Tier lebt und reagiert auf menschliche Sprache, man erwartet von ihm aber nicht die Reaktionen eines Menschen.)

Im Prinzip müsste jede Maschine dieser Art erst den Turing-Test bestehen, bevor sie auf juvenile Blogger, freie Journalisten und schließlich das zahlende Publikum losgelassen wird.

Nuance-Foren sind offline!

Da ich inzwischen wiederholt darauf angesprochen wurde: die Nuance-Foren, und zwar sowohl das deutsche wie auch das englische, sind im Moment nicht erreichbar. Angeblich werden sie zur Zeit technisch überarbeitet und werden demnächst wieder online sein. Diese Information stammt aus einem Forum, das in der Regel bessere Auskünfte liefert, wenn es auch vor allem auf amerikanische Benutzer zugeschnitten ist , nämlich dem Knowbrainer-Forum (siehe Link rechts).

Hier die relevante Diskussion, von mir selbst vom Zaun gebrochen.

19 Juni 2006

Talking PCs? Talk to the hand - ZDNet UK Insight

Wo wir gerade dabei sind: ZDNet UK hat einen ausführlichen Artikel über Sprachsynthese, Spracherkennung und sogar - mein anderes Thema - maschinelle Übersetzung auf Basis von Spracherkennung in kleinen Geräten. Enjoy!

Talking Windows: Exploring New Speech Recognition And Synthesis APIs In Windows Vista -- MSDN Magazine, January 2006

Talking Windows: Exploring New Speech Recognition And Synthesis APIs In Windows Vista -- MSDN Magazine, January 2006 ist vielleicht nicht mehr ganz frisch, aber da Vista näher rückt, auf jeden Fall interessant. Der Artikel beschreibt, welche Sprachausgabe- und -eingabefuntionen Windows Vista hat, und wie Entwickler sie nützen können.

Darf man dem Konwbrainer glauben (siehe meinen Post vom 14.6.), ist die Spracherkennungsqualität besser als Dragon 8. Ich habe mal die Variante für den Pocket PC getestet und war begestert. Diktieren ist dort natürlich nicht möglich, aber allein die Tatsache, alle Kontakte per Sprache aufrufen zu können, auch bei ungewöhnlichen Namen - Respekt.

Und wieder kein Wort, ob sich die Spracherkennung auf Englisch beschränkt. Hat jemand schon eine deutsche Beta heruntergeladen?

14 Juni 2006

Spracherkennung in Windows Vista

Rob's Rhapsody : Every single thing Windows Vista Speech Recognition is listening for

Windos Vista wird in der US-amerikanischen Version eine eingebaute Spracherkennung haben. Unter der angegebenen URL läst sich schon jetzt ein Befehlssatz ansehen.

Unter http://www.microsoft.com/technet/WindowsVista/library/c208e792-e591-455a-82d9-a98264324e0d.mspx findet sich die Microsoft-Beschreibung der Spracherkennung.

Das Knowbrainer-Forum hat ebenfalls etwas dazu zu sagen - u.a. dass die MS-Engine in ihrer jetzigen Beta-Form bereits bessere Ergebnisse erzielt als Dragon 8. Der Knowbrainer ist an der Entwicklung beteiligt und ergeht sich daher in dunklen Andeutungen, weil er nichts genaues sagen darf.

Eine Spracherkennung in MS Office, US-Englisch, gibt es schon seit Office XP. Sie enthält die ominöse ctfmon.exe, die auch vom deutschen Office gestartet wird und immer mal wieder für Konflikte mit Dragon sorgt. Die Frage, die mich interessiert, und die mir noch keiner beantworten konnte, ist:

Wird es diese Spracherkennung auch für Deutsch geben?

Wenn die Sprachsteuerung für den Pocket PC als Maßstab gelten kann, dann steht allen Dragon-Händlern eine harte Zeit bevor.

Kleine Ergänzung: Pleite gehen wir deshalb noch nicht. Hier eine Liste der unterstützten (und wichtiger, NICHT unterstützten Anwendungen:

  • Speech Recognition dictation will work in a limited set of applications that support a technology called the Text Services Framework. This set of applications includes:
    • Microsoft Word and Outlook

    • Virtually all applications that are part of Windows Vista


    Dictation will not work in many applications. These include, but are not limited to:

    • Microsoft PowerPoint

    • Excel

    • WordPerfect

    • Eudora

    • Lotus Notes
  • 06 Juni 2006

    Das sollte jeder Dragon-Nutzer kennen

    In den KnowBrainer Quick Tips hat der führende Experte aus den USA Hinweise zusammengestellt, wie sich bekannte Probleme in Dragon NaturallySpeaking beheben lassen, die Systemleistung insgesamt verbessern lässt, und vieles andere mehr. Empfohlene Lektüre, wie auch das Knowbrainer-Forum!

    29 Mai 2006

    Hausfrauentipp

    Die Erkennungsqualität vom CS-60 USB wird stark verbessert, wenn man ein Stücklein Schaumgummi (vom Ohrhöhrer) über das Mikrofon klebt.

    [brought to you via the Nuance forum]

    22 Mai 2006

    Erkenungsfehler!

    www.out-loud.com ist eine englischsprachige Website, die eine ganze Menge Informationen zum Thema Spracherkennung zusammenstellt. Die Seite gibt es seit einigen Jahren, daher sind die Informationen teilweise nicht mehr ganz auf dem neusten Stand, aber häufig immer noch sehr hilfreich - viele Probleme haben sich nicht geändert, vieles, was in früheren Versionen von Spracherkennung interessant war, ist auch heute noch virulent, wird aber gerne verschwiegen oder gilt als alter Hut, wird daher nicht mehr diskutiert.

    Wirklich schön, und von dem üblichen Verbesserungseifer der meisten anderen Beiträge im Internet, die sich mit Spracherkennung befassen, nicht befallen ist die Sammlung von Erkennungsfehlern. Wie wäre es, wenn meine geschätzten Leser in den Kommentaren ihre eigenen Lieblings-Erkennungsfehler hinterlassen würden? Erkennungsfehler sind keine Schande! Einen meiner Kundinnen, eine gewisse Frau Andreadakis (offensichtlich ein griechischer Name), freute sich sehr, als mein Computer sie mit "Liebe Frau andere Antarktis" ansprach.

    Ein Anwender auf out-loud.com beschreibt, welche Strategie er entwickelt hat, um sich gegen die Eigenwilligkeiten seiner Spracherkennung (die er VIN nennt) zu wehren:

    Last week I programmed VIN with a voice macro I named "you %*\#@^&!." Now, whenever I notice that the screen contains a word of dubious origin, I roar, ""you %*\#@^&!," and VIN responds, "I'm sorry I was such a jerk. I swear it'll never happen again. I'm feeling much better now."

    I appreciate the sentiment. I just wonder if he really means it.


    Sehr schön. Perfekt wäre es, wenn der Computer darauf hin von sich aus die Korrekturfunktion aktivierte :-)

    19 Mai 2006

    Neues von Olympus


    Das Olympus DS 660 ist von allen digitalen Diktiergeräten das kleinste. Die Funktionen sind aber absolut professionell - einfügen von Aufnahmen, löschen, teilweise löschen, Verwaltung von mehreren Ordnern, Übertragung per USB auf den Rechner, also alles, was Diktiergeräte können müssen. Das DS 660 gehörte bis zum letzten Monat in die Olympus Pro Line, in der nur die hochwertigen Diktiersysteme angeboten werden. Es läuft jetzt allerdings aus, so dass es nur noch einen Restposten von Geräten aus der Olympus Pro Line gibt. Der Preis für diese Geräte beträgt 359 EUR.

    Danach wird es das Olympus DS 660 als Pro Line-Gerät nicht mehr geben.

    Da Olympus allerdings noch etliche Geräte auf Lager hat, wird es zum Abverkauf das Olympus DS 660 in einer so genannten eco-Version geben. Die mitgelieferte Software ist aber nicht mehr die der Olympus Pro Line, sondern es wird nur noch der einfache Olympus DSS Player beigelegt. Diese Software ist nicht netzwerkfähig, unterstützt keinen direkten Versand von Diktaten per E-Mail oder FTP, und erlaubt nur einen Ablageort für Diktate, diesen allerdings mit fünf Unterordnern. Der Preis für dieses Gerät in der einfachen Ausstattung beträgt 209 EUR.

    Als mobiles Gerät für Spracherkennung und eventuell als Handmikrofon ist die günstige Version bestens geeignet. Wenn es aber darum geht, tatsächlich ein Diktiersystem aufzubauen, bei dem Diktate zum Schreiben weitergegeben werden sollen und flexibel verwaltet werden sollen, führt kein Weg an der Olympus Pro Line oder einem vergleichbaren Produkt vorbei.



    Noch eine Neuigkeit: das lange erwartete Diktiermikrophon Olympus DR 1000 ist inzwischen erhältlich. Gegenüber dem Olympus DR 2000, das hier ja bereits ausführlich gewürdigt wurde, unterscheidet es sich in mehreren Punkten:

    • statt eines Schiebeschalter gibt es einen Trackpoint sowie mehrere Funktionstasten

    • die mitgelieferte Software ist der Olympus DSS Player, nicht der Olympus DSS Player Pro

    • das Gerät ist schwarz und nicht weiß :-)


    Nach meinem Eindruck wendet sich dieses Gerät viel stärker als das Olympus DR 2000 an Anwender von Spracherkennung. Ein Exemplar ist zu mir unterwegs, ich werde es in den nächsten Tagen ausprobieren und dann hier wieder etwas darüber veröffentlichen.

    Darüberhinaus wird das Olympus DR 2000 und Olympus DR 1000 auch als Modell für Integratoren zur Verfügung stehen. Wer also überlegt, eine eigene Anwendung unter Verwendung dieses Mikrophon zu erstellen, kann sowohl das Olympus DR 2000 wie auch das Olympus DR 1000 in die engere Wahl ziehen. (Man könnte natürlich auch ein Phillips SpeechMike nehmen - das liegt vielleicht nicht ganz so gefällig in der Hand, bringt aber dafür schon von Haus aus alles mit, wofür das Olympus erst ein Software Development Kit benötigt :-)

    10 Mai 2006

    FAZ testet das Headset VXI Parrott TalkPro

    (kostenpflichtiger Link)

    Nachdem ich neulich hier das VXI Parrott TalkPro USB-Headset für Spracherkennung vorgestellt hatte, hat sich auch die FAZ in ihrer Ausgabe vom 9.5.2006 des Themas angenommen. Ich fasse zusammen:

    Installation einfach, Tragekomfort gut, Erkennungsgenauigkeit knapp 100%, Nebengeräusche werden gut ausgeblendet, bessere Ergebnisse als mit einem Handmikrophon - alles in allem empfehlenswert.

    Hervorgehoben wird das teilbare Kabel, das sich an der Regeleinheit für die Lautstärke problemlos abkoppeln lässt. Allerdings stört den Rezensenten die "vor dem Bauch baumelnde kleine Box".

    Also, ich klemme mir die Box einfach ans Hemd. Welcher Dress Code herrscht eigentlich in der FAZ?

    04 Mai 2006

    Little Dragon is watching you!


    Nichts mit Spracherkennung zu tun hat dieser kleine Spielzeugdrache, der so gefaltet wird, dass er Sie immer ansieht und dabei sogar den Kopf zu drehen scheint!

    Sehen Sie sich das Video an und staunen Sie - oder laden Sie sich gleich wie ich die Bastelanleitung herunter (PDF), um Ihren Schreibtisch zu bereichern.

    (Die Farbe steht übrigens im Einklang mit dem aktuellen Nuance-Corporate Design :-)

    28 April 2006

    Key Mute, Teil 2

    Gestern berichtete ich schon über KeyMute, ein Tool, das Dragon während der Benutzung von Tastatur und Maus stummschaltet. Gestern morgen fragte ich mich noch, wer so was wohl braucht; gestern abend diktierte ich in mein Notebook und merkte: Ich.

    Da der Download inzwischen virenfrei ist bzw. mein neuer Virenscanner unter Paranoia litt, werde ich jetzt fröhlich ans Werk schreiten und das Teil mal ausprobieren. Interesse ist durchaus nicht nur bei mir vorhanden, wie ich im Scansoft- und Knowbrainer-Forum sehe.

    Übrigens dürfte es wohl sinnvoll sein, zunächst mit den Standardeinstellungen zu testen. Auf meine ersten Frgen hin erhielt ich schon folgende nützlichen Hinweise:

    Zu Ihren nachfolgenden Fragen:

    Microphone On/off - der Key sollte derselbe sein wie in Dragon?

    "Microphone On/Off" - wie auch der HotKey für "Press-to-Talk" von KeyMute muss jeweils mit dem gleichlautenden HotKey in NaturallySpeaking übereinstimmen, damit die Steuerung funktioniert.

    Global On/Off: dieser Key sollte ein anderer sein - und den muss ich mir angewöhnen, um Dragon mit KeyMute tatsächlich stummzuschalten. Stimmts?

    "Global Microphone On/Off": Hier muss eine andere, dritte Funktionstaste gewählt werden, wie Sie richtig festgestellt haben. Natürlich bietet es sich an, an dieser Stelle diejenige Taste zu wählen, die Sie bereits zuvor zur Stummschaltung von Dragon verwendet hatten, damit Sie sich nicht umgewöhnen müssen.

    Für den Moment empfehle ich F11 für "Press-to-Talk", F9 für "Microphone On/Off" und F10 für "Global On/Off" zu verwenden. Interferenzen mit anderen Programmen können zwar wohl nicht ausgeschlossen werden, sie lassen sich aber immerhin dadurch minimieren, dass bei den "Excepted Keys" alle Funktionstasten mit einem Häkchen versehen werden. Auf diese Tasten reagiert KeyMute dann überhaupt nicht mehr.


    (Ich hoffe aber darauf, dass demnächst nicht nur die F-Tasten zr Verfügung stehen werden :-)

    27 April 2006

    Neues Tool zur automatischen Geräuschunterdrückung

    KeyMute nennt sich die Anwendung, die Dragon während der Benutzung von Maus und Keyboard stummschaltet, um Störgeräuche auszuschließen. Natürlich stellt sich die prinzipielle Frage, ob es nicht einfacher ist, die Taste auf der Tastatur (am Mikro, Headset und so weiter) zu drücken...

    Die offizielle Homepage des Entwicklers liegt unter http://www.fritz-eit.de/KeyMute/, ist aber bis jetzt noch frei von jedem Inhalt. Alle Informationen also bitte aus dem Forums-Post beziehen.

    Aber weil ich neugierig bin, werde ich mir das Programm herunterladen und mal schauen, ob es tatsächlich hilft. Nicht, dass ich noch Probleme mit Nebengeräuschen hätte - das VXI Parrott TalkPro unterdrückt Nebengeräusche so effektiv, dass sogar mein Kollege hinter mir telefonieren kann.

    5 Minuten später:

    Beim Download schlägt mein Virenscanner Alarm! Und das, obwohl der Entwickler ausdrücklich im Knowbrainer-Forum gelobt wird.

    24 April 2006

    Neue Rezension: Dragon und Microsoft Speech Recognition

    AnandTech, nach eigenen Angaben "the leading IT source for hardware analysis and industry news", hat einen ausführlichen - leider nicht ganz von Abschweifungen freien - Beitrag mit Benchmark-Test über Spracherkennung. Interessant für uns deutsche Anwender ist, dass der Rezensent die in MS Office 2003 (US-Version) enthaltene Spracherkennung dagegen testet (das ist die, deren ctfmon.exe-Datei so viel Unheil in unseren armen deutschen Installationen anrichtet).

    Einige interessante Ergebnisse:

    - Dragon ist besser als Microsoft (Überraschung). Da Office 2003 in der deutschen Version keine Spracherkennung enthält, dürfte diese Nachricht hier auf recht geringe Aufmerksamkeit treffen.
    - Es hilft bei Dragon, in den Optionen "Maximale Genauigkeit" einzustellen - die Genauigkeit ist tatsächlich spürbar höher. In MS Office führt die maximale Genauigkeit paradoxerweise zum schlechtesten Ergebnis.
    - Eine Aufnahme des Diktats führt im Benchmark-Test zu bessderen Ergebnissen als ein direktes Diktat. Verzaget nicht, ihr Diktiergerät-Benutzer! möchte man ausrufen, denn meine Praxis kann das nicht unbedingt bestätigen.
    - Spricht man nicht mt "Diktierintonation", sondern in normalem Sprechtempo, sinkt die Genauigkeit von Dragon rapide von 96-97% auf 90-91%. Dies ist bei MS Office nicht so ausgeprägt (Any Americans out there: Did you know you can use MS Word as a notes taker?) Jedoch ist auch hier der Verlust bei der Transkription einer Wav-Datei geringer. Der Tester führt das darauf zurück, dass Dragon in diesem Falle das Diktat auch nicht auf Befehle untersucht; hat ihm mal jemand was vom "Diktiermodus" erzählt?
    - Dragon braucht wesentlich mehr Prozessorleistung als MS Office; ein Dual Core-Prozessor bringt jedoch keine Verbesserung. (Nuance ist da offiziell anderer Meinung, aber IBM trat beim Naunce Productivity Summit ja auch als Sponsor auf ;-)

    Sehr interessant auch der Kommentar im Knowbrainer-Forum, in dem es u.a. um die Wichtigkeit eines guten Headsets geht. Die Herren von eMicrophone.com haben da eine sehr dezidierte Meinung - Sennheiser gibt 100%, why settle for less? (Wobei sich dann die Frage stellt: Wenn sie nichts schlechteres als Sennheiser akzeptieren, wie kann ein Mikro dann besser sein?)

    Und was die Zukunft angeht: Warten wir auf Windows Vista, und ob/wie Nuance kontert. Gerüchteweise soll der Launch von DNS 9 ja erst nach der Einführung von Vista kommen (dann können wir es gleich DNS 10 nennen ;-)

    13 April 2006

    Google patentiert sprachgesteuerte Suche

    Heise meldet, dass Google eine sprachgesteuerte Suche zum Patent angemeldet hat. Hier wird das garantiert nicht um digitales Diktieren gehen - das große Geld liegt in der Spracherkennung ja eigentlich bei ganz anderen Anwendungen. Vielmehr geht es hier um das, was in letzter Zeit auch bei mir verstärkt angefragt wurde, nämlich die Abfrage von Informationen per Sprache. Anders ausgedrückt: man telefoniert nicht mehr mit einem Menschen, sondern mit einem Computer. Wenn sich Google hier schon engagiert, weist das darauf hin, dass wir in zwei Jahren diese Technik für ganz normal halten werden. Aber vielleicht sichern sie sich auch nur das Patent, ohne dass etwas konkretes daraus wird...

    12 April 2006

    VXI Parrott TalkPro USB-Headsets

    In Amerika sind sie seit langer Zeit bei Nutzern von Dragon NaturallySpeaking beliebt, ScanSoft hat die mit fünf Drachen ausgezeichnet, jetzt gibt es sie auch in Deutschland: VXI Parrott TalkPro USB-Headsets. Ich habe zwei verschiedene Modelle getestet. Vorweg: ich bin mit der Leistung sehr zufrieden. Jetzt im einzelnen:

    Das VXI Parrott TalkPro USB-Headset 100 war mein erstes Gerät im Test. Es ist monaural mit nur einer Hörmuschel, mit der Seriennummer 200 gibt es auch ein Stereo-Headset mit zwei Hörmuscheln. Die Lieferung erfolgte in einer robusten braunen Schachtel, es mussten ein paar Kabel zusammengestellt werden, danach wird das Headset einfach über USB angeschlossen und installiert sich unter Windows XP sofort. Der Audiotest (dessen Wert ja sowieso umstritten ist) brachte zwar nur einen Wert von 18 Punkten bei der ersten Installation, doch die Erkennungsgenauigkeit war sofort spürbar besser als die des Philips SpeechMike und des Olympus DR 2000, die ich vorher an meinem Rechner im Einsatz hatte. Natürlich ist ein Headset immer besser als ein Handmikrofon, weil der Abstand zwischen Mund und Mikrophon nicht variiert, aber dass ich durch einen simplen Wechsel der Hardware die Fehlerquote tatsächlich praktisch auf Null bringen würde, hatte ich dann doch nicht erwartet. Noch ein positiver Nebeneffekt war, dass die Erkennung wesentlich schneller vor sich ging. Hier spielt wahrscheinlich auch eine Rolle, das im Hintergrund keine Steuerungssoftware läuft. Nachdem ich außerdem in letzter Zeit immer wieder Schwierigkeiten mit Nebengeräuschen bei den Handmikrofonen hatte, die dazu führten, dass Dragon NaturallySpeaking mehr oder weniger abstürzt, war mir außerdem die hohe Resistenz gegenüber Nebengeräuschen sehr willkommen. Schließlich gibt's noch einen Schalter, mit denen sich das Headset umschalten lässt. Merkwürdigerweise ist es stumm, wenn der Schalter gedrückt ist, und aktiv, wenn er losgelassen ist - hier hätte ich eine andere Logik erwartet.

    Der deutsche Vertrieb lieferte mir ein paar Tage später noch ein anderes Headsets mit einem Umschalter, mit dem sich das Gerät auch ans Telefon anschließen lässt. Das war auch gut so - nachdem ein Kunde das VXI Parrott TalkPro USB-Headset bei mir gesehen hatte, probierte er es an seinem Notebook aus, erreichte auf Anhieb 26 Punkte im Audio-Assistenten und nahm das Gerät gleich mit.

    Die zweite getestete Kombination besteht aus einem VXI Parrott TalkPro SP1 Kopfhörer mit NC-Mikrophon, einer ganzen Reihe von verschiedenen Kabeln, die alle ineinander gesteckt werden müssen, einen USB-Adapter und einer Umschaltung zwischen Computer und Telefon. Die Verkabelung gestaltete sich naturgemäß etwas komplexer, war aber auch kein großes Problem, und auch dieses Headset ließ sich unter Windows XP umstandslos installieren.

    Die Telefon-Kombination funktioniert wider Erwarten genauso gut wie das reine USB-Headset. Auch hier gab der Audio Assistent sofort ein sehr gutes Signal, und die Erkennungsgenauigkeit ist praktisch perfekt. Beide Headsets sind von der Konstruktion identisch, sehr bequem zu tragen, mit einem robusten Metallbügel, leicht und komfortabel.

    Gewöhnungsbedürftig ist lediglich die Umschalterbox. Ein großer Schalter, der mit einem Symbol für Headset und einem Symbol für Telefonhörer versehen ist, schaltet nicht etwa zwischen Computer und Telefon hin und her, sondern zwischen Telefon-Headset und Telefonhörer. Die Umschaltung zwischen Computer und Telefon geschieht durch einen zweiten, kleinen gelben Knopf, bei dem nicht ganz genau ersichtlich ist, in welchem Zustand er das Signal wohin sendet. Die Umschalter-Box wird zwischen Headset auf der einen Seite und USB-Adapter beziehungsweise Telefon auf der anderen Seite eingeschliffen. Die Verbindung zum Telefon geschieht durch (im Lieferumfang nicht enthalte) Kabel, die beim Telefon in den Stecker für den Hörer gesteckt werden. An der anderen Buchse wird der Hörer selbst angeschlossen. Eine Fernannahme eines Telefongesprächs ist nicht vorgesehen. Der deutsche Vertrieb versucht im Moment einen amerikanischen Hersteller eine bessere Lösung durchzusetzen, hoffen wir auf Erfolg.

    Da ich hier ausschließlich schnurlose Telefone zur Verfügung habe, kann ich leider nicht prüfen, wie sich die Arbeit mit der Umschaltung im täglichen Einsatz gestaltet, wenn man das Headset tatsächlich zum Telefonieren und zum Diktieren nutzen will. Auf jeden Fall sind beim Diktat mit Spracherkennung keinerlei Einschränkungen zu erwarten. Wer lieber mit einem Headset statt mit einem Hörer telefoniert, und eine Möglichkeit hat, einen entsprechenden Anschluss zu schalten, erhält mit dieser Kombination eine brauchbare Lösung.

    Zum Schluss schon eine Vorschau: diesen Beitrag diktiere ich mit dem neuen GN Netcom GN 9350, ein schnurloses Headset, das ebenfalls zwischen Telefon und Hörer eingeschliffen werden kann und eine USB-Verbindung zum Computer besitzt. Den Erfahrungsbericht veröffentliche ich, wenn ich genügend Erfahrungen damit gesammelt habe. Die Erkennungsgenauigkeit beim Diktat in Firefox (wird offiziell nicht von Dragon unterstützt) ist auf jeden Fall zufrieden stellend. Stay tuned!

    GN Netcom GN 9350 Schnurloses USB-Headset - erste Eindrücke

    Zwei Tage Arbeit mit den GN 9350 lassen zwar nicht unbedingt eine qualifizierte Rezension zu, bevor ich mich aber für die nächsten 10 Tage verabschiedet, möchte ich doch wenigstens meine ersten Eindrücke veröffentlichen. Also:

    Der Vorzug des schnurlosen DECT-Headsets GN 9350 von GN Netcom liegt darin, dass es sich sowohl mit dem Computer als auch mit dem Telefon verwenden lässt. An der Ladestation befinden sich zwei Tasten, mit denen zwischen Computer und Telefon umgeschaltet werden kann. So braucht man immer nur ein Gerät zum Diktieren und telefonieren (das richtige Telefon vorausgesetzt).

    Das GN 9350 installiert sich unter Windows XP problemlos nach dem Einstecken des USB-Steckers. Das Audio-Training bei Dragon NaturallySpeaking erreicht auf Anhieb einen Wert von 20 bis 21. Für ein schnurloses Headset ist das sehr gut.

    Auch in der Praxis zeigt sich eine hohe Erkennungsgenauigkeit, die nur von der Emfindlichkeit gegenüber Nebengeräuschen getrübt wird. Natürlich liegt die Genauigkeit nicht ganz so hoch wie bei einem schnurgebundenen Headset, kann aber mit einem Handmikrofon durchaus konkurrieren. Dieses dürfte auch der natürliche Konkurrenz des GN 9350 sein - wer konzentriert und lange diktiert, zieht sicherlich ein Schnur gebundenes Headset mit bester Erkennungsrate vor. Wer häufig kürzere Texte zu diktieren hat oder während der Arbeit immer wieder abgelenkt wird, den Platz wechseln muss, also mobil sein will, der braucht entweder ein Handmikrofon, welches man sofort weg legen kann, oder eben ein schnurloses Headset, das einen nicht an seinem Rechner fesselt. Hier ist das GN 9350 eine echte Alternative.

    Die Umschaltung zwischen Telefon und PC ist vorbildlich - es gibt je einen Schalter, der die Verbindung zum einen oder anderen Gerät herstellt, und der mit einer LED gekennzeichnet ist. Unter dem Deckel der Basisstation befinden sich außerdem zahlreiche Einstellungsmöglichkeiten. Dort kann man z. B. auch die Reichweite regeln, und damit die Strahlungsbelastung reduzieren. Überhaupt ist das Design sehr gelungen.

    Da ich hier kein kompatibles Telefon benutze (wir haben eine komplett schnurlose Telefonanlage), kann ich leider nicht viel über die Arbeit mit dem Telefon berichten. Das Headset wird zwischen Telefon und Hörer eingeschlichen, es ist sowohl möglich, Telefongespräche direkt Headset entgegenzunehmen, wie auch einen Telefonhörer-Lifter einzubinden, der dann bei einem entsprechenden Telefon automatisch den Hörer in die Höhe hebt. Der Bedienungskomfort ist also ohne Zweifel sehr gut. Ob der Anschluss auch an einer komplett schnurlosen Anlage möglich ist, müsste man ausprobieren. Bei unserer speziellen Konfiguration geht es nicht (das liegt aber auf jeden Fall an uns).

    Was allerdings stört, ist ein Grundrauschen im Ohrhörer, der sich auch nicht dadurch beseitigen lässt, dass man die Lautstärke herunterregelt. Erst nach einiger Zeit der Arbeit zeigt ich ein anderes Problem: das Polster am Ohr besteht offensichtlich aus Kunstleder, liegt jedenfalls nicht sehr bequem an.

    Zwischenbilanz: schön designt, praktisch in der Anwendung, leider mit leichten Schwächen in der Anwendung (Tragekomfort und Erkennung).