Digital diktieren am Computer mit Spracherkennung und digitalen Diktiergeräten: Tipps und Tricks, Erfahrungsberichte und Links zu Dragon NaturallySpeaking und anderen Hilfsmitteln.
21 Dezember 2006
Gastbeitrag: Spracherkennung in Windows Vista
Vielen Dank für den Beitrag!
18 Dezember 2006
Dragon 9 Service Pack 1
Hier findet sich die Ankündigung und Technote bei Nuance.
Willi Sander hat einen direkten Download-Link und eine teilweise Übersetzung hier bereitgestellt:
http://www.fachvokabulare.de/ und dann Klick auf "Programme".
Hier noch seine Ankündigung und eine kleine Forumsdiskussion über die richtige Installation.
Interessant für Entwickler ist v.a. die Bearbeitung des VocTools, mit dem jetzt hoffentlich wieder möglich ist, ein Vokabular inkrementell, also Schritt für Schritt aufzubauen.
Nach der Installation kann ich für meinen Teil feststellen, dass zumindest das Zahlenformat, welches angeblich jetzt besser laufen soll, immer noch nicht ganz alltagstauglich ist - "22 per Dezember 2006" kommt immer noch genauso häufig wie 22.12.2006.
10 Dezember 2006
FAZ-Test von Linguatec Voice Pro
Hier noch der Nachtrag zu den letztlich gebloggten Kritiken von Linguatec Voice Pro 11:
Michael Spehr, FAZ-Spezialist fürs digitale Diktat, hat Voice Pro in der Ausgabe vom 5.12.2006 getestet. Sein Fazit: zu loben sind die hohe Erkennungsrate, der günstige Preis von 200 € und die verhältnismäßig bescheidenen Systemanforderungen (Kunststück – der verwendete Erkenner ist ViaVoice 10.5, das ist drei der vier Jahre alt). Auch die Arbeit mit Anwendungen, die im Browser laufen, gehe flüssiger als mit Dragon. Outlook Web Access funktioniert laut Testbericht mit VoicePro besser als mit Dragon. Im professionellen Einsatz sei Linguatec VoicePro jedoch keine Alternative zu Dragon NaturallySpeaking: der Lernprozess der Software sei deutlich komplizierter, und das zu erzielende Lernergebnis in der Spracherkennung niedriger.
Dies deckt sich mit meinen Erfahrungen, die ich vor Jahren mit Voice Pro 10 gemacht habe: die Ansätze sind gut, die Erkennung schwankte zwischen fehlerfrei und völlig indiskutabel, und die Korrektur war gewöhnungsbedürftig. Mir fielen außerdem schon damals die vielen kleinen Ärgerlichkeiten auf, die der Tester auch jetzt wieder erwähnt – viele Funktionen sind einfach nicht sauber umgesetzt, das Wechseln zwischen den Fenstern dauert elend lange, die Kompatibilität mit Word war nur im Prinzip gewährleistet, und was dergleichen Bugs mehr sind.
05 Dezember 2006
Linguatec VoicePro 11 im Test
und sei es in seiner Inkarnation als Linguatec Voice Pro, erwarten würde. Insofern stimmt ganz hoffnungsvoll, dass einige Anwender durchaus ein positives Wort darüber verlieren - auch wenn der Drache weiterhin für sie erste Wahl bleibt.
So schreibt Willi Sander:
Wie nicht anders zu erwarten war, verbirgt sich hinter VoicePro 11 die 10.5er Engine von ViaVoice. Trotzdem ist die Erkennungsgenauigkeit erstaunlich gut. [...] Die Bearbeitung der benutzerdefinierten Wörter ist immer noch ein Krampf, das Austauschen von Wortlisten ist nicht möglich.Rolf Richter:
Alles in Allem eine Alternative für Hobbyanwender [...].
Seit fast zwei Wochen bin ich im Besitz der Version 11 von ViaVoice. [...] Die Firma Linguatec hat ziemlich gute Arbeit geleistet, die befürchteten Defizite waren meist nicht mehr vorhanden.Georg Eisenmann:
[...]
Trotzdem, wenn ich ein Resümee ziehen sollte-ich bleibe natürlich bei Dragon, dies ist doch die bessere Alternative. Die Genauigkeit bei der Erkennung ist um einiges besser, auch die Korrektur ist schneller bewerkstelligt, die Übernahme neuer Wörter in das Vokabular ist ungleich effektiver, den größten Vorteil finde ich, dass man direkt in das Vokabular gehen kann, um dort Veränderungen vorzunehmen, zum Beispiel löschen usw. es ist bei ViaVoice eigentlich kaum möglich. [...] Dieser Beitrag wurde mit ViaVoice verfasst, ohne größere Verzweiflung.
Wie mir mein Vater gerade sagt, steht auch in der FAZ heute ein Test, der ähnliche Ergebnisse liefert - das Diktat ist an sich nicht schlecht, das Vokabular lässt sich aber nur umständlich bearbeiten. So muss fast jedes neue Wort trainiert, d.h. vorgesprochen werden - das hatten wir doch überwunden geglaubt? Sobald ich den Test vorliegen habe, trage ich ihn hier nach.
Nach einem recht langen Training, bei dem das erste Wort eines Satzes oft nur schwer vestanden wurde, habe ich dann drauf los diktiert. Leider war das Ergebnis nicht berauschend. In jedem Satz mehrere Fehler. Nicht einmal das Wort VoicePro wurde verstanden. Darüber recht geschockt versuchte ich mich anschließend mit dem neuen Mikrofon (von Sennheiser) an Dragon. Hier wurde dann weitaus mehr verstanden, dann und wann ein Fehler im Satz, aber passabel.
Der kurze Vergleich war fair: Weder VoicePro noch Dragon wurde mit alten Dokumenten gefüttert oder anderweitig optimiert wurde. Es fand auch nur jeweils das Anfangstraining statt (ca. 5 Minuten bei Dragon und bestimmt 15 Minuten bei Voicepro. Ein echter Test war das natürlich nicht.
Einen eigenen Test werde ich aber wohl kaum durchführen können, wo ich doch jetzt bei der Konkurrenz bin, Rike...
04 Dezember 2006
Elektronischer Dolmetscher erhöht die Glaubwürdigkeit - ?!?
Der Anwender, beispielsweise ein US-Soldat, würde dann ganz normal in das Mikrophon sprechen, worauf die IBM-Software simultan mit der Übersetzung beginnt und den Inhalt auf Arabisch per Lautsprecher ausgibt. Umgekehrt wird die Antwort auf Arabisch ins Englische übersetzt. Darüber hinaus werden die Sätze zu Kontrollzwecken sowohl in der Originalsprache als auch in der Übersetzung auf dem Display angezeigt und der übersetzte Satz wird zugleich in die Originalsprache zurück übersetzt, um es dem Originalsprecher zu ermöglichen, Missverständnisse oder falsche Übersetzungen schnell zu erkennen und gegebenenfalls zu korrigieren.Ob das funktioniert? Meine Ergebnisse mit Dragon-Spracherkennung und PROMT-Übersetzung waren nicht wirklich alltagstauglich. Auch die Rückübersetzungsfunktion scheint mir nicht
die beste Kontrollmöglichkeit, ob das Gegenüber wirklich das Gemeinte verstanden hat. Wer die einschlägigen Seiten für maschinelle Übersetzung kennt, weiß, dass hier gerne mal "Stille Post" gespielt wird. Legendär die Hin- und Her-Übersetzung des "Adobe Acrobat Reader" als "Lehmziegel Seiltänzer Leser" oder noch schöner "Ziegelsteinseiltänzerleser". Den Ernstfall möchte man sich nicht wirklich vorstellen.
Einerseits: wenn die US Army mit dem entsprechenden Kapital dahintersteckt, kommt ja vielleicht wirklich was dabei rum...
Andererseits: eine kurze Recherche fördert diesen Artikel der Netzeitung zutage. Wenn es darum geht, dass eine Maschine vertrauenswürdiger [sic!]
übersetzt als ein Mensch, und das auch noch jemand glaubt (!),
dann sind wir wirklich weit gekommen - aber nicht unbedingt technologisch.
03 Dezember 2006
Der Blaupapagei
Das Gerät ist sehr robust gebaut, mit einem metallenen Kopfbügel und einem stabilen Mikrofonarm. Auch das Ohrpolster ist aus robustem Kunstsoff, lediglich der Mikrofonschutz sitzt - wie immer bei VXI - etwas locker und sollte fixiert werden. Am Headset selbst git es drei Tasten - eine Multifunktionstaste für an, aus, pairing; je eine für lauter bzw. leiser, wobei ein viersekündiger Druck auf die "Lauter"-Taste das Mikro stumm schaltet.
Die Reichweite des Headsets habe ich mit Skype ausprobiert. Sie beträgt mit dem Anycom-Dongle ca. 10m, wobei die Wände nicht zu dick sein sollten. Aus dem Nebenzimmer funktioniert es, aber über den Flur wird es langsam kritisch, und die Übertragungsqualität sinkt rapide. Aus der Entfernung wird aber niemand diktieren wollen.
Einen kleinen Abstrich musste ich beim Ladegerät machen, das für den mobilen Einsatz konzipiert ist und daher nicht sehr standfest ist. Die Handelsausgabe wird mit einem stabilen Ladegerät geliefert (s. Bild).
Dafür habe ich einen Anschluss an den Zigarettenanzünder, so dass man das Headset zur Not auch im Auto laden kann - wer's fürs Handy braucht. (Persönliche Meinung: fürs Handy ist es zu schade, zum Telefonieren tuts jedes billige Ding, aber für Spracherkennung - und die geht nicht wirklich im Auto - muss es was Gutes sein.) Es gelten natürlich wie immer die üblichen Abstriche für Bluetooth, also dass man zum Beispiel bei jedem Start des Rechners wie auch nach dem Laden die Verbindung neu herstellen muss.
Obwohl Dragon 9 explizit Bluetooth-Headsets unterstützt, habe ich das Gerät als Standard Mic-Line In angelegt, und es hat nicht geschadet. (Hintergrund: gelegentlich speichere ich Diktate zur späteren Korrektur, und dann fordert Dragon dasselbe Eingabegerät, welches auch zum Diktieren benutzt wurde. Ich habe schon erlebt, dass Korrekturplätze nicht gearbeitet haben, wenn nicht das Original Philips Speechmike dranhing. Mit Mic/Line in ist man da auf der sicheren Seite: kein Qualitätsverlust beim Diktieren, und bei der Korrektur wird nur abgeprüft, ob eine interne Soundkarte vorhanden ist.) Das Diktat läuft sehr flüssig und mit minimaler Fehlerrate. Im Vergleich zum VXI Parrott TalkPro USB, meinem ehemaligen Standardmikro, konnte ich eher eine leichte Qualitätsverbesserung feststellen, v.a. in der Geschwindigkeit der Umsetzung.
Eine Vorschau des Headsets gibt es unter http://www.jolodata.de/vxi/parrottb150gtx_deutsch.htm, dort hoffentlich bald auch Preise.
29 November 2006
Macht Vista-Spracerkennung den Netscape mit Nuance?
Wird Spracherkennung jetzt eine Massenanwendung, einfach weil sie so vielen Nutzern kostenlos zur Verfügung steht? Und wird Microsoft damit dasselbe mit Nuance / Dragon machen, was sie im Browserkrieg mit Netscape gemacht haben? Die Antowrt hängt m.E. davon ab,
- wie gut die Spracherkennung wirklich ist, und das heißt: wie alltagstauglich für den ungeschulten Anwender;
- wenn sie es ist: wie viele Leute den Nutzen von Spracherkennung zu schätzen lernen, und ob damit eine so kritische Masse erreicht wird, dass es wirklich ein Massenphänomen wird wie damals das Internet
- und das wird ein Graswurzelphänomen sein: "Probier das mal aus, das ist klasse".
- womit wir wieder beim ersten Punkt wären: Jeder Depp muss mit Vista diktieren können, damit es ein Erfolg wird.
QED: Hat irgendwer wirklich die Spracherkennung von MS Office XP genutzt?
Übrigens: Laut Chuck Runquist, der es wissen muss, hat Nuance / Scansoft keinen Code geliefert, sondern die Entwicklung hat MS allein gemacht - wenn auch unter Berücksichtigung von L&H-Technologie.
Dass sich Vista in vielem wie Dragon benimmt und z.B. auf dieselben Befehle hört, scheint also eher eine Marketing-Entscheidung zu sein.
21 November 2006
Are you talking to me? No! I'm talking to my computer! Check out this new Voice Recognition program.
Den Stil der Darbietung muss man mögen - Frage und Antwort dienen hier eigentlich mehr zur zweistimmigen Präsentation der Spracherkennung in Windows Vista. Aber so ist Amerika. Viel beeindruckender sind die Möglichkeiten, die gezeigt werden - und die Dragon NaturallySpeaking alle schon seit Urzeiten enthält :-)
Wirklich schön ist die Tatsache, dass man anscheinend zwei Sprachbefehle direkt hintereinander sagen kann, ohne eine Pause machen zu müssen. Das funktioniert in Dragon NaturallySpeaking nun wirklich nicht.
Auch der Rest - nicht ganz neu, aber beeindruckend. Nun gehen wir natürlich davon aus, dass ein amerikanischer Interviewer, wenn er schon in diesem Stil das Gespräch führt, nicht daran interessiert ist, Fehler zu zeigen. Aber wenn es noch halbwegs in Echtzeit aufgenommen wurde, was da präsentiert wird, so ist die Leistung wirklich sehr gut. Und wenn nicht, wenn ist die Umsetzung in den Film immer noch gelungener als die beiden Nuance, wo der Diktant Herr Meyer "Neue Zeile" sagt und die Spracherkennung einen neuen Absatz macht.
Also: nehmen Sie sich 12 Minuten Zeit und sehen Sie sich das Video an. Interessant ist es auf jeden Fall. Und im Hause Nuance, wenn man keinen Geheimvertrag mit Microsoft abgeschlossen hat (worauf allerdings manche Details schließen lassen), sollte man sich jetzt warm anziehen.
14 November 2006
Wozu man Spracherkennung wirklich braucht (Video)
Der Liebesbrief hat auch was, ihm fehlt aber ein wenig der Realitätsbezug - ich nehm das Headset vorher ab :-)
Und die Beschwerde ist vorhersagbar...
Und zum Schluss die Kapitalismuskritik: hier finden sich alle drei Videos in einem schon weniger basisdemokratischen Kontext.
01 November 2006
Aufnahme unerwünschter Wörter in das Vokabular
Noch ein Hinweis auf das Forum, das Willi Sander unterhält - mit guten Tipps, und wenig Diskussion.
Patch A für Dragon 9
Herr Sander meint, dass der Patch noch ein paar Probleme mehr behebt. Ich kam bisher auch ohne ganz gut zurecht, werde es aber nachher mal probieren.
Nachtrag:
Dragon für 4voice läßt sich damit nicht aktualisieren - ist schon drin, sagt der Installer. Die Nuance-Version hab ich gerade nicht greifbar.
Ich bin jetzt bei der 4voice AG
Natürlich spekuliere ich gern weiter über Fragen, warum der Drache das tut, was er tut, und welches Headset jetzt das beste ist (demnächst im Test das neue BlueParrott). Mein Geld verdiene ich aber mit der Beratung zur Anschaffung größerer Systeme.
Bei der Gelegenheit sollte ich vielleicht noch ein paar Sachen nachtragen, die während des Jobwechsels vergessen wurden oder zu kurz kamen:
- Dictanet macht den Vertrieb jetzt wieder komplett über die Software AG, nachdem die Vertriebs-GmbH fast komplett zu Philips gegangen ist. Zur Strafe verkauft Dictanet jetzt keine Philips-Mikros mehr, sondern rät zu Olympus. Ich höre Philips weinen.
- In der Frankfurter Allgemeinen Sonntagszeitung war letztlich ein Test von Dragon 9, wieder von Michael Spehr. Ich habe drauf verzichtet, ihn großartig zu bloggen, es steht nämlich nichts neues drin (schade, Herr Stückmann, aber die FAZ und FAS wird eben nicht von Dragon-Profis gelesen).
(Danke an Arnd Müller)
26 Oktober 2006
Linguatec berücksichtigt jetzt de Oberbayern
Bisher ist Voice Pro 11 noch gar nicht ausgeliefert. Wenn sich die ersten Erfahrungen einstellen, kommt vielleicht auch ein neuer Post dazu -)
Abhilfe gegen die Aufnahme unerwünschter Wörter in das Vokabular
Um Dragon davon abzuhalten, unerwünschte Wörter heimlich ins Vokabular aufzunehmen, kan man nicht nur unter "Optionen" den Haken bei "Dem Vokabular Wörter automatisch hinzufügen" herausnehmen (und dann manche Wörter, z.B. Komposita, manuell hinzufügen müssen). Willi Sander bietet auch ein Tool namens dns.comfort an, welches diese und andere Aufghaben übernimmt. Auf der Website www.oa-sa.de ist das Tool allerdings nicht zu finden. Wem die Forumsdiskussion Appetit gemacht hat, der wendet sich am besten direkt an Herrn Sander.
Übrigens unterhält er auch ein Forum mit vielen interessanten Tricks.
19 Oktober 2006
Linguatec Voice Pro 11 kommt!
VIaVoice ist bei IBM nach wie vor auch nicht als Produkt gelistet, auch Nuance kennt nur VV 10 - die wollen ja auch Dragon verkaufen. Linguatec hat aber immer gute Verbindungen zu IBM gehabt (war ja mal eine Tochtergesellschaft), und da hat man die Entwickler wohl doch noch zur Arbeit an der Diktiersoftware bewegen können.
Linguatec hat nach eigener Aussage die Oberfläche so gelassen, wie sie ist, aber die Erkennung deutlich verbessert. Man ist gespannt, wie es sich in der Praxis schlägt. Die andere Frage ist immer noch, wie es mit der Bedienung aussioeht - da war Dragon immer besser und schneller.
(Mit Dank an Ronny Jaekel)
18 Oktober 2006
C´t über Vista´s Spracherkennung
"Die Diktierfunktion kann noch nicht mit fortgeschrittenen Lösungen wie Dragon NaturallySpeaking mithalten, blamiert sich aber auch nicht.
Immerhin folgt Vista deutschen Befehlen ... und blendet auf das Wort "Mausraster" ein durchnummeriertes Gitter an, das Anwender per Stimme ansteuern können."
(C´t 21/2005)
Rike Bacher hat´s auf Deutsch getestet und war positiv überrascht, auch wenn in ihrer Beta die Befehle nicht funktionierten. V.a. Die Kommandozentrale hatte es ihr angetan.
04 Oktober 2006
KnowBrainer Forum neu designt!
Dafür ist es aber weit strukturierter; und man soll die Hoffnung nicht aufgeben, dass vielleicht irgendwann so etwas wie eine FAQ-Liste aus den immer wiederkehrenden Themen erwächst. T3echnisch sollte es jetzt zu realisieren sein. Unter http://speechwiki.org/SR/NaturallySpeakingFAQ.html stelt Ian (Natajus), ein eifriger Mitleser und -schreiber, aber gerade welche zusammen, und deutschsprachige Leser kennen vielleicht auch die Dragon-FAQs bei abitz.com, die vom Autor dieser Zeilen zusammengestellt wurden.
22 September 2006
VXI Roadwarrior Bluetooth-Headset
Die solide Ausführung des Headset bezieht sich also auf den potentiellen Einsatzbereich. Jedoch wurde das Headset auch von Nuance für Dragon NaturallySpeaking zertifiziert; um es mit einem PC zu verwenden, muss diese entweder Bluetooth-fähig sein oder man benötigt einen Bluetooth-Adapter. In kurzer Zeit soll aber ein fertiges Paket mit Headset und Bluetooth-Adapter lieferbar sein.
Voraus schicken muss ich, dass Bluetooth und ich zwei verschiedene Welten sind. Es ist mir noch nie gelungen, ein Bluetooth-Gerät auf Anhieb anzuschließen und zu benutzen. Vor diesem Hintergrund ging es erfreulich schnell, das Headset mit meinem PC zu verbinden. Nachdem es über Nacht aufgeladen wurde, ließ es sich problemlos verbinden und als Standard-Gerät einstellen.
Auch der Einsatz mit der Spracherkennung Dragon NaturallySpeaking gestaltet sich verhältnismäßig unproblematisch. Wichtig ist, das Bluetooth-Headset als zusätzliche Diktierquelle anzulegen. Man muss man leider noch einmal ein vollständiges Benutzertraining absolvieren, bevor man anfangen kann zu diktieren. Es hilft nicht, einfach nur den Audio-Assistenten auszuführen - die Erkennungsgenauigkeit ist danach absolut unzureichend.
Auch beim Anlegen des Bluetooth-Headset als neuer Diktierquelle hatte ich das Problem, dass am Anfang die Übertragung anscheinend nicht ausreichend war. Zumindest erschien im Audio-Assistent beim Einstellen der Lautstärke eine Fehlermeldung, es war unmöglich, weiter zu gehen. Im letzten Schritt erzielte ich dann immerhin 17 Punkte. Dies ist etwas unter meinem gewöhnlichen Durchschnitt.
Zunächst mal kann ich sagen, dass das Headset sehr bequem sitzt. Es wird nicht am Ohr befestigt, sondern mit einem Überkopf-Bügel, welcher anscheinend derselbe ist wie beim VXI Parrott TalkPro. Jedenfalls ist das Gerät sehr bequem. Optisch etwas gewöhnungsbedürftig ist die relativ große Sendestation am Ohr, die darüber hinaus während der Arbeit blinkt - die Kollegin beschwert sich schon über die Leuchtzeichen, die ich aussende. Das Gewicht und der ausgeübte Druck sind auf jeden Fall sehr gut auch über längere Zeit zu ertragen.
Am Gerät selbst sind drei Knöpfe - ein Multifunktions-Knopf, mit dem sich zum Beispiel das Headset stummschalten oder auch Telefongespräche annehmen lassen, zwei Knöpfe zur Lautstärkeregelung.
Jetzt zur Qualität der Spracherkennung. Das erste System, auf dem das Gerät getestet wurde, ist ein Computer mit einem Pentium vier-Prozessor, 3,4 GHz, 1 GB RAM. Der verwendete Bluetooth-Strecke stammt von der Firma BlueSoleil - zu meiner Schande sei's gesagt, aber es ist ein einfacher Aldi-Rechner. Die erste Zählung von Wörtern und die Ermittlung des Fehlerquotienten ergibt:
516 Wörter, 13 Erkennungsfehler (wenn man die regelmäßige Fehlerkennung von Bluetooth als Lotus nur einmal wertet) - also eine Erkennungsgenauigkeit von 97,5% nach der Formel 100-(Fehler*100/Wörter) = Erkennungsrate in %.
Ein Test auf einem Notebook (Pentium M. 1,8 GHz, 1 GB RAM) ergibt ein ähnliches Bild. die Erkennung läuft hier etwas schneller als auf dem Desktop-PC, bei der Konfiguration beziehungsweise beim Benutzertraining ergab sich dasselbe Problem mit der Lautstärke Einstellung des Mikrophons.
Als Bluetooth-Stack kommt ein Dongle zum Einsatz, das ursprünglich für die Verbindung mit einem Sony Ericsson-Headset vorgesehen war (im Paket als Xovox Communicator erhältlich). Angeblich ist dieser Bluetooth-Stack besonders gut zur Zusammenarbeit mit Spracherkennung geeignet. Im übrigen habe ich das Sony Ericsson-Headset früher mit beiden Rechnern verwendet, konnte aber keine großen Unterschiede in der Qualität auf dem einen oder anderen Rechner feststellen.
Bezüglich der Spracherkennungsqualität lässt sich feststellen, dass die Übertragung um einiges schneller geht als bei dem Olympus-Mikrophon, welches ich sonst verwendet hatte. Der gesprochene Text erscheint schneller auf dem Bildschirm. Allerdings machten sich bei beiden Testrechnern Verzögerungen bei der Erkennung von Befehlen bemerkbar. Dies ist in Dragon NaturallySpeaking 91 bekanntes Problem. (Auch wie diese ärgerliche Zusammensetzung von einer Zahl und dem unbestimmten Artikel zu einer anderen Zahl - aber dazu gibt es ja Tricks, wie man es vermeiden kann. Man muss nur daran denken, zum Beispiel "Dragon NaturallySpeaking 9 Leertaste ein bekanntes" zu sagen.)
Auffällig ist in dieser Kombination, dass nicht nur die Geschwindigkeit der Spracherkennung besser ist, sondern auch die Qualität. Abgesehen von völlig unbekannten Wörtern wird mein Diktat nach DragonPad mit fast 100 prozentiger Genauigkeit erkannt. (Und auch hier zeigt sich wieder eine Schwäche von Dragon NaturallySpeaking: sobald man anfängt, dass Programm zu loben, macht es Fehler.)
Nach Korrektur aller Erkennungsfehler und Abzug der Wörter, die nicht im Wörterbuch enthalten sind, ergibt sich eine Erkennungsgenauigkeit von 98%.
Inwiefern also ratsam ist, eine bestimmte Bluetooth-Software zu verwenden, sei einmal dahingestellt; ein Unterschied von einem halben Prozent in der Erkennungsgenauigkeit ist hier nicht wirklich aussagekräftig, schon gar nicht, wenn zwei verschiedene Rechner verwendet werden. Jedenfalls lässt sich schon nach einer oberflächlichen Betrachtung sagen, dass das VXI Roadwarrior-Headset eine gute Wahl ist, wenn man ein robustes, bequem zu tragendes schnurloses Headset sucht. Wenn dann demnächst der entsprechende Bluetooth-Adapter mitgeliefert wird, könnte es mein neues Lieblings-Headsets werden.
Huh!
Und eine hübsche Sammlung von Missverständnissen aus dem medizinischen Bereich (Englisch) gibt es beim Knowbrainer.
20 September 2006
Wie Zahlen funktionieren
Was mir auffiel, ist dass das Diktat von Ordnungszahlen in DNS Legal 9 einwandfrei funktioniert, in Professional hingegen nicht :-(
15 September 2006
Faz-Test von Dragon 9 online lesbar
(Dank an Georg Eisenmann von Linguaconsult)
11 September 2006
Interview with Oliver Scholz: Vista Speech UX Program Manager at istartedsomething
Long Zheng's Blog heute mit einem Interview: Oliver Scholz, Produktmanager bei Microsoft und verantwortlich für die "User Experience" (d.h. die Benutzerführung bzw. Bedienbarkeit) der Spracherkennung in Windows Vista, hat eine Menge dazu zu sagen.
Richtig interessant wird die Spracherkennung wohl erst in ein, zwei Jahren, wenn Makro-Unterstützung, Vokabularfähigkeit und Mehrsprachigkeit eingebaut sind ... aber ich bin gespannt.
08 September 2006
Dinge, die die Welt nicht braucht
Ist das jetzt die Reaktion auf die Spracherkennung in Vista? Immerhin bekommt man einen Zebra-Skin für das Notebook gratis dazu (normal 375 €), wenn man mal so richtig auffallen will. Ich seh Paris Hilton schon intime Details in ihr Zebra quatschen.
07 September 2006
Auffälliges Korrekturverhalten in Dragon
Diktiert man ein Wort, welches nicht im Vokabular von Dragon NaturallySpeaking enthalten ist, markiert man sodann dieses Wort und gibt man direkt das richtige Wort ein, ohne die Korrekturfunktion von Dragon NaturallySpeaking zu benutzen, so wird das Wort in das Vokabular aufgenommen! Dies gilt für Dragon NaturallySpeaking 8.
Das wollte ich immer schon einmal testen. In Dragon NaturallySpeaking 9 habe ich daher das Wort "Vattenfall" aus gegebenem Anlass ein diktiert und korrigiert. Ergebnis: wenn in den Optionen die Option "Wörter automatisch zum Vokabular hinzufügen" aktiviert ist, wird dieses Wort tatsächlich hinzugefügt!
Das heißt:
- ich diktiere "Vattenfall", Dragon schreibt "Daten Fall".
- ich sage "korrigier das", Dragon markiert die Phrasen und öffnet das Korrekturmenü.
- ich tippe einfach das Wort "Vattenfall" über die Markierung.
Ich diktiere noch einmal "Vattenfall", Dragon schreibt es korrekt und übernimmt das Wort mit einem roten Stern markiertes Vokabular.
Und jetzt die wirklich schlechten Neuigkeiten: Dragon NaturallySpeaking macht das auch, wenn ich ein diktiertes Wort nicht per Sprachbefehl markiere oder den Korrekturbefehl benutze, sondern wenn ich das Wort per Tastatur markiere und überschreibe. Damit nicht genug - selbst wenn ich das Wort lösche, welches Dragon NaturallySpeaking geschrieben hat, und danach eine Korrektur von Hand mache, wird das Wort in den Wortschatz aufgenommen!
Unter diesen Umständen kann ich nur empfehlen, die Option "automatisch Wörter hinzufügen" abzustellen. Wenn amn sich vorstellt, dass auch die Korrektur nur einiger Buchstaben dann in das Vokabular übernommen wird, wird einen ganz anders - und man versteht plötzlich, wo her die vielen, vielen benutzerdefinierten Müll-Einträge kommen, die sich im Laufe der Jahre ansammeln.
05 September 2006
"Wunderbare Erfahrungen!" FAZ-Rezension von Dragon 9
Der Rezensent (Dr. Michael Spehr) ist von Dragon NaturallySpeaking 9 begeistert. Zwar merkt er an, dass die Erkennungsgenauigkeit der Software sehr stark vom Diktierstil abhängt, nur unter bestimmten Bedingungen zu erreichen sind. "Der ungeübte Nutzer mit einem reichhaltigen Vokabular, ein Schriftsteller etwa, wird eher bei 95% liegen." Dafür hält er es für möglich, dass ein Arzt oder Rechtsanwalt mit einem klar definierten Wortschatz und häufig wiederkehrenden Formulierungen eine Genauigkeit von 100% erreicht. Übrig bleibt natürlich der Anspruch an den Diktanten, "druckreif" zu formulieren, also nicht die Gedanken erst niederzuschreiben und dann zu ordnen.
Nach Meinung des Rezensenten ist es nötig, das Benutzertraining mit Dragon NaturallySpeaking zu absolvieren, auch wenn die Software inzwischen ohne Training nur mit der Einstellung des Mikrophons gute Ergebnisse liefert. Außerdem empfiehlt er die Dokumentenanalyse von E-Mails und eigenen Dateien, um Dragon NaturallySpeaking mit dem eigenen Vokabular und der eigenen Schreibweise vertraut zu machen. [Dieser Analyse halte ich so, wie sie im Benutzerassistenten vorgenommen wird, sogar für schädlich: es wird wesentlich mehr Schrott aufgenommen als Wörter, die man tatsächlich braucht. Besser ist es, später im Erkennungscenter eine Analyse ausgewählter Dokumente vorzunehmen.] Die Wichtigkeit der Korrektur wird hervorgehoben; das Fehlen eines USB-Mikrophon zu angemerkt.
Positiv fällt auch auf, dass Dragon NaturallySpeaking 9 offensichtlich besser und schneller lernt als die Vorversionen.
Einige Hinweise gibt es auch zur Verwendung mit Diktiergeräten. Dragon NaturallySpeaking unterstützt in der aktuellen Version zusätzliche Audioformate wie MP3, WMA und WAV, und die Qualität der Umsetzung von mit einem digitalen Diktiergerät aufgenommene Diktate hat sich deutlich verbessert. Allerdings muss man gerade hier darauf achten, sauber zu diktieren, möglichst wenige Nebengeräusche zu produzieren und einen gleichmäßigen Abstand zwischen Mund und Diktiergerät einzuhalten. Dann erreicht man "sehr gute Resultate bei der Umsetzung von Aufnahmen, die im fahrenden Auto entstanden".
Weitere Neuerungen sind die Anwendung von Bluetooth-Mikrophonen, das Speichern der Benutzerdateien in einem Netzwerk und die automatische Umsetzung von Aufnahmen, die in einem vorher definierten Verzeichnis abgelegt werden.
Schließlich macht die verbesserte Kompatibilität von Dragon NaturallySpeaking mit zahlreichen Programmen viel Freude. Manchmal (wie z.B. beim Diktat dieses Eintrags) ist es allerdings auch noch nötig, dass Diktierfenster von Dragon NaturallySpeaking zu benutzen, in das sich doch sehr viel besser diktieren lässt als in nicht vollständig unterstützte Anwendungen. Dieses Diktierfenster ist allerdings - entgegen der Rezension - keine Neuerung in der aktuellen Version. Kritisch wird noch angemerkt, dass das Diktierfenster durchaus auch in einigen Anwendungen benötigt wird, die eigentlich unterstützt werden sollten - so gibt es im Internet Explorer oder in Firefox immer mal wieder Probleme.
Schließlich zitieren wir noch den letzten Absatz, der sich anhört, als käme er direkt aus der Marketing-Abteilung :-)
"Das neue Dragon ist also sehr empfehlenswert. Es gibt keine bessere Spracherkennung, und das Update auf Version 9 lohnt in jedem Fall."
PS Hier gibt's den Artikel, in DNS gelesen und ordnungsgemäß transkribiert von Willi Sander.
01 September 2006
Sneak Preview: Empfehlungen für Dragon NaturallySpeaking 9
- Empfehlungen beim Upgrade auf Dragon NaturallySpeaking
- Software- und Hardware-Empfehlungen
(beides als PDF).
Feedback bitte!
media|NRW - Nachricht: Sprachbarrieren in Europa überwinden
Neuen Nachrichten von meinem anderen Hobby - maschinelle Übersetzung, diesmal in Zusammenarbeit mit Spracherkennung. An so einem automatischen Dolmetscher arbeitet man ja mit unterschiedlichen Erfolgen schon seit längerer Zeit, wir erinnern nur an das damals viel zu früh gekommene (und verschiedene) Verbmobil-Projekt. Zum Spaß habe ich so etwas auch schon einmal mit Dragon NaturallySpeaking und @promt™ programmiert.
So, und jetzt eröffne ich die Diskussion über die Qualität einer Maschine, bei der beide Komponenten dafür bekannt sind, gerne einmal Fehler zu produzieren, die einem Menschen niemals unterlaufen würden. (Dass Menschen ganz andere Fehler unterlaufen, der eine Maschine niemals machen würde, steht auf einem anderen Blatt.)
Siehe dazu auch unten den Link zu der Übersetzung eines Forumsbeitrags :-)
Windows Vista bringt Nuance und IBM zum Schweigen
Der Inquirer sieht die Zukunft von Dragon und ViaVoice in dunklen Tönen. Die Integration von Spracherkennung in Windows ist er habe denselben Effekt wie der Internet Explorer ihn damals auf Netscape gehabt habe - Anwender werden nicht etwa das bessere Produkt auswählen, weil sie die Wahl zischen zwei Produkten haben, sondern sie werden gar nicht wählen und stattdessen das Produkt nehmen, das bereits auf Ihrem Rechner installiert ist.
Gleichzeitig fragt er, wie so IBM die Entwicklung von IBM ViaVoice praktisch eingestellt hat und damit zum Beispiel der Linux-Gemeinde Spracherkennung grundsätzlich vor enthält, wieso die Entwicklung bei Microsoft wesentlich zielstrebiger vor sich zu gehen scheint als bei Nuance, wieso Nuance sich nicht auf alternative Betriebssysteme konzentriert- um im bilde zu bleiben, schlägt er Nuance damit eine Art Mozilla-Rolle vor, also ein alternatives, besseres Produkt für mehr Plattformen, welches die Nische besetzt, die der Platzhirsch nicht bedienen kann oder will.
Die Reaktion von Nuance sieht allerdings, wie der Artikel berichtet, eher aus wie die Reaktion, die man ansonsten vom Platzhirsch erwarten würde: das Produkt sei überlegen, enthalte juristische und medizinische Wortschätze, welche der Konkurrenz fehlten, sei erhältlich für mehrere Sprachen... abgesehen davon, dass auch die Spracherkennung im Windows Vista in mehreren Sprachen erhältlich sein wird (deutsch ist eine von ihnen), mag es ja vielleicht sein, dass Ärzte und Juristen eine spezialisierte Anwendung verwenden werden. Genauso wird in Firmen ein Dokumenten-Management eingesetzt, aber der Heimanwender benutzt einfach den Windows Explorer (wenn er denn überhaupt so weit denkt).
IBM, früher der Pionier für Spracherkennung, hat bereits vor 10 Jahren ein Betriebssystem entwickelt, welches sich über Sprache steuern ließ. Dies ist aber komplett untergegangen. Eine Linux-Distribution von IBM ViaVoice ist ebenfalls seit längerer Zeit nicht mehr erhältlich (auch wenn einige Linux-Freunde immer mal wieder darauf hinweisen). Auch hier zitiert der Artikel nur ausweichende Stellungnahmen von IBM.
Der Hinweis auf diesen Artikel kommt aus einem Blog eines Microsoft-Entwicklers - immerhin. Dem darf man natürlich unterstellen, dass er sein eigenes Produkt besser findet als die der Konkurrenz. Ist ja auch sein gutes Recht. Umso mehr rechnen wir ihm an, dass er noch auf einige andere Punkte hinweist, die Dragon NaturallySpeaking im Moment Windows ist er voraus hat. So liegt Dragon NaturallySpeaking der Spracherkennung ein Headset bei (wobei ein Headset dieser Qualität nun wirklich kein Vorteil ist :-) Schon wesentlich interessanter sind die Makro-Fähigkeiten von Dragon NaturallySpeaking. Allerdings, wie man nicht ohne Grund anmerkt, liefert Microsoft ein SdK an Entwickler kostenlos aus, wohingegen das von Nuance richtig teuer ist, und auch OEM-Hersteller werden sich nicht nehmen lassen, ihren Computern demnächst Headsets beizulegen, gegen vielleicht sogar besser sind als die in einer Schachtel mit Dragon NaturallySpeaking (was ja, wie gesagt, auch nicht weiter schwer ist).
Meine Meinung: ich fürchte, sie haben recht. Nuance wird sich etwas ausdenken müssen, um das Produkt entsprechend zu positionieren. Das Schlimmste, was natürlich passieren kann, ist das die Microsoft Spracherkennung beim durchschnittlichen Benutzer dieselben Ergebnisse liefert wie in jener Produktdemonstrationen, und das Spracherkennung damit mal wieder für die nächsten Jahre von der Agenda verschwindet. Und es soll keiner glauben, dass Nuance dann sagen kann: "nehmt Dragon NaturallySpeaking, es funktioniert im Gegensatz zu Windows Vista". Die Leute werden immer nur sagen, dass Spracherkennung erwiesenermaßen eben nicht funktioniert.
Wie ich darauf komme? Fünf Jahre Telefon.
(diktiert mit Dragon NaturallySpeaking 9)
28 August 2006
Neuigkeiten in Dragon NaturallySpeaking 9 - Teil 3
- Getwords-Putwords funktioniert nicht mehr.
- das Befehlcenter sieht jetzt ganz anders aus und ist wesentlich schneller. Die Bearbeitung ist noch gewöhnungsbedürftig, es scheint aber einfacher zu gehen als in der Vorversion.
- das Thema Ordinalzahlen ist leider immer noch nicht gelöst. In Dragon NaturallySpeaking Legal mit dem juristischen Wortschatz funktioniert es, mit dem normalen Wortschatz nicht.
- ähnlich sieht es mit "§2" usw. aus - mit dem Wortschatz von Dragon NaturallySpeaking Professional lässt sich dieses Symbol mit der Zahl zusammen nicht ohne Eingriffe diktieren. (kleiner Tipp: man kann die Eigenschaften des Wortes Paragraph editieren, so dass es vor einer Zahl immer korrekt als § erscheint; eine genaue Anleitung veröffentliche ich vielleicht später).
- der Befehl "verbinde das" funktioniert nicht immer zuverlässig - mancher verbindet er nämlich gar nichts.
- auch das Problem mit dem Diktat von Zahlen nach Microsoft Excel ist noch nicht gelöst. Hier ist aber von dritter Seite eine Lösung in Sicht.
Noch etwas: eine maschinelle Rohübersetzung der Hinweise zur Bearbeitung des Vokabulars für das Upgrade nach Dragon NaturallySpeaking 9 findet sich unter f. Adresse:
http://tinyurl.com/rz5l4
(übersetzt mit PROMT, www.promt.info)
leider muss man "Periode" mal durch "Rechtschreibung" und mal durch "." Ersetzen, um den Sinn richtig zu verstehen - soweit ist die maschinelle Übersetzung leider noch nicht. Auf der Basis arbeite ich aber an einem Dokument, das die staunende Öffentlichkeit demnächst zur Kenntnis nehmen darf.
Ich darf übrigens ergänzen, dass ich diesen Beitrag natürlich diktiere - und zwar direkt nach Opera, wo er schnell und genau geschrieben wird. Das ist auch gut so, weil die Korrektur nämlich in diesem Fenster nicht funktioniert :-) aber wozu auch?
Hints for cleaning up your Word List.
Jetzt ist die Chance da, all die Bugs und Fehler auszumerzen, die uns die letzten Monate genervt haben!
Mehr Neuigkeiten zu Dragon 9
1. einen Roaming User kann man doch updaten, wenn man eine Verbindung mit dem Server-Laufwerk hat, auf dem er gespeichert ist. Mit der lokalen Kopie geht das nicht. Allerdings ist es mir bei zwei Usern nur mit einem gelungen, also vielleicht doch lieber erst den Roaming User in der alten Version als lokalen Benutzer importieren, oder - noch besser - in DNS 8 eine Wortliste exportieren, in DNS 9 einen neuen Benutzer anlegen und die Wortliste importieren.
Perfektionisten werden einen Benutzer upgraden, sein Vokabular komplett mit Verwendungsinformationen exportieren, einen neuen Benutzer anlegen und das Vokabular importieren. Der Zwischenschritt muss sein, weil DNS 9 kein Vokabular aus DNS 8 direkt importieren kann (das wäre mal ein Feature, das man wirklich braucht). Weil aber die Algorithmen in jeder Version angepasst werden, ist nur ein Nutzer, der mit der aktuellen Version angelegt wurde, wirklich auf dem neuesten Stand.
2. Während der Installation gibt es eine Option: "Einstellungen für alle Benutzer verändern". Kreuzt man sie an, so werden alle unter "Optionen" gewählten Einstellungen für alle Benutzer auf diesem Rechner übernommen (z.B. Zugriffstasten, Anzeige oben oder in Taskleiste usw.) Sehr praktisch für Leute wie mich, die mehrere Benutzer auf einem Rechner haben und stark in die Programmoptionen eingreifen.
3. Ebenso lässt sich schon während der Information das Verzeichnis für den Roaming User eingeben - einfach die Option "Administrative Einstellungen verändern" ankreuzen.
25 August 2006
Erste Erfahrungen mit Dragon NaturallySpeaking 9
Die Erkennungsgenauigkeit von Dragon NaturallySpeaking 9 ist von Anfang an sehr gut. Interessanterweise hatte ich bessere Resultate, wenn ich den Benutzer nicht trainiert habe. Nach 1. Rückmeldungen von Kollegen gibt es verschiedene Erfahrungen - alle sagen zwar, dass auch ohne Training die Erkennungsgenauigkeit bereits beeindruckend sei, einige raten jedoch trotzdem zu Training, während andere der Meinung sind, dass man jetzt gut darauf verzichten könnte. Möglicherweise hängt es davon ab, wie konzentriert man den Trainingstext vorliest - nachdem ich ihn beinahe auswendig kann, neige ich dazu, beim Lesen schlampig zu werden. Das wirkt sich dann natürlich auf die Qualität des Diktates aus.
Jetzt einige Beobachtungen und Hinweise für das eigentliche Upgrade. Ich habe zunächst auf einem Notebook, 1 GB Arbeitsspeicher, Centrino-Prozessor mit 1,8 GHz, die neue Version installiert und mehrere neue Benutzer angelegt sowie vorhandene Benutzer zumindest versucht in die neue Version zu übernehmen.
Die Installation einer Vollversion über eine bestehende Installation von Dragon NaturallySpeaking funktioniert problemlos. Da die Upgrades noch nicht angekommen sind, ist im Moment noch nicht ganz klar, was passiert, wenn man eine Upgrade-Version versucht auf einem Rechner ohne Installation von Dragon NaturallySpeaking neu zu installieren. In früheren Versionen musste man zuerst die alte Version installieren, um dann das Upgrade vornehmen zu können; gerüchteweise reicht es jetzt, die alte Programm-CD bei der Hand zu haben.
Vorhandene Benutzer im Standard-Verzeichnis werden schon am Ende der Installation auf den neuesten Stand gebracht, wenn man das will. Ansonsten gibt es wieder wie schon in Version 8 einen Upgrade-Assistenten, mit dem vorhandene Benutzer aktualisiert werden können. Einstellungen werden dabei übernommen, auch mehrere Vokabulare oder mehrere Diktierquellen.
Gescheitert bin ich dabei, Roaming Users zu aktualisieren. Wenn man das Standardverzeichnis angibt, in dem die Roaming Users gespeichert sind, erhält man eine Fehlermeldung. Es hilft auch nicht, sie in das "Users"-Verzeichnis zu kopieren. Offensichtlich müssen sie erst aus Version 8 exportiert werden, damit man sie nach Version 9 importieren kann.
Was aber hervorragend funktioniert, ist der Export und Import von benutzerdefinierten Wörtern. Wählt man "Wörter - exportieren", so erzeugt Dragon NaturallySpeaking 1 Wortliste im Textformat, die sich abspeichern lässt und unter Dragon NaturallySpeaking 9 über "Wörter - importieren" in einer neu angelegten Benutzer importiert werden kann - und zwar mit gesprochenen Formen.
Jetzt zum Thema Ressourcen: die Systemanforderungen für Dragon NaturallySpeaking 9 sind gegenüber denen von Dragon NaturallySpeaking 8 noch einmal gestiegen. In der Praxis macht sich allerdings auf meinem Notebook kein Unterschied in der Geschwindigkeit des Diktierens bemerkbar - wenn das Diktat erst einm das dauert nämlich deutlich länger. Während des Diktates wird der Arbeitsspeicher allerdings stark beansprucht - 30 bis 40% Auslastung sind Durchschnitt, während Korrekturen kann es auch schon einmal zu Spitzen von 100% kommen. Ein neuer Rechner muss also nicht unbedingt her.
In der Bedienung fallen einige Verbesserungen gegenüber der Vorversion auf - hier sind also offensichtlich bekannte Fehler beseitigt worden.
1. das Diktat von Ordinalzahlen funktioniert wieder. Es lassen sich also wieder per Sprachbefehl nummerierte Listen erstellen. Dafür werden jetzt allerdings wieder mehr Zahlen in den Fließtext eingebaut, was vor allem beim unbestimmten Artikel unschön ist.
2. nach einem Punkt wird in Word jetzt wieder korrekt weiter geschrieben, auch wenn zwischendurch korrigiert wurde. Der neue Satz fängt also korrekt mit einem Großbuchstaben und nicht mit einem kleinen Buchstaben an.
3. das Hinzufügen neuer Wörter zum Wortschatz während des Diktates ist jetzt eine Option. Dies wurde in verschiedenen Foren bereits heiß diskutiert - tendenziell ist es eine Fehlerquelle, dass Dragon NaturallySpeaking während des Diktates selbstständig Wörter zum Wortschatz hinzufügt, teilweise ohne den Benutzer zu fragen. Dies war vor allem bei Komposita ein Problem, weswegen ich die Option "Komposita selbstständig bilden" auch ausgeschaltet hatte und stattdessen lieber 2 Wörter mit dem Befehl "verbinde das" zusammengefügt habe. Ein derart gebildetes Kompositum wird jetzt automatisch zum Wortschatz hinzugefügt - für mich eine Erleichterung. Andere gehen vielleicht lieber anders vor, deaktivieren das automatische Hinzufügen von Wörtern zum Vokabular und lassen die eigenständige Komposita Bildung lieber eingeschaltet.
Wie sich Dragon NaturallySpeaking 9 tatsächlich in der Praxis bewährt, werde ich erst in der nächsten Woche ausführlich testen. Weitere Beiträge stehen also bevor.
Schließlich: diesen Beitrag habe ich parallel mit 2 Mikrophonen in 2 Rechner diktiert, der eine mit Dragon NaturallySpeaking 8, der andere mit Dragon NaturallySpeaking 9. Zieht man die Erkennungsfehler der Version 9 ab, die daraus resultieren, dass ich noch nicht den Wortschatz vollständig angepasst habe, ergibt sich ein Verhältnis von:
Dragon NaturallySpeaking 8 mit einem Benutzer, der seit einiger Zeit im Einsatz ist: 18 Fehler
Dragon NaturallySpeaking 9 mit einem neu angelegten, trainierten Benutzer: 14 Fehler (die ich aber weitgehend korrigiert habe :-)
Für mich eine eindeutige Verbesserung "out of the box".
24 August 2006
Schnittstelle zwischen Olympus DSS-Player und Dragon 9
http://www.olympus.de/consumer/2590_software.cfm
(Dort die entsprechende Software auswählen).
Außerdem wurden einige Bugs beseitigt.
22 August 2006
"Doppelt die Killer": heise online über Microsofts Panne mit Vistas Spracherkennung
Allerdings meist nicht in einem solchen Rahmen :-)
Außerdem danke für den Hinweis, dass die Vista-Spracherkennung zwar für Deutsch "fest geplant" ist, jedoch noch nicht fest steht, ab wann. Das passt dazu, dass die Ankündigung - wie schon gebloggt - eine Zeit lang auf der österreichischen MS-Site zu sehen war, dann wieder nicht, und dass Beta-Tester schon über die ersten Erfahrungen mit Spracherkennung berichtet haben.
Ach übrigens: Willkommen zurück. Nach Krankheit und Urlaub werden die Meldungen jetzt wieder häufiger kommen. Demnächst z.B. über die ersten Erfahrungen mit DNS 9 - die Installation läuft gerade auf dem Notebook.
18 Juli 2006
Dragon 9 erscheint in den USA!
Die genauen Termine für die deutsche Version werden wohl noch heute bekanntgegeben - stay tuned. August wird es auf jeden Fall.
11 Juli 2006
Effizient korrigieren mit Dragon NaturallySpeaking
1. Korrektur per Sprachbefehl
Wenn Sie konsequent alles per Sprachbefehl machen wollen, werden Sie den Befehl "korrigier [Wort oder Wörter]" benutzen. Dieser Befehl markiert das Wort, welches Sie korrigieren wollen, und öffnet ein Fenster, in dem Ihnen verschiedene Korrekturen angeboten werden. Sagen Sie "nimm 1" oder "nimm 2" usw., um die korrekte Alternative auszuwählen, oder "schreib das", wenn sie nicht dabei ist. Es öffnet sich ein Fenster, in welches Sie das Wort einbuchstabieren können. Sie können die Buchstaben sagen oder - besser - das Buchstabieralphabet nützen, also z. B. "Anton" für "a", "Berta" für "b". Vor einem Großbuchstaben sagen Sie "Groß", also z.B. "groß Anton" oder "groß a" für "A". Sie können aber auch in dieses Fenster tippen - die meisten Leute finden das schneller und bequemer. Sie können auch die Rücktaste, Leertaste, Löschtaste und die Pfeiltasten benutzen. Mit der Eingabetaste übernehmen Sie die Korrektur in den Text.
2. Korrektur mit Tastatur und Maus
Schneller, bequemer und sicherer als per Sprachbefehl öffnen Sie das Korrekturmenü mit einer Funktionstaste. Markieren Sie das Wort, das Sie korrigieren möchten, und rufen Sie das Korrekturmenü mit einem Druck auf die Minustaste am Ziffernblock ganz rechts auf Ihrer Tastatur auf. Im Menü "Optionen" können Sie die Tastenbelegung ändern und eine andere Taste benutzen.
Im Korrekturmenü markieren Sie einfach die korrekte Alternative mit den Pfeiltasten und drücken Sie die Eingabetaste, um die Korrektur in Ihren Text zu übernehmen. Wenn die richtige Alternative nicht dabei ist, drücken Sie einfach noch einmal die Minustaste am Ziffernblock, um das Buchstabierfenster zu öffnen.
Lange bevor sich die Maus als Eingabegerät für den Computer durchsetzte, konnte man mit der Tastatur schon ganze Wörter, Sätze und Absätze markieren. Das funktioniert auch heute noch! Probieren Sie es einmal aus: Drücken Sie die Steuerungstaste, halten Sie sie gedrückt und drücken Sie die Pfeiltasten, um in Ihrem Text schnell vom Anfang eines Wortes zum nächsten Wortanfang zu springen.
Um ein Wort oder mehrere Wörter zu markieren, setzen Sie den Cursor neben das erste Wort, drücken Sie die Steuerungstaste, die Umschalttaste und die jeweilige Pfeiltaste und markieren Sie das gewünschte Wort beziehungsweise die gewünschten Wörter. Drücken Sie dann die Minustaste am Ziffernblock, um das Korrekturmenü aufzurufen. Weiter geht es wie oben beschrieben.
Vorteil dieser Methode: Markieren mit der Tastatur geht meist viel schneller als Markieren mit der Maus, und genauer ist es außerdem. Und ein paar Tastaturbefehle zu lernen sollte wirklich keinen überfordern!
Das Ziel ist, Erkennungsfehler möglichst schnell zu korrigieren. Benutzen Sie deswegen die Methode, die Ihnen am bequemsten und schnellsten erscheint. Das ist wahrscheinlich eine Mischung aus Sprachbefehl, Tastatur und Maus. Je effizienter Sie korrigieren, desto schneller sind Sie bei der Arbeit!
07 Juli 2006
Wie mache ich intelligente Fehler?
Natürlich treten auich weiterhin Erkennungsfehler auf, aber die Fehler folgen einem dem menschlichen Denken vertrauteren System.
"One surprising thing about testing interfaces like this is that sometimes, even if they don't get the absolutely correct answer, users like them a lot better," said Lieberman [der Entwickler]. "This is because they make plausible mistakes, for example 'tennis clay court' for 'tennis player', rather than completely arbitrary mistakes that a statistical recognizer might make, for example 'tennis slayer'," he said.
Und seien wir ehrlich - wir verstehen auch nicht jedes Wort, bemühen uns aber so gut es geht um Sinnkonstanz, d.h. versuchen eine unverständliche Aussage so zu interpretieren, dass sie im gegebenen Kontext Sinn ergibt. Wieder ein Schritt auf dem Weg, den Computer dem Menschen anzunähern - und sei es in der Art der Fehler, die er macht.
[Quelle ursprünglich Jen's Weblog]
05 Juli 2006
Korrekturbefehl ändern in Dragon
Wer übrigens nicht auf Dragon NaturallySpeaking 9 warten möchte, indem sich das Diktiertextfeld in Größe und Layout vollständig anpassen lässt, kann mich eventuell auch lieb darum bitten, dass ich ihm ein bisschen Hilfestellung gebe :-)
Ich diktiere gerade selbst mit dem modifizierten Diktiertextfeld in ein Opera-Browser Fenster, und der Vorteil besteht darin, dass man in diesem Feld auch mit Sprachbefehlen korrigieren kann. Der Nachteil besteht darin, dass es auch sehr nötig ist zu korrigieren - wenn mir irgend jemand erklären kann, wieso die Erkennungsgenauigkeit in manchen Programmen besser ist als in anderen, und ob sich daran etwas ändern lässt, wäre ich dieser Person zu ewigem Dank verpflichtet.
03 Juli 2006
Dragon NaturallySpeaking Hints, Articles, Recommendations, Softnet Systems, Inc., Speech Recognition Specialists
- Benutzen Sie ein gutes Mikrofon und ein schnelles System
- Sprechen Sie klar und deutlich, v.a. gleichmäßig
- Benutzen Sie die Hilfsmittel, die Dragon zur Verfügung stellt.
Alle drei Punkte werden ausführlich diskutiert und enthalten für Anfänger und Fortgeschrittene zahlreiche Hinweise - leider nur auf Englisch, aber das Meiste passt auch auf uns deutschsprachige Diktatoren.
27 Juni 2006
heise online - Modell zur genauen Stimmanalyse entwickelt
Links zur Diskussion stehen beim Beitrag. Der interessanteste ist vermutlich http://www.heise.de/tr/artikel/74593. Ich zitiere:
„Wir erreichen beim Vergleich der Stimmen nahezu die Genauigkeit des menschlichen Gehörs“, sagt Rahman selbstbewusst.
Das klingt jetzt nicht gerade revolutionär, v.a. nicht als Beweismittel vor Gericht, wo die Methode schon eingesetzt wurde. Aber:
Und anders als eine Auswertung durch einen Phonetiker unterliege seine Methode keinem subjektiven Einfluss. Sie sei unabhängig von Sprache, Grammatik sowie Sprechrhythmus und brauche auch keine Proben mit dem gleichen Text; die Qualität von mitgeschnittenen Telefonaten reiche für aussagekräftige Ergebnisse.
Und wieder wollen wir uns um die Implikationen keine Gedanken machen :-(
22 Juni 2006
Die Nuance-Foren sind wieder da!
21 Juni 2006
Spracherkennung in Vista
- Microsoft selbst ist noch nicht ganz einig, was geht. Die deutsche Seite erwähnt Spracherkennung nicht. Auf Österreichisch ist Spracherkennung aber wohl definitiv integriert (Viele Grüße an Waltraud Voelter und Kurt Martin :-)
- Windows Vista Speech Recognition Step-by-Step Guide (engl.):
Dieses Dokument erläutert anhand eines einfachen Szenarios, wie sich mit Windows Vista Dokumente per Spracherkennung diktieren und editieren lassen. Aber wieder nur Englisch. - Der Vista-Beta-Test auf Orty.de hat nur Englisch.
- Aber woanders sieht es besser aus. Ich zitiere das Forum auf www.traum-projekt.com:
Hm, ich habe das [Vista] jetzt seit ein paar Tagen drauf und muss sagen, dass ich doch positiv überrascht bin.
Besonders die integrierte Spracherkennung hat es mir angetan, diesen Text hier habe ich zum Beispiel nicht getippt sondern diktiert.
Ansonsten: Das System kann ja Systemressourcen fressen wie kein Zweites. Ich habe ein Gigabyte Arbeitsspeicher und davon nur noch knapp 200 Megabyte zur Verfügung!
Übrigens: Entgegen einiger Presseberichte, die alle voneinander und aus Bill Gates' Keynote abschreiben und ansonsten weitgehend ahnungslos sind, wird in Vista nicht "erstmals" Spracherkennung eingeführt. Es gibt sie schon seit längerem in Office XP und Nachfolgern. Zum Schluss noch eine Quote eines ehemaligen Scansoft-Mitarbeiters aus dem Knowbrainer-Forum, von einem MS-Mitarbeiter geblogt:
"... I have to say that I am absolutely, unequivocally, and most definitely impressed with the latest version of MS speech. The difference is like night and day compared to any of the previous versions, including 2003. In addition, the current version compared to any of the previous versions is like the difference between DNS 2.0 and DNS 8.1. Microsoft is not only closing the gap between MS speech in DNS, it is very close to leapfrogging DNS."
Allerdings kommen auch Berichte, nach denen die Dragon-Spracherkennung der von Windows weiterhin überlegen ist - nicht unbedingt qualitativ, aber in der Unterstützung von Nicht-Microsoft-Anwendungen. Dazu habe ich schon etwas zitiert, und zwar aus dieser Quelle.
20 Juni 2006
Spracherkennung, Übersetzung, nur 50 € - was will man mehr?
Und wenn es funktioniert. Und hier schlägt bei einem Preis von 50€ die Konsumenten-Falle zu, wie der Artikel ganz klar zeigt. Das Ding ist als Spiel positioniert, und dementsprechend wird es gewertet. Für 50€ gibt es im Spiele-Bereich aber sicherlich sehr viel mehr Gegenwert als bei diesem Gerät, das High-Tech m.o.w. verschleudert. Man fragt sich, ob ein höherer Preis nicht paradoxerweise ein weniger kritisches Publikum angezogen hätte, und ob Sony da nicht wieder einen Schnellschuss getan hat, der der Technologie mehr schadet als nutzt.
So hat die integrierte Spracherkennung nur ein sehr kleines Lexikon, was den Autor aber nicht weiter tangiert (von einem Lexikon hat er noch nichts gehört, sonst schriebe er "Dezibil" nicht so debil). Bei einer Anwendung dieser Art ist es erfahrungsgemäß ein Problem, wenn sie nur ausgewählte Sätze versteht. Schließlich will ich (d.h. der Kunde) mich ausdrücken, und nicht auf einen doch recht kleinen Fundus an Sätzen angewiesen sein. Das hat bei Büchern zwar nie geschadet, aber mit denen spricht man ja auch nicht.
Und hier treffen wir auf das alt bekannte Problem aller sprachgesteuerten Interfaces: Rede ich mit meinem Rechner, so vermenschliche ich ihn. Und daher erwarte ich eine menschliche Reaktion. Kommt nur eine maschinelle, so bin ich enttäuscht - egal wie großartig die Technik ist, und wie viel ich im Zweifelsfall damit anfangen kann.
(Insofern ist der Drache ein guter Mediator: ein Tier lebt und reagiert auf menschliche Sprache, man erwartet von ihm aber nicht die Reaktionen eines Menschen.)
Im Prinzip müsste jede Maschine dieser Art erst den Turing-Test bestehen, bevor sie auf juvenile Blogger, freie Journalisten und schließlich das zahlende Publikum losgelassen wird.
Nuance-Foren sind offline!
Hier die relevante Diskussion, von mir selbst vom Zaun gebrochen.
19 Juni 2006
Talking PCs? Talk to the hand - ZDNet UK Insight
Talking Windows: Exploring New Speech Recognition And Synthesis APIs In Windows Vista -- MSDN Magazine, January 2006
Darf man dem Konwbrainer glauben (siehe meinen Post vom 14.6.), ist die Spracherkennungsqualität besser als Dragon 8. Ich habe mal die Variante für den Pocket PC getestet und war begestert. Diktieren ist dort natürlich nicht möglich, aber allein die Tatsache, alle Kontakte per Sprache aufrufen zu können, auch bei ungewöhnlichen Namen - Respekt.
Und wieder kein Wort, ob sich die Spracherkennung auf Englisch beschränkt. Hat jemand schon eine deutsche Beta heruntergeladen?
14 Juni 2006
Spracherkennung in Windows Vista
Windos Vista wird in der US-amerikanischen Version eine eingebaute Spracherkennung haben. Unter der angegebenen URL läst sich schon jetzt ein Befehlssatz ansehen.
Unter http://www.microsoft.com/technet/WindowsVista/library/c208e792-e591-455a-82d9-a98264324e0d.mspx findet sich die Microsoft-Beschreibung der Spracherkennung.
Das Knowbrainer-Forum hat ebenfalls etwas dazu zu sagen - u.a. dass die MS-Engine in ihrer jetzigen Beta-Form bereits bessere Ergebnisse erzielt als Dragon 8. Der Knowbrainer ist an der Entwicklung beteiligt und ergeht sich daher in dunklen Andeutungen, weil er nichts genaues sagen darf.
Eine Spracherkennung in MS Office, US-Englisch, gibt es schon seit Office XP. Sie enthält die ominöse ctfmon.exe, die auch vom deutschen Office gestartet wird und immer mal wieder für Konflikte mit Dragon sorgt. Die Frage, die mich interessiert, und die mir noch keiner beantworten konnte, ist:
Wird es diese Spracherkennung auch für Deutsch geben?
Wenn die Sprachsteuerung für den Pocket PC als Maßstab gelten kann, dann steht allen Dragon-Händlern eine harte Zeit bevor.
Kleine Ergänzung: Pleite gehen wir deshalb noch nicht. Hier eine Liste der unterstützten (und wichtiger, NICHT unterstützten Anwendungen:
- Microsoft Word and Outlook
- Virtually all applications that are part of Windows Vista
Dictation will not work in many applications. These include, but are not limited to:
- Microsoft PowerPoint
- Excel
- WordPerfect
- Eudora
- Lotus Notes
06 Juni 2006
Das sollte jeder Dragon-Nutzer kennen
29 Mai 2006
Hausfrauentipp
[brought to you via the Nuance forum]
22 Mai 2006
Erkenungsfehler!
Wirklich schön, und von dem üblichen Verbesserungseifer der meisten anderen Beiträge im Internet, die sich mit Spracherkennung befassen, nicht befallen ist die Sammlung von Erkennungsfehlern. Wie wäre es, wenn meine geschätzten Leser in den Kommentaren ihre eigenen Lieblings-Erkennungsfehler hinterlassen würden? Erkennungsfehler sind keine Schande! Einen meiner Kundinnen, eine gewisse Frau Andreadakis (offensichtlich ein griechischer Name), freute sich sehr, als mein Computer sie mit "Liebe Frau andere Antarktis" ansprach.
Ein Anwender auf out-loud.com beschreibt, welche Strategie er entwickelt hat, um sich gegen die Eigenwilligkeiten seiner Spracherkennung (die er VIN nennt) zu wehren:
Last week I programmed VIN with a voice macro I named "you %*\#@^&!." Now, whenever I notice that the screen contains a word of dubious origin, I roar, ""you %*\#@^&!," and VIN responds, "I'm sorry I was such a jerk. I swear it'll never happen again. I'm feeling much better now."
I appreciate the sentiment. I just wonder if he really means it.
Sehr schön. Perfekt wäre es, wenn der Computer darauf hin von sich aus die Korrekturfunktion aktivierte :-)
19 Mai 2006
Neues von Olympus
Das Olympus DS 660 ist von allen digitalen Diktiergeräten das kleinste. Die Funktionen sind aber absolut professionell - einfügen von Aufnahmen, löschen, teilweise löschen, Verwaltung von mehreren Ordnern, Übertragung per USB auf den Rechner, also alles, was Diktiergeräte können müssen. Das DS 660 gehörte bis zum letzten Monat in die Olympus Pro Line, in der nur die hochwertigen Diktiersysteme angeboten werden. Es läuft jetzt allerdings aus, so dass es nur noch einen Restposten von Geräten aus der Olympus Pro Line gibt. Der Preis für diese Geräte beträgt 359 EUR.
Danach wird es das Olympus DS 660 als Pro Line-Gerät nicht mehr geben.
Da Olympus allerdings noch etliche Geräte auf Lager hat, wird es zum Abverkauf das Olympus DS 660 in einer so genannten eco-Version geben. Die mitgelieferte Software ist aber nicht mehr die der Olympus Pro Line, sondern es wird nur noch der einfache Olympus DSS Player beigelegt. Diese Software ist nicht netzwerkfähig, unterstützt keinen direkten Versand von Diktaten per E-Mail oder FTP, und erlaubt nur einen Ablageort für Diktate, diesen allerdings mit fünf Unterordnern. Der Preis für dieses Gerät in der einfachen Ausstattung beträgt 209 EUR.
Als mobiles Gerät für Spracherkennung und eventuell als Handmikrofon ist die günstige Version bestens geeignet. Wenn es aber darum geht, tatsächlich ein Diktiersystem aufzubauen, bei dem Diktate zum Schreiben weitergegeben werden sollen und flexibel verwaltet werden sollen, führt kein Weg an der Olympus Pro Line oder einem vergleichbaren Produkt vorbei.
Noch eine Neuigkeit: das lange erwartete Diktiermikrophon Olympus DR 1000 ist inzwischen erhältlich. Gegenüber dem Olympus DR 2000, das hier ja bereits ausführlich gewürdigt wurde, unterscheidet es sich in mehreren Punkten:
- statt eines Schiebeschalter gibt es einen Trackpoint sowie mehrere Funktionstasten
- die mitgelieferte Software ist der Olympus DSS Player, nicht der Olympus DSS Player Pro
- das Gerät ist schwarz und nicht weiß :-)
Nach meinem Eindruck wendet sich dieses Gerät viel stärker als das Olympus DR 2000 an Anwender von Spracherkennung. Ein Exemplar ist zu mir unterwegs, ich werde es in den nächsten Tagen ausprobieren und dann hier wieder etwas darüber veröffentlichen.
Darüberhinaus wird das Olympus DR 2000 und Olympus DR 1000 auch als Modell für Integratoren zur Verfügung stehen. Wer also überlegt, eine eigene Anwendung unter Verwendung dieses Mikrophon zu erstellen, kann sowohl das Olympus DR 2000 wie auch das Olympus DR 1000 in die engere Wahl ziehen. (Man könnte natürlich auch ein Phillips SpeechMike nehmen - das liegt vielleicht nicht ganz so gefällig in der Hand, bringt aber dafür schon von Haus aus alles mit, wofür das Olympus erst ein Software Development Kit benötigt :-)
10 Mai 2006
FAZ testet das Headset VXI Parrott TalkPro
Nachdem ich neulich hier das VXI Parrott TalkPro USB-Headset für Spracherkennung vorgestellt hatte, hat sich auch die FAZ in ihrer Ausgabe vom 9.5.2006 des Themas angenommen. Ich fasse zusammen:
Installation einfach, Tragekomfort gut, Erkennungsgenauigkeit knapp 100%, Nebengeräusche werden gut ausgeblendet, bessere Ergebnisse als mit einem Handmikrophon - alles in allem empfehlenswert.
Hervorgehoben wird das teilbare Kabel, das sich an der Regeleinheit für die Lautstärke problemlos abkoppeln lässt. Allerdings stört den Rezensenten die "vor dem Bauch baumelnde kleine Box".
Also, ich klemme mir die Box einfach ans Hemd. Welcher Dress Code herrscht eigentlich in der FAZ?
04 Mai 2006
Little Dragon is watching you!
Nichts mit Spracherkennung zu tun hat dieser kleine Spielzeugdrache, der so gefaltet wird, dass er Sie immer ansieht und dabei sogar den Kopf zu drehen scheint!
Sehen Sie sich das Video an und staunen Sie - oder laden Sie sich gleich wie ich die Bastelanleitung herunter (PDF), um Ihren Schreibtisch zu bereichern.
(Die Farbe steht übrigens im Einklang mit dem aktuellen Nuance-Corporate Design :-)
28 April 2006
Key Mute, Teil 2
Da der Download inzwischen virenfrei ist bzw. mein neuer Virenscanner unter Paranoia litt, werde ich jetzt fröhlich ans Werk schreiten und das Teil mal ausprobieren. Interesse ist durchaus nicht nur bei mir vorhanden, wie ich im Scansoft- und Knowbrainer-Forum sehe.
Übrigens dürfte es wohl sinnvoll sein, zunächst mit den Standardeinstellungen zu testen. Auf meine ersten Frgen hin erhielt ich schon folgende nützlichen Hinweise:
Zu Ihren nachfolgenden Fragen:
Microphone On/off - der Key sollte derselbe sein wie in Dragon?
"Microphone On/Off" - wie auch der HotKey für "Press-to-Talk" von KeyMute muss jeweils mit dem gleichlautenden HotKey in NaturallySpeaking übereinstimmen, damit die Steuerung funktioniert.
Global On/Off: dieser Key sollte ein anderer sein - und den muss ich mir angewöhnen, um Dragon mit KeyMute tatsächlich stummzuschalten. Stimmts?
"Global Microphone On/Off": Hier muss eine andere, dritte Funktionstaste gewählt werden, wie Sie richtig festgestellt haben. Natürlich bietet es sich an, an dieser Stelle diejenige Taste zu wählen, die Sie bereits zuvor zur Stummschaltung von Dragon verwendet hatten, damit Sie sich nicht umgewöhnen müssen.
Für den Moment empfehle ich F11 für "Press-to-Talk", F9 für "Microphone On/Off" und F10 für "Global On/Off" zu verwenden. Interferenzen mit anderen Programmen können zwar wohl nicht ausgeschlossen werden, sie lassen sich aber immerhin dadurch minimieren, dass bei den "Excepted Keys" alle Funktionstasten mit einem Häkchen versehen werden. Auf diese Tasten reagiert KeyMute dann überhaupt nicht mehr.
(Ich hoffe aber darauf, dass demnächst nicht nur die F-Tasten zr Verfügung stehen werden :-)
27 April 2006
Neues Tool zur automatischen Geräuschunterdrückung
Die offizielle Homepage des Entwicklers liegt unter http://www.fritz-eit.de/KeyMute/, ist aber bis jetzt noch frei von jedem Inhalt. Alle Informationen also bitte aus dem Forums-Post beziehen.
Aber weil ich neugierig bin, werde ich mir das Programm herunterladen und mal schauen, ob es tatsächlich hilft. Nicht, dass ich noch Probleme mit Nebengeräuschen hätte - das VXI Parrott TalkPro unterdrückt Nebengeräusche so effektiv, dass sogar mein Kollege hinter mir telefonieren kann.
5 Minuten später:
Beim Download schlägt mein Virenscanner Alarm! Und das, obwohl der Entwickler ausdrücklich im Knowbrainer-Forum gelobt wird.
24 April 2006
Neue Rezension: Dragon und Microsoft Speech Recognition
Einige interessante Ergebnisse:
- Dragon ist besser als Microsoft (Überraschung). Da Office 2003 in der deutschen Version keine Spracherkennung enthält, dürfte diese Nachricht hier auf recht geringe Aufmerksamkeit treffen.
- Es hilft bei Dragon, in den Optionen "Maximale Genauigkeit" einzustellen - die Genauigkeit ist tatsächlich spürbar höher. In MS Office führt die maximale Genauigkeit paradoxerweise zum schlechtesten Ergebnis.
- Eine Aufnahme des Diktats führt im Benchmark-Test zu bessderen Ergebnissen als ein direktes Diktat. Verzaget nicht, ihr Diktiergerät-Benutzer! möchte man ausrufen, denn meine Praxis kann das nicht unbedingt bestätigen.
- Spricht man nicht mt "Diktierintonation", sondern in normalem Sprechtempo, sinkt die Genauigkeit von Dragon rapide von 96-97% auf 90-91%. Dies ist bei MS Office nicht so ausgeprägt (Any Americans out there: Did you know you can use MS Word as a notes taker?) Jedoch ist auch hier der Verlust bei der Transkription einer Wav-Datei geringer. Der Tester führt das darauf zurück, dass Dragon in diesem Falle das Diktat auch nicht auf Befehle untersucht; hat ihm mal jemand was vom "Diktiermodus" erzählt?
- Dragon braucht wesentlich mehr Prozessorleistung als MS Office; ein Dual Core-Prozessor bringt jedoch keine Verbesserung. (Nuance ist da offiziell anderer Meinung, aber IBM trat beim Naunce Productivity Summit ja auch als Sponsor auf ;-)
Sehr interessant auch der Kommentar im Knowbrainer-Forum, in dem es u.a. um die Wichtigkeit eines guten Headsets geht. Die Herren von eMicrophone.com haben da eine sehr dezidierte Meinung - Sennheiser gibt 100%, why settle for less? (Wobei sich dann die Frage stellt: Wenn sie nichts schlechteres als Sennheiser akzeptieren, wie kann ein Mikro dann besser sein?)
Und was die Zukunft angeht: Warten wir auf Windows Vista, und ob/wie Nuance kontert. Gerüchteweise soll der Launch von DNS 9 ja erst nach der Einführung von Vista kommen (dann können wir es gleich DNS 10 nennen ;-)
13 April 2006
Google patentiert sprachgesteuerte Suche
12 April 2006
VXI Parrott TalkPro USB-Headsets
Das VXI Parrott TalkPro USB-Headset 100 war mein erstes Gerät im Test. Es ist monaural mit nur einer Hörmuschel, mit der Seriennummer 200 gibt es auch ein Stereo-Headset mit zwei Hörmuscheln. Die Lieferung erfolgte in einer robusten braunen Schachtel, es mussten ein paar Kabel zusammengestellt werden, danach wird das Headset einfach über USB angeschlossen und installiert sich unter Windows XP sofort. Der Audiotest (dessen Wert ja sowieso umstritten ist) brachte zwar nur einen Wert von 18 Punkten bei der ersten Installation, doch die Erkennungsgenauigkeit war sofort spürbar besser als die des Philips SpeechMike und des Olympus DR 2000, die ich vorher an meinem Rechner im Einsatz hatte. Natürlich ist ein Headset immer besser als ein Handmikrofon, weil der Abstand zwischen Mund und Mikrophon nicht variiert, aber dass ich durch einen simplen Wechsel der Hardware die Fehlerquote tatsächlich praktisch auf Null bringen würde, hatte ich dann doch nicht erwartet. Noch ein positiver Nebeneffekt war, dass die Erkennung wesentlich schneller vor sich ging. Hier spielt wahrscheinlich auch eine Rolle, das im Hintergrund keine Steuerungssoftware läuft. Nachdem ich außerdem in letzter Zeit immer wieder Schwierigkeiten mit Nebengeräuschen bei den Handmikrofonen hatte, die dazu führten, dass Dragon NaturallySpeaking mehr oder weniger abstürzt, war mir außerdem die hohe Resistenz gegenüber Nebengeräuschen sehr willkommen. Schließlich gibt's noch einen Schalter, mit denen sich das Headset umschalten lässt. Merkwürdigerweise ist es stumm, wenn der Schalter gedrückt ist, und aktiv, wenn er losgelassen ist - hier hätte ich eine andere Logik erwartet.
Der deutsche Vertrieb lieferte mir ein paar Tage später noch ein anderes Headsets mit einem Umschalter, mit dem sich das Gerät auch ans Telefon anschließen lässt. Das war auch gut so - nachdem ein Kunde das VXI Parrott TalkPro USB-Headset bei mir gesehen hatte, probierte er es an seinem Notebook aus, erreichte auf Anhieb 26 Punkte im Audio-Assistenten und nahm das Gerät gleich mit.
Die zweite getestete Kombination besteht aus einem VXI Parrott TalkPro SP1 Kopfhörer mit NC-Mikrophon, einer ganzen Reihe von verschiedenen Kabeln, die alle ineinander gesteckt werden müssen, einen USB-Adapter und einer Umschaltung zwischen Computer und Telefon. Die Verkabelung gestaltete sich naturgemäß etwas komplexer, war aber auch kein großes Problem, und auch dieses Headset ließ sich unter Windows XP umstandslos installieren.
Die Telefon-Kombination funktioniert wider Erwarten genauso gut wie das reine USB-Headset. Auch hier gab der Audio Assistent sofort ein sehr gutes Signal, und die Erkennungsgenauigkeit ist praktisch perfekt. Beide Headsets sind von der Konstruktion identisch, sehr bequem zu tragen, mit einem robusten Metallbügel, leicht und komfortabel.
Gewöhnungsbedürftig ist lediglich die Umschalterbox. Ein großer Schalter, der mit einem Symbol für Headset und einem Symbol für Telefonhörer versehen ist, schaltet nicht etwa zwischen Computer und Telefon hin und her, sondern zwischen Telefon-Headset und Telefonhörer. Die Umschaltung zwischen Computer und Telefon geschieht durch einen zweiten, kleinen gelben Knopf, bei dem nicht ganz genau ersichtlich ist, in welchem Zustand er das Signal wohin sendet. Die Umschalter-Box wird zwischen Headset auf der einen Seite und USB-Adapter beziehungsweise Telefon auf der anderen Seite eingeschliffen. Die Verbindung zum Telefon geschieht durch (im Lieferumfang nicht enthalte) Kabel, die beim Telefon in den Stecker für den Hörer gesteckt werden. An der anderen Buchse wird der Hörer selbst angeschlossen. Eine Fernannahme eines Telefongesprächs ist nicht vorgesehen. Der deutsche Vertrieb versucht im Moment einen amerikanischen Hersteller eine bessere Lösung durchzusetzen, hoffen wir auf Erfolg.
Da ich hier ausschließlich schnurlose Telefone zur Verfügung habe, kann ich leider nicht prüfen, wie sich die Arbeit mit der Umschaltung im täglichen Einsatz gestaltet, wenn man das Headset tatsächlich zum Telefonieren und zum Diktieren nutzen will. Auf jeden Fall sind beim Diktat mit Spracherkennung keinerlei Einschränkungen zu erwarten. Wer lieber mit einem Headset statt mit einem Hörer telefoniert, und eine Möglichkeit hat, einen entsprechenden Anschluss zu schalten, erhält mit dieser Kombination eine brauchbare Lösung.
Zum Schluss schon eine Vorschau: diesen Beitrag diktiere ich mit dem neuen GN Netcom GN 9350, ein schnurloses Headset, das ebenfalls zwischen Telefon und Hörer eingeschliffen werden kann und eine USB-Verbindung zum Computer besitzt. Den Erfahrungsbericht veröffentliche ich, wenn ich genügend Erfahrungen damit gesammelt habe. Die Erkennungsgenauigkeit beim Diktat in Firefox (wird offiziell nicht von Dragon unterstützt) ist auf jeden Fall zufrieden stellend. Stay tuned!
GN Netcom GN 9350 Schnurloses USB-Headset - erste Eindrücke
Der Vorzug des schnurlosen DECT-Headsets GN 9350 von GN Netcom liegt darin, dass es sich sowohl mit dem Computer als auch mit dem Telefon verwenden lässt. An der Ladestation befinden sich zwei Tasten, mit denen zwischen Computer und Telefon umgeschaltet werden kann. So braucht man immer nur ein Gerät zum Diktieren und telefonieren (das richtige Telefon vorausgesetzt).
Das GN 9350 installiert sich unter Windows XP problemlos nach dem Einstecken des USB-Steckers. Das Audio-Training bei Dragon NaturallySpeaking erreicht auf Anhieb einen Wert von 20 bis 21. Für ein schnurloses Headset ist das sehr gut.
Auch in der Praxis zeigt sich eine hohe Erkennungsgenauigkeit, die nur von der Emfindlichkeit gegenüber Nebengeräuschen getrübt wird. Natürlich liegt die Genauigkeit nicht ganz so hoch wie bei einem schnurgebundenen Headset, kann aber mit einem Handmikrofon durchaus konkurrieren. Dieses dürfte auch der natürliche Konkurrenz des GN 9350 sein - wer konzentriert und lange diktiert, zieht sicherlich ein Schnur gebundenes Headset mit bester Erkennungsrate vor. Wer häufig kürzere Texte zu diktieren hat oder während der Arbeit immer wieder abgelenkt wird, den Platz wechseln muss, also mobil sein will, der braucht entweder ein Handmikrofon, welches man sofort weg legen kann, oder eben ein schnurloses Headset, das einen nicht an seinem Rechner fesselt. Hier ist das GN 9350 eine echte Alternative.
Die Umschaltung zwischen Telefon und PC ist vorbildlich - es gibt je einen Schalter, der die Verbindung zum einen oder anderen Gerät herstellt, und der mit einer LED gekennzeichnet ist. Unter dem Deckel der Basisstation befinden sich außerdem zahlreiche Einstellungsmöglichkeiten. Dort kann man z. B. auch die Reichweite regeln, und damit die Strahlungsbelastung reduzieren. Überhaupt ist das Design sehr gelungen.
Da ich hier kein kompatibles Telefon benutze (wir haben eine komplett schnurlose Telefonanlage), kann ich leider nicht viel über die Arbeit mit dem Telefon berichten. Das Headset wird zwischen Telefon und Hörer eingeschlichen, es ist sowohl möglich, Telefongespräche direkt Headset entgegenzunehmen, wie auch einen Telefonhörer-Lifter einzubinden, der dann bei einem entsprechenden Telefon automatisch den Hörer in die Höhe hebt. Der Bedienungskomfort ist also ohne Zweifel sehr gut. Ob der Anschluss auch an einer komplett schnurlosen Anlage möglich ist, müsste man ausprobieren. Bei unserer speziellen Konfiguration geht es nicht (das liegt aber auf jeden Fall an uns).
Was allerdings stört, ist ein Grundrauschen im Ohrhörer, der sich auch nicht dadurch beseitigen lässt, dass man die Lautstärke herunterregelt. Erst nach einiger Zeit der Arbeit zeigt ich ein anderes Problem: das Polster am Ohr besteht offensichtlich aus Kunstleder, liegt jedenfalls nicht sehr bequem an.
Zwischenbilanz: schön designt, praktisch in der Anwendung, leider mit leichten Schwächen in der Anwendung (Tragekomfort und Erkennung).