27 Februar 2007

Das Ende der Mythen

Wer noch einmal mit einer hohen Tonqualität im Dragon-Audioassistenten angibt, sehe zuerst dies an - erreicht vom Kollegen Martin Müller aus der 4voice-Entwicklung!



Das Grundig Digta 415 Diktiergerät gibt es im 4voice-Shop zu kaufen :-)

Aber Obacht - ein Diktat war nach diesem Ergebnis nicht mehr ordentlich möglich.

Warum? Weil die "Tonqualität" in Wirklichkeit das Verhältnis von Geräusch (d.h. Sprache) und Nebengeräusch angibt, und weil die Aufnahmequalität so schlecht war, dass erst gar keine Nebengeräusche empfangen wurden. Dragon regelt die Aufnahmelautstärke so weit runter, dass beim Diktat nichts mehr ankommt.

Bevor Sie aber jetzt Ihre Bestellung widerrufen - der Fehler lag an einer Einstellung des Diktiergerätes. Die Voice Activation war eingeschaltet, und damit kamen diese Resultate. Nach der Deaktivierung war der Wert wieder normal (zwischen 15 und 20).

Was lernt uns das? Ein hoher Wert im Audio-Assistenten ist kein zuverlässiger Indikator für eine hohe Tonqualität vom Eingabegerät (ich hatte mal 36 mit einem Grundig ProMic, und die Erkennungsrate war auch nicht besser als sonst). Er kann im Gegenteil sogar ein Hinweis auf eine Fehlfunktion sein.

Geben wir uns also weiterin mit unseren Durchschnittswerten zufrieden und verwenden wir unsere Energie lieber, wie es im Training heißt, auf eine klare und deutliche Aussprache beim Diktieren!

26 Februar 2007

Sprachbefehle für Fortgeschrittene

Control your computer by voice - wie das gehen kann, zeigt Sean Wenzel auf seiner Website. Nicht für den Durchschnitts-Diktanten geeignet, eher für Technikbegeisterte.

23 Februar 2007

Und noch einmal: Hinzufügen von Wörtern zum Vokabular

Unerwartet viel Rückmeldung gab es auf meine Entdeckung, wie sich die Optionen von Dragon NaturallySpeaking so einstellen lassen, dass eine Korrektur dann und nur dann ins Vokabular übernommen wird, wenn sie über das Buchstabierfenster vorgenommen wird.

Kollege Patrick Staisch stellte beim Test fest, dass jede Änderung, die über das Dialogfeld "Optionen" in Dragon NaturallySpeaking gemacht wird, dafür sorgt, dass die von Hand gemachten Änderungen der Datei options.ini verloren gehen. Dies kann ich bestätigen - es reicht sogar aus, einfach nur das Dialogfeld "Optionen" aufzurufen und mit Klick auf "Okay" wieder zu schließen - man muss noch nicht einmal etwas verändern.

David Peters, dem ich den ersten Hinweis auf das Verhalten von Dragon NaturallySpeaking verdanke, auch einfach im Text von Hand vorgenommene Änderungen ins Vokabular zu übernehmen, freut sich verständlicherweise über den Hinweis und ergänzt, dass es vollkommen normal ist, dass Dragon NaturallySpeaking sämtliche Änderungen in der Datei options.ini überschreibt, sobald man im Dialogfeld "Optionen" irgendetwas verändert. Man hat also die Wahl, entweder dieses Dialogfeld zu verwenden (und dann nicht auf einige Funktionen zurückgreifen zu können) oder aber immer nur die Datei zu editieren.

Fazit: die einmal gemachten Einstellungen sollte man sorgfältig wählen und dann nicht mehr verändern. Außerdem gilt hier wie immer: bevor man eine Systemdatei editiert, sollte man ein Back-up von ihr machen.

Und für die nächste Version wünschen wir uns dann, dass man solche doch recht wichtigen Änderungen nicht nur durch editieren einer Systemdateien machen kann, sondern - wie in anderen Programmen üblich - in der Benutzeroberfläche. Und weil es eine Spracherkennung ist, vielleicht sogar per Sprachbefehl.

So, dieser Beitrag markierte ein kleines Jubiläum: Netznotiz Nummer 100! Glückwünsche werden gerne entgegengenommen.

19 Februar 2007

Neues DSS Pro-Format

NTZ Online berichtet über das neue DSSPro-Format für digitale Sprachaufzeichnungen, welches von den 3 großen Herstallern Olympus, Philips und Grundig entwickelt wurde. Eine höhere Abtastrate von 16 kHz und eine eingebaute Verschlüsselung scheinen die wesentlichen Neuheiten dieses Formats zu sein. Letzteres war ja auch mal nötig, damit man Diktate auch wirklich sicher per Mail versenden kann; ersteres ist explizit dafür bestimmt, Spracherkennung zu verbessern. Jetzt müssen sich nur noch die Hersteller herablassen, DSSPro auch zu unterstützen - was bei Nuance nach meinem Wissen noch nicht geplant ist.

Ein Player soll demnächst kostenlos bei den Herstellern erhältlich sein; im Moment habe ich aber nur die alte Software gefunden (und selbst die Pressemitteilung ist noch nicht überall online - da wirds wohl mal wieder was dauern).

Wie merkwürdig ist das denn?

Heute Morgen habe ich einen anderen Windows-Benutzer geladen, und Dragon NaturallySpeaking funktioniert ohne Schwierigkeiten. Diesen Beitrag diktiere ich. Wenn mir irgendjemand sagen kann, warum das Diktat mit dem einen Windows-Benutzer geht und mit dem anderen Windows-Benutzer nicht geht, wäre ich ihm sehr dankbar. Übrigens ist mir der Drache gerade schon wieder abgestürzt, aber ein Neustart hat das gelöst.

Und jetzt der Tipp des Tages: Befehle lassen sich auf einfache Weise trainieren. Man muss dazu gar nicht das Befehlscenter öffnen - es reicht vollkommen, wenn man im Menü "Wörter - trainieren" den Befehl eintippt, der trainiert werden soll, und dann das Training durchführt. (Natürlich kann man den Befehl nicht einfach diktieren - er würde dann ja ausgeführt werden.)

Noch ein Tipp: Trainieren Sie das Wort oder den Befehl in diesem Fenster so häufig, bis der graue Punkt, der normalerweise zu sehen ist, einmal kurz Grün aufleuchtet. Besser zweimal. Auf diese Weise habe ich sogar den ansonsten sehr störrischen Befehl "nimm zwei" in den Griff bekommen.

16 Februar 2007

Jetzt brauche ich auch mal Hilfe

Seit neuestem erkennt DNS 9 Pro zwar noch meine Sprachbefehle, aber nicht mehr mein Diktat. Ich bin im Standardmodus, also liegt es nicht an einem offensichtlichen Einstellungsfehler; weil die Befehle funktionieren, auch nicht am Headset o.ä. Neuinstallation und neuer Benutzer haben nicht geholfen. Wer weiß was? Antworten bitte an stephan [at] soldatkuepper.de!

15 Februar 2007

Video: Spracherkennung bei PC Pro

Das Video ist zwar nicht mehr ganz neu, aber immer noch aktuell: PC Pro-Redakteur Ingo Böhme führt Dragon NaturallySpeaking 9 vor. Als Einführung geeignet für alle, die "mal sehen wollen, ob es funktioniert".

Nuance bewirbt jetzt Spracherkennung als Tool für Blogger -

- und ich bin auch dabei!

Ungefragt natürlich, und ohne mich selbst eingetragen zu haben. Wer sich einträgt, bekommt ein Dragon Standard geschenkt - als ob ich das nötig hätte.

Ich gestehe: Ich diktiere nicht alles in diesem Blog. Wenn Nuacne mal den Opera Web Browser unterstützen würde, sähe das womöglich anders aus.

Nachtrag: Automatisches Hinzufügen von Wörtern beeinflussen

Noch ein Nachtrag: Anscheinend hatte ich mich im letzten Beitrag nicht deutlich genug ausgedrückt - die Änderungen in der options.ini, die ich vorschlage, haben mit DNS Comfort nichts zu tun, sondern beziehen sich nur auf DNS 9. In DNS 8 kann man allerdings mit einem ähnlichen Eintrag in der Options.ini einiges an Unheil verhindern (einfach die beiden genannten Zeilen einkopieren).

DNS Comfort geht einen Schritt weiter und bietet eine Übersicht über die hinzugefügten Wörter an. Die Schönheit daran ist, dass man entscheiden kann, was man wirklich behalten möchte, und damit einen besseren Überblick über das Vokabular hat. Ob man es braucht, ist wohl (wie so oft) eine Frage der persönlichen Vorlieben.

Eine kostenlose Testversion gibt es unter http://www.fachvokabulare.de. Dort ist auch beschrieben, was DNS Comfort sonst noch kann.

12 Februar 2007

Automatisches Hinzufügen von Wörtern beeinflussen

Bug oder Feature?

Hier und hier hatte ich schon einmal davon berichtet, dass Dragon NaturallySpeaking auch Wörter, die über die Tastatur korrigiert werden, unaufgefordert zum Vokabular hinzufügt - in Dragon NaturallySpeaking 9 kann man dieses Verhalten jetzt wenigstens abstellen. Dazu nimmt man unter "Optionen - Korrektur" den Haken vor "Wörter automatisch zum Vokabular Hinzufügen" raus.

Nachteil: auch Wörter, die ich über das Buchstabierfenster neu eingegeben habe, werden dann nicht mehr ins Vokabular übernommen. Es besteht nur noch die Möglichkeit, neue Wörter über "Vokabular bearbeiten" hinzuzufügen - nicht sehr schön.

Willy Sander hat ein Werkzeug bereitgestellt, welches zumindest die gröbsten Fehler bei der Übernahme neuer Wörter ins Vokabular beseitigt, aber das eigentliche Problem nicht löst: ich will nicht, dass Dragon NaturallySpeaking irgendetwas, was ich mit der Tastatur eingebe, versehentlich in den Wortschatz aufnimmt. Ich will aber, dass alle meine Korrekturen aufgenommen werden.

Abhilfe schafft da ein Eintrag in der Datei options.ini, zu finden unter: C:\Dokumente und Einstellungen\All Users\Anwendungsdaten\Nuance\NaturallySpeaking9\Users\[Benutzername]\current. Nimmt man wie beschrieben den Haken raus, werden zwei neue Zeilen in diese Datei geschrieben:

Automatically Add Words=0
Add Words on Correction=0

Ändert man diese Zeilen zu:

Automatically Add Words=0
Add Words on Correction=1

So werden Wörter, die über das Buchstabierfenster eingegeben werden, ins Vokabular übernommen; Wörter, die während des Diktats eingetippt werden, aber nicht. Somit haben wir endlich das Verhalten, das - zumindest mir - logisch erscheint.

08 Februar 2007

Berliner Zeitung : Bitte sprich nicht mit mir, Windows Vista!

Berliner Zeitung : Bitte sprich nicht mit mir, Windows Vista! / Wenn der PC zu brabbeln anfängt,...

Der Vista-Spracherkennungs-Bug ist jetzt auch in der Tagespresse angekommen und wurde auch gleich vom Kunden thematisiert. Meine Meinung dazu: wer mit offenem Schiebedach unter einem Tabenschlag herfährt, soll sich nicht wundern, wenn ihm was auf den Kopf fällt...

Abgesehen davon legen all diese Beiträge eine bemerkenswerte Ignoranz an den Tag, was die Arbeit mit Spracherkennung angeht. Wenn ich nicht diktiere, schalte ich mein Mikrofon ab. Dasselbe bringe ich auch all meinen Kunden bei. Und zwar nicht aus Angst von "präparierten Dateien", sondern wegen ganz normalen Nebengeräusche.
Also:

Nach dem Sprechen Mikrofon ausschalten.
Vor dem Schreiben Gehirn einschalten.

Ganz einfach, oder?

07 Februar 2007

Wumbaba!

Habe ich in diesem Blog schon auf das Buch "Der weiße Neger Wumbaba" von Axel Haake, mit wunderbaren Bildern von Michael Sowa, hingewiesen? In seiner Kolumne in der Süddeutschen Zeitung sammelte Haake über längere Zeit lustige oder skurrile Verhörer, darunter auch die titelgebenden Person ("... und aus den Wiesen steiget / der weiße Neger Wumbaba).

Bei dem Thema stößt man sehr schnell auf www.kissthisguy.com, eine Site, die Verhörer in Popsongs sammelt. Dort heißen solche Verhörer "Mondegreens" (hier steht warum). Um die deutsche Sprache nicht mit einem ihr phonetisch wie orthoepisch fremden, ohnehin ausgedachten Fremdwort zu überlasten, schlage ich als deutsches Äquivalent, hierin Haake folgend, "Wumbaba" vor - wobei im Kontext dieses Blogs explizit der "Verhörer" einer beliebigen Spracherkennungssoftware gemient sein soll.

Und hier ist auch schon mein Wumbaba des Tages:

Start bei Systemstart Firewall deaktivieren
schreibt Dragon so:
Staatsanwältin statt einer Orgie aktivieren

Tusch! Weitere Einsendungen gern an mich oder anonym als Kommentar.

Warnung aus mal wieder gegebenem Anlass: Keine Spracherkennung der Welt produziert Fehlerkennungen, die "zufällig" einen Link zu einer Porno- oder sonstwie gearteten Spamseite produzieren. Solche Beiträge werden weiterhin gnadenlos gelöscht.
 

01 Februar 2007

Gemein: Vista's Spracherkennung führt Befehle aus!

Vista Speech Command exposes remote exploit - derart investigativen Journalismus treibt man bei ZDnet. Wenn die Sprachsteuerung von Vista eingeschaltet ist, ein Benutzer den 
Lautsprecher weit genug aufdreht, gleichzeitig sein Mikro eingeschaltet hat und dann eine präparierte 
Audiodatei mit Sprachbefehlen öffnet, kann es sein, dass diese Sprachbefehle über das Mikrofon 
aufgenommen werden und dann natürlich auch ausgeführt werden. Damit könnte man z.B. - ja was für Gemeinheiten ausführen? Mir fehlt da anscheinend die kriminelle Energie, mir etwas auszudenken, nicht aber dem Kollegen von ZDnet und PCmag, de dies zu einem ernstzunehmenden Sicherheitsrisiko hochschreiben. Wobei die beiden auch nicht so genau wissen, was eine solche Datei dem Rechner sagen sollte - dazu müsste man ja auch wissen, wozu Sprachbefehle standardmäßig überhaupt in der Lage sind.

Jedenfalls fordert man, dies Feature unbedingt abzustellen, ein Kommandowort vorzuschalten (als ob man das 
nicht in besagter Audiodatei speichern könnte), und PCmag versteigt sich sogar zu der Frage, "warum Microsoft überhaupt gestattet, dass Sprachbefehle für Vista vom eigenen Computer kommen dürfen." Ja woher soll das Mikrofon denn wissen, wer da redet?

Und jetzt der Schocker: Das geht auch mit Dragon Professional. Seit Jahren. Nur hat Dragon nicht so eine schlechte gute Presse wie Microsoft. Schicken Sie mir mal eine schöne Audiodatei, ich probier dann aus. was Sie mit meinem Rechner für Gemeinheiten planen.

(über Fefe's Blog mit Dank an R. Murschall und PC Mag mit Dank an R. Jaekel)