29 November 2006

Macht Vista-Spracerkennung den Netscape mit Nuance?

Microsoft Vista to silence IBM ViaVoice, Nuance - titelte der Inquirer schon vor einiger Zeit. Keine Ahnung mehr, ob ich den Artikel damals gebloggt habe, gelesen hab ich ihn auf jeden Fall schon mal.

Wird Spracherkennung jetzt eine Massenanwendung, einfach weil sie so vielen Nutzern kostenlos zur Verfügung steht? Und wird Microsoft damit dasselbe mit Nuance / Dragon machen, was sie im Browserkrieg mit Netscape gemacht haben? Die Antowrt hängt m.E. davon ab,

- wie gut die Spracherkennung wirklich ist, und das heißt: wie alltagstauglich für den ungeschulten Anwender;
- wenn sie es ist: wie viele Leute den Nutzen von Spracherkennung zu schätzen lernen, und ob damit eine so kritische Masse erreicht wird, dass es wirklich ein Massenphänomen wird wie damals das Internet
- und das wird ein Graswurzelphänomen sein: "Probier das mal aus, das ist klasse".
- womit wir wieder beim ersten Punkt wären: Jeder Depp muss mit Vista diktieren können, damit es ein Erfolg wird.

QED: Hat irgendwer wirklich die Spracherkennung von MS Office XP genutzt?

Übrigens: Laut Chuck Runquist, der es wissen muss, hat Nuance / Scansoft keinen Code geliefert, sondern die Entwicklung hat MS allein gemacht - wenn auch unter Berücksichtigung von L&H-Technologie.

Dass sich Vista in vielem wie Dragon benimmt und z.B. auf dieselben Befehle hört, scheint also eher eine Marketing-Entscheidung zu sein.

21 November 2006

Are you talking to me? No! I'm talking to my computer! Check out this new Voice Recognition program.

Endlich hatte ich Zeit, mir dieses Video anzusehen: Spracherkennung in Windows Vista (Englisch, natürlich).

Den Stil der Darbietung muss man mögen - Frage und Antwort dienen hier eigentlich mehr zur zweistimmigen Präsentation der Spracherkennung in Windows Vista. Aber so ist Amerika. Viel beeindruckender sind die Möglichkeiten, die gezeigt werden - und die Dragon NaturallySpeaking alle schon seit Urzeiten enthält :-)

Wirklich schön ist die Tatsache, dass man anscheinend zwei Sprachbefehle direkt hintereinander sagen kann, ohne eine Pause machen zu müssen. Das funktioniert in Dragon NaturallySpeaking nun wirklich nicht.

Auch der Rest - nicht ganz neu, aber beeindruckend. Nun gehen wir natürlich davon aus, dass ein amerikanischer Interviewer, wenn er schon in diesem Stil das Gespräch führt, nicht daran interessiert ist, Fehler zu zeigen. Aber wenn es noch halbwegs in Echtzeit aufgenommen wurde, was da präsentiert wird, so ist die Leistung wirklich sehr gut. Und wenn nicht, wenn ist die Umsetzung in den Film immer noch gelungener als die beiden Nuance, wo der Diktant Herr Meyer "Neue Zeile" sagt und die Spracherkennung einen neuen Absatz macht.

Also: nehmen Sie sich 12 Minuten Zeit und sehen Sie sich das Video an. Interessant ist es auf jeden Fall. Und im Hause Nuance, wenn man keinen Geheimvertrag mit Microsoft abgeschlossen hat (worauf allerdings manche Details schließen lassen), sollte man sich jetzt warm anziehen.

14 November 2006

Wozu man Spracherkennung wirklich braucht (Video)

Nuance hat ein paar Videos bei YouTube eingestellt, von denen Büro Meier - Hilfe endlich zeigt, wozu man Spracherkennung wirklich braucht.

Der Liebesbrief hat auch was, ihm fehlt aber ein wenig der Realitätsbezug - ich nehm das Headset vorher ab :-)

Und die Beschwerde ist vorhersagbar...

Und zum Schluss die Kapitalismuskritik: hier finden sich alle drei Videos in einem schon weniger basisdemokratischen Kontext.

01 November 2006

Aufnahme unerwünschter Wörter in das Vokabular

Die Aufnahme unerwünschter Wörter in das Vokabular kann mit einem Tool von Willi Sander namens dns.comfort.local unterbunden werden. Dieses Werkzeug listet am Ende einer Sitzung alle neu hinzugefügten Wörter auf und lässt die Aufnahme ins Vokabular bestätigen. Auch nicht schlecht; und wohl ein Spin-off von Speechpool, welches diselbe Funktion enthält (aber für die Aufnahme in den Pool, nicht nur ins individuelle Vokabular). Anfragen unter www.oa-sa.de, eine direkte Bestellmöglichkeit gibt es leider nicht.

Noch ein Hinweis auf das Forum, das Willi Sander unterhält - mit guten Tipps, und wenig Diskussion.

Patch A für Dragon 9

Willi Sander weist auf den Patch A für Dragon 9, und zwar für alle Sprachversionen, hin. Dieser Patch verhindert laut Eintrag in der Nuance Knowledge Base das Einfrieren von Dragon während langer zusammenhängender Äußerungen. Den Patch gibt es dortselbst zum Download.

Herr Sander meint, dass der Patch noch ein paar Probleme mehr behebt. Ich kam bisher auch ohne ganz gut zurecht, werde es aber nachher mal probieren.

Nachtrag:
Dragon für 4voice läßt sich damit nicht aktualisieren - ist schon drin, sagt der Installer. Die Nuance-Version hab ich gerade nicht greifbar.

Ich bin jetzt bei der 4voice AG

Persönliche Neuigkeit: ab heute bin ich bei der 4voice AG als Technical Sales Consltant (whatever that means) tätig. Geneigte Leser erreichen mich also ab sofort unter stephan.kuepper [at] 4voice.de.

Natürlich spekuliere ich gern weiter über Fragen, warum der Drache das tut, was er tut, und welches Headset jetzt das beste ist (demnächst im Test das neue BlueParrott). Mein Geld verdiene ich aber mit der Beratung zur Anschaffung größerer Systeme.

Bei der Gelegenheit sollte ich vielleicht noch ein paar Sachen nachtragen, die während des Jobwechsels vergessen wurden oder zu kurz kamen:

- Dictanet macht den Vertrieb jetzt wieder komplett über die Software AG, nachdem die Vertriebs-GmbH fast komplett zu Philips gegangen ist. Zur Strafe verkauft Dictanet jetzt keine Philips-Mikros mehr, sondern rät zu Olympus. Ich höre Philips weinen.

- In der Frankfurter Allgemeinen Sonntagszeitung war letztlich ein Test von Dragon 9, wieder von Michael Spehr. Ich habe drauf verzichtet, ihn großartig zu bloggen, es steht nämlich nichts neues drin (schade, Herr Stückmann, aber die FAZ und FAS wird eben nicht von Dragon-Profis gelesen).

(Danke an Arnd Müller)