30 März 2006

DSS Player Pro-Upgrade

Olympus stellt ein neues Upgrade für den DSS Player Pro, Versionsnummer 4.8.2, zum Download bereit. In der Unterstützung des DR-2000 wurden einige Probleme beseitigt. Außerdem wurde die Funktionalität der Tasten leicht verändert, so dass sie einem Diktiergerät ähnlich werden. Wenn der Schiebeschalter auf "Play" steht, kann man mit der REW-Taste jetzt zurückspulen und dabei alle paar Sekunden ins Diktat reinhören, um schneller eine Passage zum Übersprechen bzw. Einfügen zu finden.

Der direkte Link zum Download der Software (Deutsch): http://downloads.olympus-europa.com/consumer/VoiceRecorder/635/P4UP82GR.exe
(nur für lizenzierte Nutzer des DSS Player Pro 4!)

28 März 2006

Dragon NaturallySpeking Legal Wireless Edition!

Dragon NaturallySpeaking Professional Wireless Edition und Dragon NaturallySpeaking Preferred Wireless Edition gibt es schon seit November 2005. Damals hat Nuance mit Plantronics einen Vertrag abgeschlossen, der es erlaubt, ein schnurloses Headset entweder vollkommen kostenlos oder nur für einen relativ geringen Aufpreis mitzuliefern.

Rechtsanwälte, Notare und Juristen konnten von diesem Angebot allerdings bisher nur eingeschränkt profitieren. Die spezielle Legal Edition von Dragon NaturallySpeaking wurde nämlich nach wie vor mit einem preiswerten analogen Headset ausgeliefert.

Dies ändert sich ab sofort: das Angebot gilt jetzt auch für Dragon NaturallySpeaking Legal Edition - auch diese wird jetzt ohne Aufpreis mit einem schnurlosen Headset Plantronics CS 60 USB über ausgesuchte Fachhändler ausgeliefert! Und zwar nur, solange der Vorrat reicht - und hier ist, im Gegensatz zu der von Nuance im Oktober initiierten Aktion, der Vorrat tatsächlich auf eine geringe Anzahl begrenzt.

Und weil diese Netznotizen vom zertifizierten Fachhandel gesponsert werden ;-) gibt es auch einen Link, wo Sie die Software kaufen können:
http://www.abitz.com/spracherkennung/natspeaklegal.php3

23 März 2006

Audio Mining mit Dragon NaturallySpeaking?

Auf der CeBIT wurde mehrere Male die Frage gestellt, ob es mit der Spracherkennung Dragon NaturallySpeaking möglich ist, zum Beispiel aus Radiosendungen oder Telefongesprächen einzelne Wörter herauszufiltern, nach denen die Aufnahmen verschlagwortet werden können. Nachdem mich genügend Anfragen dazu erreicht hatten, habe ich mich einmal kundig gemacht.

Im Internet bietet Nuance unter http://www.nuance.com/AudioMining (in englischer Sprache) Informationen zum Thema an. Als mündliche Auskunft habe ich darüber hinaus erfahren, dass die Software Teil des SDK (Software Development Kit) ist, welches sich an Software-Entwickler wendet, die Spracherkennung in ihre Produkte integrieren wollen. Dieses SdK wird zum Preis von 5.000 EUR inklusive einem Jahr Entwicklersupport angeboten. Enthalten ist unter anderem ein Werkzeug zum Audio mining. Dieses Werkzeug ist auch auf Deutsch verfügbar, es erreicht bei der Auswertung von Telefongesprächen eine Erkennungsgenauigkeit von circa 50 bis 60%. Auch hier wird empfohlen, aktiv am zu Grunde liegenden Vokabular zu arbeiten, um die Erkennungsgenauigkeit zu verbessern. Je genauer das Vokabular auf die Textsorte zugeschnitten ist, die bearbeitet werden soll, desto höher ist die Erkennungsgenauigkeit. Für den genannten Zweck reichen aber die 50 bis 60% meist schon aus, da es ja nur darum geht, einzelne Wörter zu isolieren.

Immer noch interessiert? Für Entwickler stelle ich gern einen Kontakt her.

22 März 2006

Netznotizen

Regelmäßige Leser erinnern sich, dass ich vor ca. einem Monat dazu aufgerufen hatte, eine Alternative zu "Blog" vorzuschlagen. Sintflutartig stürzten die Vorschläge nicht auf mich ein, doch fand ich gleich den zweiten so charmant, dass ich ihn im Titel verwenden werde. Achtung: Dieses Blog heißt ab sofort "Digital diktieren: Netznotizen zur Spracherkennung". Und Sie, lieber Leser, waren soeben Zeuge eines performativen Sprechaktes.

Herzlichen Glückwunsch, M. Kempin - wenn Sie sich bei mir melden, erhalten Sie eine OCR-Software ReadIris Pro 9 als Belohnung! Eine Spracherkennung haben Sie doch hoffentlich schon?

21 März 2006

FAZ-Test: Olympus DirectRec vs. Philips SpeechMike

- Achtung: kostenpflichtig! -

Aus urheberrechtlichen Gründen kann ich den gesamten Beitrag hier nicht veröffentlichen, aber immerhin einige Punkte aus den heutigen FAZ-Vergleichstest des Olympus DR 2000 mit dem Philips SpeechMike Classic zusammenfassen beziehungsweise zitieren.

SpeechMike Classic

Diktiermikrophone wie die beiden getesteten Geräte wenden sich an Vieldiktierer, die meistens im Büro, der Kanzlei oder der Praxis diktieren und daher kein digitales Diktiergerät benötigen. Statt dessen können sie sofort in den PC diktieren und ihn sozusagen als digitales Aufnahmegerät nutzen. Das Philips SpeechMike ist hinlänglich bekannt und seit vielen Jahren auf dem Markt.

Olympus DR-2000

Das Olympus DR 2000 habe ich hier bereits angekündigt, die ersten Exemplare sind auf der CeBIT zu besichtigen gewesen (am Stand von Nuance, in meinen Händen :-)

Beide Geräte zielen auf dieselbe Anwendung - ein Phonodiktat in den PC in eine Diktatverwaltung. Michael Spehr, der FAZ-Rezensent, merkt richtig an, dass die Geräte für Spracherkennung nur bedingt geeignet sind. Das hat nichts mit der Qualität zu tun, sondern mit der Bedienung: der Schiebeschalter eignet sich nicht dazu, die Spracherkennung zu bedienen.

Dies liegt meiner Meinung nach an der Logik des Schiebeschalters: Dragon NaturallySpeaking wird mit einer einzigen Funktionstaste ein- und ausgeschaltet. Der Schiebeschalter hat dagegen unterschiedliche Positionen für ein und aus. Dies ist logisch nicht aufeinander abzubilden. Ich habe es selbst seit einigen Monaten immer mal wieder probiert, und es gelingt nicht. Herr Spehr mahnt beim Hersteller an, hier für Abhilfe zu sorgen; einfacher ist es natürlich, ein SpeechMike Pro mit Einzeltasten oder ein Olympus DR 1000, ebenfalls mit Einzeltasten, aber leider noch nicht auf dem Markt, zu erwerben. Diese Tasten können einzeln programmiert werden, so dass man sie zum Einschalten und Ausschalten der Spracherkennung benutzen kann. (Übrigens arbeite ich im Moment gerade mit einem Philips SpeechMike Classic, bei dem ich einfach eine der zusätzlichen Funktionstasten für die Bedienung der Spracherkennung nutze.)

Jetzt zum eigentlichen Vergleich: positiv fällt am Olympus DR 2000 vor allem die Bedienung auf - das Gerät ist schwerer als das SpeechMike, macht einen soliden Eindruck, und vor allen Dingen ist der Schiebeschalter wesentlich besser verarbeitet als bei der Konkurrenz. Das SpeechMike kann dagegen mit den zusätzlichen Funktionstasten punkten, die unter anderem die Maus überflüssig machen und die Steuerung anderer Programme mit demselben Gerät ermöglichen - ideal zum Beispiel für den Arzt, der zwischendurch Röntgenbilder ansehen möchte.

Schließlich zur Software: Die Software selbst ist bei beiden Geräten ganz zugeschnitten auf das direkte Diktat in den Rechner, alle Funktionen können mit dem Schiebeschalter bedient werden, die Diktate werden dann in eine Diktatverwaltung übernommen und an das Schreibbüro oder an die Sekretärin weitergegeben, oder aber direkt zur Spracherkennung Dragon NaturallySpeaking geschickt. In dieselbe Diktatverwaltung können auch die Diktiergeräte der jeweiligen Hersteller eingebunden werden. Kritisch wird vermerkt, dass Philips für den Betrieb der Software ein USB-Dongle verlangt, was bei Olympus nicht der Fall ist. Im übrigen ist das Philips-Gerät mit Speech Exec-Software um ungefähr 200 EUR teurer als Olympus-Gerät (550 EUR gegenüber 350 EUR).

Meine Meinung dazu? Ich arbeite im Moment am einen Rechner mit einem SpeechMike, am anderen Rechner mit einem Olympus DR 2000. Für mich interessant sind natürlich vor allem die Leistungen bei der Spracherkennung; hier kann ich keinen spürbaren Unterschied feststellen. Auch beim Audio-Test erzielen beide Geräte ein vergleichbares Ergebnis. Wie bei Diktiergeräten sind also wohl auch die Diktiermikrophone Gefühlssache: welches liegt besser in der Hand, welche Bedienung seit einem Jahr zu? Rein unter dem Gesichtspunkt der Flexibilität ist das Philips SpeechMike dem Olympus DR 2000 überlegen (und es stimmt: die Spracherkennung kann ich mit dem Olympus nicht einschalten - mein Fehler oder der von Olympus? Ich weiß es nicht). Was aber die Bequemlichkeit der Handhabung angeht, so kann man dem FAZ-Rezensenten nur zustimmen.

Wie dem auch sei - wir warten noch ab, bis das DR-1000 von Olympus auf dem Markt ist. Dann werde ich einen ausführlichen Vergleich aller Geräte, von Philips, Olympus und Grundig, durchführen und hier veröffentlichen. Stay tuned!

17 März 2006

CeBIT vorbei und nichts Neues?

Wirklich - im Bereich Spracherkennung und digitales Diktat habe ich auf der CeBIT nichts Neues gesehen. Das könnte aber daran liegen, dass ich die meiste Zeit am Stand gestanden habe und insofern eher Teil der Ausstellung war. Eine Erkenntnis habe ich aber gewonnen:

Pocket Dictate eignet sich nicht wirklich zur Arbeit auf einem XDA II. Nicht nur, dass es das falsche Format machte (das war meine eigene Dummheit), die Software und die Hardware vertragen sich nicht. Alle meine Aufzeichnungen konnte ich mehr oder weniger vergessen. Wenn ich aber die Auswahl habe, ein vorhandenes Profi-Diktiergerät zu nutzen oder mir einen neuen Pocket PC zu kaufen, ist für mich persönlich die Wahl klar.

Apropos Diktiergerät: das Olympus DS 660 gibt es nur noch bis zum 31. März in der vorhandenen Konzeption. Nachdem ich jetzt aber mit dem DS 4000 und meiner neuen Liebe, dem DS 3300, gearbeitet habe, weine ich persönlich dem Gerät nicht nach. Allein die Möglichkeit, Autorennamen und Arbeitsarten auf dem Diktiergerät eingeben zu können, ist für mich schon ein unschätzbarer Vorteil gegenüber dem DS 660, das das alles nicht kann.

Und wenn ich die nicht etwas Zeit habe, dann schreibe ich man etwas schönes darüber, was die Vorteile des DS 3300 gegenüber dem DS 4000 sind (oder umgekehrt - wie man's nimmt). Dieser Beitrag wurde übrigens komplett diktiert - mit Dragon NaturallySpeaking in Mozilla Firefox.

09 März 2006

Die CeBIT beginnt

... und der Autor dieser Zeilen ist vom 10.-12.3. am Stand von Nuance, Halle 1, D 88 anzutreffen. Wenn meine geschätzten Leser mich also in persona treffen wollen, so stehe ich gern zur Verfügung.

totaler Durchblicksstrudel

Der rote Pfeil auf dem Lageplan weist genau auf mich!

08 März 2006

DictaNet Mobile kostet jetzt wieder (und andere Alternativen für Pocket PC)

DictaNet Mobile hat in der letzten Zeit eine Menge Veränderungen erfahren müssen. Dies bezieht sich weniger auf die Ausstattung der Software als auch das Modell der Lizenzierung - die Preise sind Achterbahn gefahren, kürzlich kam die Meldung, dass die Software komplett kostenlos abgegeben werden sollte (der kostenlosen Download verlangte aber nach einer Lizenznummer), und jetzt hat man sich auf ein neues Modell geeinigt:

Für Privatanwender ist Dictanet Mobile unter dem Namen SoundClipper ab sofort kostenlos und kann unter www.dicta.net geladen werden. Für den gewerblichen Einsatz kostet es 28 EUR zuzüglich Mehrwertsteuer. Spracherkennungstauglich ist es leider immer noch nicht - obwohl das zumindest auf dem Pocket PC hardwaretechnisch kein Problem wäre. Aber o weh, die Abtastrate ist immer noch nicht danach.

Als Alternative teste ich gerade Pocket Dictate, einen Pocket PC-Recorder aus Australien, dessen Lizenzmodell ähnlich zu sein scheint - mindestens habe ich bis jetzt noch nicht bemerkt, dass ich irgendwo eine Registrierung vornehmen müsste, um es zu nutzen. Man hofft also auch hier auf die Ehrlichkeit der Kunden.

Was die Bedienung betrifft, ist dieser Recorder sehr viel komfortabler als der Recorder, der mit Dragon NaturallySpeaking geliefert wird (wenn auch nicht ganz so konsequent auf Tastenbedienung ausgerichtet wie der Dictanet Mobile-Recorder). Schade ist nur, dass die Aufnahmetaste anscheinend fest konfiguriert ist, und zwar für eine Taste, die bei meinem Gerät überhaupt nicht vorhanden ist. Dieses Problem hatten außer mir offenbar auch schon andere Anwender - vielleicht gibt es ja in der nächsten Version die Möglichkeit, diese Taste zu definieren. Dann wäre die Software schon fast perfekt - auch mit Spracherkennung arbeitet sie sehr gut zusammen.

06 März 2006

Beim diktieren erscheinen nur drei Fragezeichen

Re: Bei diktieren erscheinen nur drei Fragezeichen

Wer kennt dieses Problem? Eine Antwort, die mir auch noch nicht bekannt war, gibt ein Kollege im Dragon-Forum:

Welches Programm wird genutzt (Preferred od. Prof.?).
Ich hatte dies Problem auch bei der Preferred-Vers.. Es entstand, wenn die Zahl der hinzugefügten neuen Worte die maximal mögliche Anzahl erreicht hatte. Nach einem Upgrade auf Prof. trat es nicht mehr auf.


Das ist doch mal ein Argument fürs Upgrade :-)

Surfen im freien Dialog

Unter dem Titel Surfen im freien Dialog verbirgt sich ein sprachgesteuertes Interface, über das Informationen z.B. im Auto direkt aus dem Internet gezogen werden können. Beispiel:

Samstag, 17.30h: "Wie hoch hat Hertha heute verloren?"
Auto: "4:2".

Na gut, ganz so einfach geht es doch noch nicht: "Die Dialogform ist allerdings eingeschränkt – beliebige Fragen wird der Bordcomputer im Auto nicht beantworten können. Vielmehr spielt sich die Interaktion in einer Mischung aus "Push" und "Pull" ab: Sobald das Fahrzeug den Empfangsbereich eines DMB (Digital Multimedia Broadcasting)-Senders erreicht, lädt das Bordgerät die auf dessen SmartWeb-Server gespeicherte Information herunter und aktualisiert sie hin und wieder. Der Sprachdialog findet dann zwischen Fahrer und Bordgerät anhand von Menüpunkten und Unterpunkten statt." Aber ein Anfang ist es allemal. Auf der CeBIT kann man das System in Halle 9, Stand A44: Mensch-Technik-Interaktion sehen, übrigens auch die "Hirnschreibmaschine" aus meinem letzten Eintrag.

03 März 2006

Hirnschreibemaschine

Die nächste Generation in der Bedienung von Computern: die Hirnschreibemaschine. Warum sich mit Sprechen aufhalten, wenn man auch die Gedanken direkt aufzeichnen kann? Die Surrealisten hätte es in den 1920ern gefreut; heutige Surrealisten müssen sich aber noch in Geduld üben - nach Serienreife sieht es noch nicht aus. Aber interessant ist es auf jeden Fall!

02 März 2006

Pocket PC Addict Forum - Dragon Naturally Speaking for Pocket PC/Desktop Review

Eine ausführliche Besprechung von Dragon auf Desktop und Pocket PC gibt Brad Isaac in Pocket PC Addict Forum - Dragon Naturally Speaking for PPC/Desktop Review. Er arbeitet mit der US-amerikanischen Version, die sich in Einzelheiten von der deutschen unterscheiden mag. Bei aller Begeisterung für Dragon ist die Besprechung fair und geht auch auf einige Probleme (und ihre Lösungen) ein. Empfohlene Lektüre!