27 Februar 2006

Philips-Bug behoben

In den neueren Versionen der Software des Philips SpeechMike trat ein Bug auf, der dazu führte, dass beim Start der Steuerungssoftware (Control Application) kein Schema gestartet wurde. D.h. hatte man z.B. die Tasten so programmiert, dass sie Dragon NaturallySpeaking steuerten, musste man dies immer erst manuell einstellen, sonst führte ein Tastendruck ins Nichts.

In der neuen Version der Software ist dieser Fehler behoben. Das SpeechMike startet jetzt mit der Tastenkonfiguration, die als letzte gespeichert wurde.

Die Software gibt es hier zum Download (wählen Sie Ihre Version unter "Diktieren am Arbeitsplatz"). Eine Liesmich-Datei mit weiteren Informationen steht dabei.

24 Februar 2006

Neues vom Drachen

Der diesährige Nuance Productivity Summit fand am 22.und 23.2. in Köln statt. Abgesehen von einigen Irritationen, die damit verbunden waren, dass in Köln Weiberfastnacht gefeiert wurde, wartete die versammelte Händlerschar natürlich v.a. auf Neues vom Drachen, insbesondere auf die Ankündigung der Version 9 - und wurde vertröstet. Für einen konkreten Erscheinungstermin, hieß es, ist es noch zu früh.
Das neue Nuance-Team
Martin Held, der in Deutschland für die technische Entwicklung zuständig ist, stellte immerhin die Pläne für die kommende und weitere Versionen vor.

So soll es möglich werden, das selbe Sprachprofil für eine Online- und Offline (serverbasierte) Spracherkennung zu nutzen, und der Zugriff auf Roaming Users soll auch über http im Intranet (oder gar Internet? Wer's braucht) möglich sein. Im medizinischen Bereich interessant ist die Unterstützung von Citrix auf Thin Clients und das bessere Diktat in Nicht-Standardfenster, wie sie bei Klinikinformationssystemen verwendet werden.

Im Bereich der Mobilität wird auch das mp3-Format unterstützt werden (DSS dagegen ist nicht geplant); auf die neuen Headsets von Plantronics, Sennheiser und GN Netcom, die im Begleitprogramm gezeigt wurden, antwortet man mit Bluetooth- und Wireless-Unterstützung. Schließlich sollen auch mobile Endgeräte besser verwendet werden können.

Zur besseren Anwendung versucht man, auf das Benutzertraining zu verzichten, Select-and-Say besser anzuzeigen (das heißt, dass klarer werden soll, was sich direkt per Stimme ansteuern lässt); schließlich werden die Lernprogramme dahin überarbeitet, dass sie stärker auf konkrete Aufgaben zugeschnitten sind.

An Steigerung der Erkennungsrate erhofft man sich weitere 15-20%.

Dies klingt schon nicht schlecht; allerdings machte Martin Held auch sehr deutlich, wie viel es noch zu tun gibt. Anhand einer Aufnahme einer Ärztin - O-Ton! - und der strukturierten Abschrift zeigte er den Unterschied zwischen dem Gesagten und Gemeinten. Ob es dem Drachen eines Tages möglich sein wird, nicht das Gesagte, sondern das Gemeinte zu schreiben?

Der Autor dieser Zeilen mit Dragon-Distributoren

Schließlich wurde hier und in anderen Vorträgen auch angesprochen, welches Ziel sich Nuance gesetzt hat: Spracherkennung und sprachgesteuerte Bedienung in so vielen Bereichen des Lebens wie möglich einzusetzen, seien es Handys, Diktiersysteme, Autos, Computerspiele oder Call Center. Mit dem Diktat, wie es im Moment läuft, hat dies dann nicht mehr viel zu tun.

20 Februar 2006

Dictanet Mobile jetzt kostenlos!

Unter http://www.dictanet-mobile.de/DNMobile/pcversion.aspx steht DictaNet Mobile, die Software, mit der man ein Smartphone und einen PDA als Diktiergerät einsetzen kann, zum Download. Ab sofort ist die Software nicht mehr kostenpflichtig, allerdings ist auch die Downloadmöglichkeit unter www.dictanet.de verschwunden. Unter dem oben angegebenen Link erhält man alle Versionen für Motorola MPx200, Nokia 6600/6260/6630/6680/N70/N90/9300/9500, QTek 8080 und T-Mobile MDA III. Letztere läuft auch auf MDA / XDA II und anderen baugleichen Geräten anderer Hersteller.

Ich habe in der letzten Zeit gern den Scansoft Voice Recorder auf dem Pocket PC als Recorder eingesetzt, die Bedienung mit dem Stift ist aber eine Katastrophe. Daher gebe ich Dictanet noch eine Chance (nicht weil es kostenlos ist, als Vertragshändler hat man sowieso eine Version zum Eigengebrauch). Bei der Wertschätzung, die der 4-Wege-Schalter dort genießt, sollte die Bedienung über Funktionstasten kein Problem sein.



Die Version für den XDA / MDA hat nur Beta-Status und verlangt einen Schlüssel (so viel zum Thema "Kostenlos"). Die Bedienung erfolgt tatsächlich über die Navigationstaste, wenn auch nicht alles auf Tastendruck anspricht. Bei der Aufnahme wird eine WAV-Datei erzeugt und auf der Speicherkarte abgelegt - dies lässt sich aktuell nicht ändern. Die vorhandenen Funktionen erklären sich selbst (s. Bild); mit "Send" kann das Diktat per MMS an eine E-Mail-Adresse verschickt werden, die sich aus dem Adressbuch auswählen lässt.

Außerdem lassen sich die Dateien in den Dictanet-Workflow übernehmen, d.h. bei der Synchronisierung werden sie atomatisch mit allen anderen Dateien in die Diktatverwaltung übernommen.

Der Pferdefuss, weshalb der Scansoft Voice Recorder noch einige Zeit lang herhalten muss, ist das Audio-Format: Die Datei wird mit 8 KHz Abtastrate aufgenommen und ist daher nicht spracherkennungskompatibel. Also geht die Suche weiter: Wo gibt es eine Aufnahmesoftware für Pocket PC, die:

  1. spracherkennungstaugliche Qualität liefert (11.025 KHz, 16 bit mono)

  2. über die Navigationstaste zu bedienen ist

  3. bei der Synchronisierung die DAteien in einem möglichst frei wählbaren Ordner ablegt?

16 Februar 2006

Begriffsklärungen

"Texterkennung" und "Spracherkennung" geht bei vielen Leuten durcheinander. Häufig rufen mich prospektive Kunden an, die eine Texterkennung suchen. Spätestens wenn ich nach dem Scanner frage, kommt dann die leicht verdutzte Antwort "Ich dachte, man braucht ein Mikrofon?"

Dabei ist doch alles ganz einfach: Spracherkennung setzt gesprochene Sprache in Computertext um, Textverarbeitung (OCR) setzt gedrucktes Papier in Computertext um.

Noch einfacher:

- Spracherkennung: Laut zu Schrift
- Texterkennung: Bild zu Schrift

wobei die Schrift hinterher so verarbeitet werden kann, als hätte man sie in einen Computer auf herkömmliche Weise eingetippt (auch das erstaunt Kunden immer wieder).

Ein anderes Problem, leicht OT (off topic - und schon ziehe ich mir den Hass derer zu, um die es im folgenden geht):

"Blog" und "Weblog" sind Wörter, die aus dem Englischen ins Deutsche gedrungen sind. Gibt es ein deutsches Wort, das die Bedeutung adäquat wiedergibt? Die Stiftung Deutsche Sprache schlägt drei Wörter des Monats vor, für die eine deutsche, aussagekräftige und möglichst einfache Entsprechung gefunden werden soll. "Blog" war noch nicht dran, kommt aber vielleicht noch. Ich nehme hier also vorweg:

Wer eine Idee hat, die zutreffender und kürzer als "Internet-Tagebuch" ist, darf sie in den Kommentaren vorschlagen. Der beste Vorschlag, der bis zum 15.3.2006 eingetroffen ist, gewinnt eine Texterkennungssoftware (ReadIris Pro 9.0 für Windows). Eine Spracherkennung haben Sie doch alle schon?

14 Februar 2006

Das neue Olympus-Diktiermikrofon: Erste Eindrücke

Am vergangenen Donnerstag stellte Olympus erstmals die beiden neuen Diktiermikrofone DR-2000 und DR-1000 dem Fachhandel vor. Ich war dabei und fand beide Geräte auf den ersten Blick recht überzeugend. Das Design ist einfach gehalten, die Verarbeitung ist gut, die Funktionen zielen v.a. auf das Phonodiktat, sind aber auch mit Spracherkennung einsetzbar. Die Abhängigkeit vom derzeitigen Platzhirschen, dem Philips SpeechMike, sind natürlich unübersehbar - im Design orientiert sich das DR-2000 wesentlich stärker am SpeechMike als das Grundig Digta ProMic, dem letzten - und nicht sehr erfolgreichen - Herausforderer von Philips.
Aber im Einzelnen:

Die beiden vorgestellte Mikrophone unterscheiden sich sowohl in der Funktionalität als auch im Design und im Preis. Das DR-2000, das noch Ende Februar in den Handel kommen soll, besitzt einen sehr gut verarbeiteten Schiebeschalter, wie er vielen Diktanten bereits vom Diktiergerät DS 4000 bekannt ist. Mit diesen Schiebeschalter können die üblichen Funktionen eines Diktiergerät, beziehungsweise in diesem Falle eines sich Diktiergerät, aufgeführt werden: Aufnahme, Stopp, abspielen und kurzes zurückspulen. außerdem hat das Gerät noch eine Taste zum Start eines neuen Diktats, eine Taste zum Vorspulen, eine Taste zum Zurückspulen sowie drei frei programmierbare Tasten, davon eine auf der Rückseite. Das DR-2000 wird mit der DSS Player Pro-Software ausgeliefert und gehört zur Olympus Pro Line. Der empfohlene Verkaufspreis liegt bei 299 EUR netto.

Das DR-1000 besitzt demgegenüber insgesamt neun Tasten, das von einer auf der Rückseite, und einen Trackball, mit dem die Maus gesteuert werden kann. Die Tastenbelegung entspricht ebenfalls den von einem Diktiergerät gewohnten Funktionen: neues Diktat, abspielen, Stopp, zurückspulen, vorspulen. Rechts und links vom Trackball befinden sich zwei Maustasten, eine frei programmierbare Tasten auf der Vorderseite und eine frei programmierbare Tasten auf der Rückseite ergänzen das Gerät. Das DR 1000 wird mit der DSS Player-Software ausgeliefert und gehört zur Olympus Consumer Line. Mit der Auslieferung ist im März oder April zu rechnen. Der empfohlene Verkaufspreis liegt bei 299 brutto.

Beiden Geräten gemeinsam ist ein hochwertiges Mikrophon, das einen Frequenzgang bis zu 15.000 Hz abbilden sollen (doppelt soviel wie bei anderen Mikrophonen), sowie ein Lautsprecher auf der Rückseite des Geräts. Um ein Diktat abzuhören, hält man sich das Mikrophon wie einen Telefonhörer ans Ohr. Im Gegensatz zu dem Philips SpeechMike berührt man beim Abhören am Ohr dann nicht irgendwelche Funktionstasten; außerdem kann man auch Diktate abhören, ohne die Kollegen im Büro zu stören. Eine gute Idee!

Beide Geräte liegen recht gut in der Hand und sind komfortabel zu bedienen. Es soll sie auch ohne die DSS Player-Software geben, dann allerdings nur für Integratoren, z. B. in Verbindung mit einer Spracherkennung. Hier stehen aber noch keine Preise fest.

Jetzt die wirklich interessante Frage: wie schneiden das DR 1000 und DR 2000 im Vergleich zum Philips SpeechMike ab?

Diese Frage lässt sich leider noch nicht so einfach beantworten. Eine Spracherkennungsoftware war auf keinem der Testrechner installiert, so dass zur tatsächlichen Qualität in diesem Bereich noch keine Aussagen möglich sind. Was die Bedienung angeht, Scheiben auf den ersten Blick zu sein, darf die beiden Olympus-Mikrophone gegenüber dem Philips-Mikrophonen technisch eingeschränkt sind, weil die keine vollständige Programmierung der Tasten vorsehen. Mit einem kleinen Trick ist es allerdings möglich, jede Taste (aber nicht den Schiebeschalter) nach Wunsch zu belegen.

Der Trackball des DR 1000 reagiert sehr feinfühlig, erlaubt aber genaues Arbeiten. Die Maustasten rechts und links sind ergonomisch angebracht, auch wenn man zum klicken natürlich den Daumen vom Trackball nehmen muss. Auf jeden Fall ist die Lösung besser als die von Grundig, wo die Maustasten auf der Rückseite liegen, so dass man den Trackball beim Klicken immer vom Ziel wegbewegt. Durch die freie Programmieren Möglichkeit der Tasten eignet sich das DR 1000 auch sehr gut zur Steuerung des Rechners, mit und ohne Spracherkennung, sowie der Basissteuerung von Dragon NaturallySpeaking. Vorausgesetzt, dass das Mikrophon eine akzeptable Erkennungsleistung liefert, sind hier sicherlich in nächster Zeit integrative Lösungen zu erwarten.

Auch das DR 2000 lässt sich mit Spracherkennung einsetzen, über die frei programmierbaren Tasten kann das Mikrophon eingeschaltet und ausgeschaltet werden das Einsatzgebiet für dieses Mikrophon ist allerdings vor allem das Phonodiktat. Dies ergibt sich natürlich aus dem Schiebeschalter, der die Funktionen eines Diktiergeräts abbildet, sowie aus der Tatsache, dass eine Spracherkennungsoftware sich technisch bedingt nicht mit einem Schiebeschalter steuern ist. (Die Möglichkeit oder Unmöglichkeit der Steuerung habe ich während der Präsentation mit einem Scansoft-Techniker ausführlich diskutiert; möglicherweise gibt es da doch bald eine Lösung.)

Grundsätzlich ist das DR 2000 weniger flexibel sowohl als das DR 1000 als auch das entsprechende Philips SpeechMike Classic. Positiv ausgedrückt kann man natürlich auch sagen, es ist auf das Wesentliche reduziert.

Olympus möchte mit diesen Geräten seine Produktpalette im Bereich digitales Diktat abrunden, in der ja bisher noch die Möglichkeit zum stationären Diktieren fehlte, und natürlich auch dem wichtigsten Anbieter von Diktiermikrophon, Philips, Marktanteile abnehmen. Über den Preis dürfte das auf jeden Fall gelingen - die Olympus-Geräte bieten eine vergleichbare Leistung wie das Philips SpeechMike Exec Pro Dictate, aber für 150 EUR weniger. Das Philips SpeechMike ist dafür flexibler. Welches Gerät einem in der Handhabung hinterher wirklich am besten zusagt, entscheidet sich natürlich, wenn man das Gerät in der Hand hat. Olympus punktet mit einem wirklich hervorragenden Schiebeschalter, einer im ganzen sehr hochwertigen Verarbeitung und einigen Zusatzmerkmalen wie kompletter Symmetrie und akustischen Meldungen, die das Gerät für Linkshänder, Blinde und Sehbehinderte attraktiv machen sollen.

Wer die Flexibilität des SpeechMike nicht braucht, wird mit dem Olympus DR 1000 oder 2000 zu einem günstigeren Preis gut bedient sein. Ob das Preis-Leistung-Verhältnis allerdings ausreicht, um Philips nennenswerte Marktanteile abzunehmen, muss sich erst noch zeigen. Abgesehen davon bieten die Olympus-Diktiergeräte auch die Möglichkeit, sie als Diktiermikrophone zu verwenden, was die beiden Olympus-Geräte, vor allem das DR 2000, vollends in die Nische für Spezialanwendungen schiebt. Wenn die Geräte tatsächlich erhältlich sind, werde ich alle drei Mikrophone von Grundig, Philips und Olympus noch einmal in den Praxistest nehmen und hier vor allem die Spracherkennungs-Funktionen untersuchen. Die Integration in ein System ohne Spracherkennung ist ja bei allen kein Problem - hier sollte man sich an der Diktat-Verwaltungssoftware orientieren.

13 Februar 2006

Nuance kauft Dictaphone

Vor 5 Jahren haben wir es schon mal erlebt: Damals wurde die amerikanische Traditionsfirma Dictaphone vom damaligen Besitzer von Dragon Systems, Lernout & Hauspie, aufgekauft. Nach dem Crash von L&H wurde Dictaphone wieder selbständig, nur um sich jetzt von Nuance wieder übernehmen zu lassen.

Was erhofft man sich davon? Dictaphone spielt in Europa praktisch keine Rolle, ist in Amerika aber sehr groß als Anbieter von Diktier-Workflows (ohne Spracherkennung) im medizinischen Bereich sowie als Hersteller von Dikitergeräten. Hier versucht man, den Markt gemeinsam aufzurollen.

Außerdem lässt die Fusion darauf hoffen, dass über Kurz oder Lang Spracherkennung besser in Workflows integriert wird, bzw. dass Nuance ein System aus eigener Produktion anbietet. Aber das ist noch Zukunftsmusik.

Genaueres weiß man auch bei Nuance Deutschland noch nicht. Was geplant ist und welche Veränderungen die Übernahme im Bereich Spracherkennung mit sich bringt, muss auch dort erst noch kommuniziert werden (falls es schon etwas zu kommunizieren gibt).

Für deusche Nutzer interesant: Das digitale Diktiergerät von Dictaphone sieht dem Grundig Digta 4015 ähnich wie ein Ei dem Anderen - nur die Farbgebung ist anders.

08 Februar 2006

Frau Gerhardt (aus dem Strizz-Comic der F.A.Z.)



Frau Gerhardt ist die rechte Hand ihres Chefs, die unentbehrliche Chefsekretärin der Firma Leo&Co. Sie arbeitet vortrefflich, beherrscht und liebt das Diktieren direkt in den Computer mit Hilfe ihres Headsets und einer Spracherkennungssoftware.


Hurra, wir sind in der Populärkultur gelandet, und gleich in einer ihrer obersten Schubladen! Möge sie als Vorbild dienen, möge es bald viele Frau Gerhardts geben!

Man beachte übrigens das schnurlose Headset (womöglich ein Plantronics CS60 USB, derzeit im Bundle mit Dragon NaturallySpeaking Preferred und Professional erhältlich).

07 Februar 2006

Dictanet ändert mal wieder die Produktpalette

DictaNet ist vor allem in Anwaltskreisen einschlägig bekannt als Anbieter von digitalen Diktatverwaltungssystemen, mit denen sich direkt in den PC diktieren lässt, die Diktate im Netzwerk verwaltet und geschrieben und auch mit Hilfe einer eigenen OEM-Version von Dragon NaturallySpeaking umgesetzt werden können. Neben diesem sehr erfolgreichen Produkt für mittlere und große Büros versucht man sich schon seit einigen Jahren auch auf dem Markt für kleine Büros und Kanzleien, wo man versucht, den Anbietern von digitalen Diktiergeräten Konkurrenz zu machen.

Die Produktpolitik in dieser Sparte war aber immer schon, gelinde gesagt, erratisch. Im Grunde wurde das immer gleiche Produkt, eine Aufnahme- und Weitergabesoftware für eine 1-zu-1-Situation, immer wieder leicht verändert unter neuen Namen auf den Markt gebracht. Dabei änderten sich die Spezifikationen und die Lizenzierung im Schnitt alle drei Wochen (natürlich unangekündigt), was den Verkauf nicht unbedingt erlechterte.

Ende 2005 wurde die neueste Auflage dieser Software und ein extra dafür gegründeter Laden vorgestellt, zum 1.1.2006 erschien eine Preisliste. Wer aber jetzt auf Stabilität hoffte (wie ich), wurde von den neuesten Mitteilungen überrascht:

"Aufgrund des beständig erfreulich, ansteigenden Bestelleinganges für die DictaNet Shop Produkte, verfügen wir nun zunehmend über unmittelbare Erfahrungen über die Marktbedürfnisse.
In deren Auswertung haben wir die DictaNet Shop Produktpalette, die wir zwecks Testung der Marktnachfrage zunächst sehr breit aufgestellt hatten, nun erheblich verringert und auf die gut laufenden Produkte konzentriert:

Die Produkte DictaNet Kompakt, DictaNet PC-Player und DictaMail werden nicht mehr angeboten. Diese Produkte fließen ein in ein neues Diktiersoftware-Produkt: DictaNet PC-Link.
Diese Software steht ab sofort zum Download bereit. Sie ist ohne Aufpreis im Lieferumfang der DictaNet Diktathardware enthalten und wird den Produkten dann auch als CD beiliegen.
Leistungsumfang DictaNet PC-Link Software: Recorder und Player, Diktatverwaltung mit Netzwerkunterstützung und einem gemeinsamen Verzeichnis, Recorder unterstützt nur DictaNet Hardware und DictaNet Mobile, der Player ebenso und zusätzlich kann er per E-Mail oder Explorer in das Diktatverzeichnis gestellte DSS und WAV Dateien abspielen. [...]"


"Bananensoftware, reift beim Kunden" - sagt man gern über gewisse supportanfällige Produkte. Die Dictanet-Software reift anscheinend schon beim Händler.

Interessant ist aber auch, dass der "beständig erfreulich, ansteigende Bestelleingang" dazu führt, dass drei Produkte nicht mehr angeboten, sondern vielmehr zu einem zusammengefasst werden, welches dann auch noch (so verstehe ich die Mail) kostenlos abgegeben wird (das war früher, als das Produkt noch "Soundclipper" hieß, auch schon mal so). Erfolgreiche Produkte würde ich anders vermarkten und schon gar nicht verschenken -?!

Die Zeichensetzung im Zitat ist übrigens authentisch ;-)

03 Februar 2006

Nuance wird für gutes Marketing ausgezeichnet

Nuance erhält Auszeichnung von Frost & Sullivan für beste Wettbewerbsstrategie auf dem europäischen Spracherkennungsmarkt im Gesundheitswesen

Gehört eine solche Meldung in ein Blog für Anwender? Immerhin wissen wir jetzt, dass Marketing-Analysten die Marketing-Strategie von Nuance gut finden. Wow.

Als Internet-Marketer fällt mir natürlich auf, dass die Kollegen bei der Pressestelle vergessen haben, den korrekten Titel für die Pressemitteilung im Seitentitel anzugeben. Das gibt Abzüge in der B-Note!

02 Februar 2006

Dragon Wireless Edition

Das Sonderangebot von Dragon NaturallySpeaking Professional Wireless Edition inkl. kostenloses Headset Plantronics CS60 USB sollte ja ursprünglich bis zum 31.12. begrenzt sein. Jetzt wird Nuance es wohl doch bis zum Erscheinen der Version 9 verlängern - vorausgesetzt, Plantronics kann liefern.

Neues von ViaVoice

Aus einer Pressemitteilung von IBM, gefunden bei Silicon.de:

"'ViaVoice 4.4', die neue Version von IBMs Software für Spracherkennung, soll die natürlich gesprochene Sprache besser beherrschen. Wie der Hersteller mitteilt, können die Nutzer damit ihre Eingaben schneller ausführen, weil sie sich nicht mehr wie bisher an vorgefertigte Sprachbefehle und Muster halten müssen."

Die ganze Meldung bei Silicon.de

Heißt das, dass ViaVoice doch weiter entwickelt wird? Mein Tipp ist: Nicht als Desktop-Anwendung, d.h. nicht als Diktiersoftware, sondern für eingebettete Spracherkennung in Autos, Navigationssystemen, PDAs usw. IBM war da bereits aktiv, die Website ist allerdings sehr schweigsam, was aktuelle Produkte angeht. Unter Produkte: "V" wird ViaVoice gar nicht aufgeführt. Wer weiter sucht, der findet: nichts. Und die Pressemitteilung ist auch nirgendwo sonst aufgetaucht.