29 Mai 2008

BlackBerry zum Diktat – Diktiersoftware für BlackBerrys von Thax

BlackBerry zum Diktat – Diktiersoftware für BlackBerrys - kündigt Golem.de an. Thax Software hat eine Ergänzung des Findentity-Diktiersystems für Anwälte vorgestellt, bei dem sich der Blackberry als Diktiergerät verwenden lässt. Die Features - Tastenbedienung, Einfügen, Überschreiben, Indexmarken usw. - klingen völlig professionell; im Unterschied zu dem Versuch von Dictanet sollen die die Aufzeichnungen auch mit Spracherkennung bearbeiten lassen. Ein wenig Gedanken machr mir der verwendete Audio-Codec .amr statt des (lizenzpflichtigen) DSS. Das sieht nach proprietärer Lösung aus... einen PC-Player gibt es aber kostenlos dazu, notfalls lässt sich auch der Real Player verwenden. Spracherkennung braucht allerdings WAV; mal schauen, wir das gelöst wird.

Die Software soll 149 € zzgl. Mwst. kosten; derzeit gibt es sie zum kostenlosen Download zur Evaluation.

Ich warte seit Jahren auf eine vernünftige Lösung für den Pocket PC; Thax verspricht da was für "in ca. 3 Monaten". Ich bin gespannt!

(Dank an Ronny Jaekel)

16 Mai 2008

Test Headsets für Spracherkennung: Logitech vs. Terratec - wer hört besser zu?

Test Headsets für Spracherkennung: Logitech vs. Terratec - wer hört besser zu?

Der Titel sagt alles. Einen Hinweis habe ich noch: Die Zahl im Audioassistenten von Dragon gibt lediglich das Verhältnis von Sprache zu Nebengeräuschen an und ist kein Indikator für die spätere Erkennungsgenauigkeit! Ich hatte mal 37 Punkte mit einem Mikrofon, das so leise war, dass es überhaupt keine Nebengeräusche, aber auch nur sehr wenig Sprache aufgezeichnet hat. Wenn übrigens am Notebook alle Mikrofone brummen, würde ich mal den USB-Anschluss checken.
Das aber nur am Rande - Danke für den aufwändig recherchierten Test an Wolf-Dieter Roth (von dem wir auch nur Gutes gewöhnt sind).

Ich bleibe trotzdem bei meinem GN 9350, alternativ VXI Parrott Talk Pro - aber ich muss ja nicht auf den Pfennig schauen, was diese Geräte angeht. Abgesehen davon lohnt sich die Ausgabe für ein gutes Mikro immer - aber noch mehr der Aufwand, vernünftig zu diktieren (ceterum censeo...)

Nuance - Sprechen Sie Dragon?

Der Welt will ich diesen Wettbewerb nicht vorenthalten: Nuance - Sprechen Sie Dragon?

Ich spreche Dragon, um mein Blog schneller zu betexten :-)

Tipps und Tricks: Eigenschaften bearbeiten

Eine wenig genutzte Funktionen im Menü "Vokabular bearbeiten" ist die Möglichkeit, Worteigenschaften zu definieren. Hier hat man beispielsweise Gelegenheit festzulegen, ob vor oder nach einem Wort eine Leerstelle kommt, groß oder klein weitergeschrieben wird und dergleichen mehr. Außerdem -- und für die tägliche Anwendung meist wichtiger -- lässt sich das Verhalten von Zahlen vor oder nach einem Wort regeln und eine alternative Form in Abhängigkeit vom Kontext eingeben.

Dragon NaturallySpeaking bietet die Möglichkeit, Worteigenschaften zu ändern. Dazu öffnet man den Vokabulareditor (in Dragon NaturallySpeaking: Wörter - Vokabular anzeigen/bearbeiten), sucht das betreffende Wort und klickt dann auf „ Eigenschaften". Im folgenden Dialog lassen sich verschiedene Eigenschaften eines Wortes definieren, zum Beispiel ob das Wort mit oder ohne vorhergehende oder nachfolgende Leerstelle geschrieben wird, oder ob in einem bestimmten Kontext eine alternative Form geschrieben werden soll.

Über diese Funktion lässt sich zum Beispiel definieren, dass vor einer Zahl das Wort "Paragraph" als § geschrieben wird. Dazu wählt man unter "alternativen Schreibweise" die korrekte Schreibweise - in diesem Fall das § - und wählt zusätzlich "Immer alternativen Schreibweise verwenden - vor einer Zahl" und unter "Abstände": mit Leerstelle.

Analog lässt sich zum Beispiel definieren, dass das Wort "zirka" vor einer Zahl immer als "ca." geschrieben wird.

Über die Funktion "Zahlen immer als Ziffern schreiben" lassen sich auch Maßeinheiten definieren: wenn ich angebe, dass eine Zahl immer als Ziffer geschrieben werden soll, wenn sie vor diesem Wort steht, kann ich auch so exotische Maßeinheiten wie „ pmol/kg Körpergewicht" so bearbeiten, dass zahlen immer als Ziffern geschrieben werden, wenn sie vor der Maßeinheit stehen (und ich nicht sowieso grundsätzlich alle Zahlen immer als Ziffern schreiben will).

Damit Dragon NaturallySpeaking in einem Ausdruck wie "drei bis 4 cm" das Wort drei korrekt als Ziffer und "bis" als "-" schreibt, lässt sich über die Funktion "Eigenschaften" das Wort "bis" mit der alternativen Form "-"versehen. Diese alternative Form soll nur dann gebraucht werden, wenn vorher eine Zahl diktiert wurde.

Natürlich sind hier verschiedene Möglichkeiten, je nach Kontext, möglich. Leider können aber verschiedene Formatierungen nicht miteinander kombiniert werden; diese wird vielleicht in späteren Versionen der Software einmal der Fall sein.

15 Mai 2008

Tipps und Tricks: Zahlenformatierung

So erreicht man in Dragon NaturallySpeaking 9.5, dass Zahlen von null bis neun immer als Ziffern geschrieben werden, unabhängig vom Kontext:

Unter "Vokabular bearbeiten" ruft man sich jedes einzelne Zahlwort auf und bearbeitet die Eigenschaften so:

- Alternative Schreibweise: hier die Ziffer eingeben
- Abstände/Groß- und Kleinschreibung: "verbindet 2 Elemente mit dieser Eigenschaft" wählen

Zahlen werden jetzt unabhängig vom Kontext immer als Ziffern geschrieben, eine Reihe von Zahlen - z.B. eine Telefonnummer - wird ebenfalls korrekt geschrieben, das heißt ohne Lehrstellen zwischen den einzelnen Ziffern.

Anm.: Nicht beseitigt wird dadurch der Fehler, dass bei einem Datum mit nachfolgendem Punkt das Datum falsch geschrieben wird, also zum Beispiel "15.05.2000 8." anstatt "15.05.2008." - hier muss man eine Pause zwischen dem Datum und dem Punkt machen, damit das Datum korrekt geschrieben wird.


Wichtig: auch die groß geschriebenen Zahlwörter müssen mit diesen Eigenschaften versehen werden, ansonsten wird am Anfang eines Absatzes eine Zahl weiterhin als Wort geschrieben.

Richtig: 5 Wochen
Falsch: Fünf Wochen

Da mit diesen Einstellungen Zahlen immer als Ziffer geschrieben werden, sollte man sich überlegen, ob man wirklich diesen Weg geht - der Duden sieht als Standard vor, dass die Zahlwörter bis 10 ausgeschrieben werden, wer sich nach diesem Standard richten will oder richten muss, sollte eine Alternative dazu wählen:

Um die Zahlen von 0-9 nur im Kontext von anderen Zahlen als Ziffern zu schreiben (z.B. bei Postleitzahlen), gehen Sie so vor wie oben beschrieben. Setzen Sie aber zusätzlich in den Eigenschaften unter "Alternative Schreibweise" noch einen Haken vor "Immer alternative Schreibweise verwenden nach einer Zahl" und wählen Sie "Abstände - ohne Leerstelle".

Nuance liefert für DNS 9.5 folgende Hinweise zum Standard-Verhalten von Zahlen, die man sich natürlich auch angewöhnen kann:

Zur Eingabe von fünf- oder mehrstelligen Zahlen im Standardmodus möchten wir Sie auf die unterschiedlichen Eingabemöglichkeiten und die daraus resultierenden Zahlendarstellungen hinweisen:

1. "Direktes" Diktat der Zahl liefert als Ausgabe die Zahl formatiert mit Tausendertrennzeichen, z.B. "dreiundsiebzigtausendfünfhundert" - "73.500"
2. Eingabe der Zahl durch Diktieren von Ziffern liefert dies als Fließtext, z.B. "sieben drei fünf null null" - "sieben drei fünf null null"
3. Eingabe der Zahl durch Diktieren von Ziffern gefolgt von "Schreib das als Zahl" liefert diese als Ziffern getrennt durch Leerschritte, z.B. "sieben drei fünf null null" "Schreib das als Zahl" - "7 3 5 0 0"
4. Eingabe der Zahl durch Diktieren des Wortes "Ziffer" gefolgt von den Ziffern liefert die Zahl ohne Formatierung, z.B. "Ziffer sieben drei fünf null null" - "73500" 5. Eingabe der Zahl durch diktieren des Wortes "Nummerierung" gefolgt von den Ziffern liefert die Zahl ohne Formatierung, z.B. "Nummerierung sieben drei fünf null null" - "73500"
Bitte beachten Sie, dass im Zahlenmodus die letzten beiden Möglichkeiten nicht zur Verfügung stehen und die zweite Möglichkeit als Ergebnis "7 3 5 0 0" liefert.
Für weitere Möglichkeiten zur Eingabe von Zahlen und Ziffern bitten wir Sie, sich auf das Kapitel "Zahlen diktieren" in der Online-Hilfe zu beziehen.


Dies als Update zu diesem Beitrag.

FAZ-Bericht über Olympus-Recorder

Im Zusammenhang mit dem FAZ-Test des Olympus-Aufsteckmikrofons hatte ich bereits darauf hingewiesen, dass Olympus auch hochwertige Recorder herstellt, die die technischen Werte eines Diktiergerätes bei weitem überschreiten. Bevor jetzt alle Diktierer anfangen, bessere Tonqualität einzufordern, sei allerdings darauf hingewiesen, dass es sich hierbei um mehr oder weniger professionelle Aufnahmegeräte zum Beispiel für Interviews, Musik und anderes handelt, die auch in den entsprechenden Branchen vermarktet werden. Während die Aufnahmequalität dieser Recorder CD-Qualität hat, fehlen wichtige Sachen, wie z.B. Zurückspulen, Überschreiben und Einfügen einzelner Passagen und dergleichen mehr, die für einen Diktanten relevant sind. Demgegenüber steht die Qualität der Aufnahme bei einem Diktiergerät nicht besonders weit oben auf der Prioritätenliste - digitale Aufnahmen sind grundsätzlich besser als Tonbänder, und mit dem neuen DSS pro-Standard bleiben für eine Sprachaufzeichnung, die geschrieben und danach weggeworfen wird, eigentlich keine Wünsche offen, was die Aufnahmequalität betrifft.

Vorgestern testete die FAZ dann das in diesem Zusammenhang auch schon von mir erwähnte Olympus LS 10, und zwar genau im Hinblick auf die Aufnahmequalität von Musik und Interviews hin. Wer möchte, kann den Artikel bei mir beziehen, E-Mail an stephan.kuepper [at] 4voice.de genügt. Aber wie gesagt - die Zielgruppe ist eine andere, wie mir am selben Tage eindrucksvoll vor Augen geführt wurde: nämlich durch eine ganzseitige Anzeige im neuen Katalog des Sound and Drumland. Dort gibt es das Gerät übrigens für 399 € zu kaufen, empfohlener Preis bei Olympus ist 449 €.

08 Mai 2008

Sprachmakros für Windows Vista

Das Blog speech @ microsoft veröffentlicht die Beta-Version von Sprachmakros für Windows Vista. Eine recht ausführliche Beschreibung findet sich in Rob Chambers' Blog, d.i. der Teamleiter Speech Recognition. Zeit, den Vista-Rechner zu aktivieren und mit der Arbeit zu beginnen - die Vista-Spracherkennung beginnt gerade nützlich zu werden. Wenn es auf Deutsch funktioniert...

07 Mai 2008

Schnurlose Spracherkennung - Übersicht

Da mich in letzter Zeit immer wieder Fragen erreichen, hier meine Tipps zum Thema Schnurlose Headsets und Eingabegeräte.

Für Spracherkennung gibt es derzeit zwei geeignete schnurlose Headsets, das Plantronics CS 60 USB und das Jabra GN9330 bzw. GN9350. Das Jabra GN 9350 hat gegenüber den anderen Geräten den Vorteil, dass es sich außerdem an das Telefon anschließen lässt und es somit erlaubt, mit dem selben Gerät zu diktieren und zu telefonieren. Preis und Qualität der Spracherkennung sind bei Plantronics und Jabra praktisch gleich; wegen der Telefon-Funktion ist das Jabra GN 9350 ca. 120 EUR teurer. Die ungefähren Preise (inkl. Mwst.):

  • Plantronics CS60 - ca. 320 EUR
  • Jabra GN9330 - ca. 320 EUR
  • Jabra GN9350 - ca. 440 EUR

Bestellen kann man sie z.B. hier (auf "Funkheadsets" klicken).

Preislich unschlagbar ist natürlich die Dragon NaturallySpeaking Wireless-Version, ein Dragon Preferred mit beigelegtem CS 60, das für ca. 300 EUR erhältlich ist. Mein Tipp für Einsteiger, aber auch das ebste Preis-Leistungs-Verhältnis für alle, die ein Wireless-Headset suchen!

Die Entscheidung für ein Modell kann ich Ihnen nicht abnehmen - letztlich ist es, wie immer, eher eine Frage des persönlichen Geschmacks als der Technik. Daher kann ich im weiteren auch nur für mich sprechen (aber dazu ist ein Blog ja da):

Ich selbst arbeite derzeit mit dem Jabra GN 9350 und bin sehr zufrieden - das Headset ist leicht und bequem, Probleme sind bisher nicht aufgetreten und auch von Kunden nicht bekannt, der Akku hält einen Arbeitstag lang durch (auch wenn ich empfehle, ihn während der Mittagspause aufzuladen), nur zu Umschalt-Funktion zum Telefon kann ich leider nichts sagen, weil ich kein geeignetes Telefon habe. Wenn man wie ich Voice over IP und privat schnurlose Handgeräte benutzt, ist es eben nicht möglich, das Headset zwischen Telefon und Hörer einzuschleifen.

Schnurlos arbeitet außer den genannten Headsets nur noch das Revolabs Solo Desktop-Ansteckmikrofon, das ebenfalls eine hervorragende Qualität der Erkennung bietet - wenn es möglichst weit oben am Hemd befestigt wird und man den Kopf beim Diktieren nicht bewegt. Abweichungen von der korrekten Haltung bestraft es leider sehr schnell.

Das Grundig Digta Cordex, ein schnurloses Handmikrofon, soll demnächst nun wirklich auf den Markt kommen; Dictanet bietet außerdem ein proprietäres Gerät an, das aber für Spracherkennung nur bedingt geeignet ist und außerdem die Dictanet-Software benötigt. Ein anscheinend baugleiches Gerät ist neulich mal in meinem Blickfeld aufgetaucht; vielleicht werden ja inzwischen bessere Komponenten verbaut. Zur Software weiß ich nichts. Weitere Lösungen aus dem Musikbereich sind bei technisch versierten Diktanten im Einsatz, dies sind aber m.W. nur vereinzelte Anwender.

Die Erkennungsgenauigkeit ist inzwischen bei den schnurlosen Headsets genauso gut wie bei den schnurgebundenen. Ein schnurloses Headset ist für mich aber immer nur im Büro einsetzbar, weil ich immer eine Basisstation an den Rechner anschließen muss. Wenn ich mit einem Notebook viel unterwegs bin, möchte ich dieses Gerät nicht mit schleppen müssen (damit dann im kritischen Moment die Batterie leer ist); hier würde ich also auf jeden Fall zu einem schnurgebundenen Headset raten.

Hier empfehle ich das VXI Parrott TalkPro-Headset, das ich an meinem Testrechner und als Back-up einsetze. Meine Erfahrungen finden Sie, wenn sie in den letzten Notizen nach "Parrott" suchen oder einfach folgenden Link anklicken: http://voiceberlin.blogspot.com/search?q=parrott. Bestellen können Sie das VXI Parrott TalkPro USB-Headset hier.

Bluetooth-Headsets sind dagegen für Spracherkennung nicht wirklich geeignet, da der Bluetooth-Standard keine ausreichende Übertragungsqualität gewährleistet. Einzige Ausnahme: das BlueParrott-Headset, und auch nur dann, wenn das Notebook Bluetooth eingebaut hat. Das Headset ist gut, aber mit dem Geräteanschluss durch Bluetooth hatte ich immer nur Ärger - übrigens unabhängig vom Gerät genauso mit Mäusen, Tastaturen und anderen Geräten.

Soweit zu den von mir getesteten Geräten. Ich freue mich über Erweiterungen meines Horizontes - wer von den Lesern hat eine Empfehlung? Nutzen Sie die Kommentar-Funktion oder mailen Sie an stephan [at] soldatkuepper.de!