07 März 2009

CeBIT News 2: Linguatec Voice Pro

Linguatec stellt mit der bereits erwähnten VoicePro 12-Software eine Lösung vor, die die Spracherkennung von Windows Vista benutzt, dem verbesserungsfähigen Diktat unter Vista aber durch erweiterte Sprachmodelle und Korrekturmöglichkeiten aufhilft. Nach Auskunft von Linguatec wurden heirzu ca. 15.000 Sprecher aufgenommen, um das deutsche Sprachmodell der Vista-Spracherkennung zu verbessern, und auf den Servern in Redmond adäquat verarbeitet. Die Live-Demonstration sah sehr gut aus.

Da die wirklich vorbildliche Vista-Sprachsteuerung verwendet wird, ließ sich einiges Erstaunliche zaubern, z.B. Die Toten Hosen aufs Wort loslärmen lassen und per Sprachbefehl lauter stellen. Die Sprachsteuerung ist m.E. ein echter Komfortgewinn - in der Vorbereitung auf den Messetermin hatte ich mich mal wieder an meinen Vista-Rechner gesetzt und gemerkt, wie gut er sich per Sprache bedienen lässt, solange die Programme von Microsoft sind. Auch dies soll Voice Pro besser machen und auch Nicht-Microsoft-Anwendungen bedienen.

Allen Versionen bis auf die Standard liegen zusätzliche Fachwortschätze bei, die, wie aus früheren Versionen von VoicePro bekannt,zum Grundwortschatz zugeschaltet werden können. So lässt sich auch eine Kombination aus z.B. Sport und Wirtschaft erealisieren; wie sinnvoll das ist und ob sich der Sprachgebrauch eines Sportreporters nicht doch in mehr als nur der Wortwahl von dem eines Managers unterscheidet, sei dahingestellt.

Dateien vom Diktiergerät kann VoicePro 12 ebenfalls umsetzen, allerdings nicht das DSS-Format. Hier wollte man wohl Lizenzgebühren sparen und verweist auf die DSS-Konverter, die jedem Profi-Diktiergerät beiliegen. Diktate können mitsamt Originalaufnahme abgespeichert werden, so dass ein Workflow in der Theorie möglich wäre (aber noch nicht ersthaft verfolgt wird).

Korrektur und Wortschatzbearbeitung wurden gegenüber Vista verbessert, jedoch konnte ich mir diese Bestandteile nicht live ansehen. Hier bleibt noch was zu testen, wenn die endgültige Version erscheint. Ich bin gespannt, ob die Benutzerfreundlichkeit hier so gut ist wie bei der Rechnersteuerung.

Übrigens wird es auch eine Wireless-Version geben, der das Wideband-Bluetooth-Headset Jabra MN5390 beiliegen soll.

Hier noch ein Bericht auf ZEIT Online.

6 Kommentare:

Anonym hat gesagt…

Hallo,

ich benutze jetzt Voice Pro 12 Premium seit einem Tag und bin schwer enttäuscht ! Die Erkennungsraten sind wesentlich geringer im Vergleich zu DNS 10, dass ich bis gestern benutzte.
Schlimm ist vor allem, dass ein befehl wie "Neue Zeile" ständig falsch verstanden wird und man viel Nachbearbeitungszeit hat. Also wie 99 % Erkennungsrate zusammenkommen, ist mir schleiherhaft.

Stephan Küpper hat gesagt…

Hm, kann ich so nicht nachvollziehen... ich habe es seit zwei Tagen im Test und muss sagen, dass die Erkennung nach dem ersten Trainingsabschnitt schon mit Dragon vergleichbar ist. Dies lässt sich auch deswegen trefflich vergleichen, weil man beide Spracherkennenungen parallel alufen lassen kann und der Text doppelt hingeschrieben wird - das Ergenbis ist zwar sehr psychedelich, zeigt aber, dass die Erkennungsergebnisse derselben Äußerungen praktisch identisch sind.

Ausführlicher Test folgt bei Gelegenheit.

Alexander Wagner hat gesagt…

Vielen Dank für Ihre Informationen zu Ihren ersten Erfahrungen. Da ich leider bei Linguatec kein Forum oder ähnliche Hilfen gefunden habe, erlaube ich mir anzufragen, welche Hardware, also welches Mikrofon, Sie benutzen. Ich habe hier ein Bluetooth-Headset, wo die Ergebnisse doch sehr unterschiedlich sind. Meine Nachfrage beim technischen Support von Linguatec hat ergeben, dass man dort nur auf die selbst vertriebenen Sennheiser-Headsets verweist, zu anderer Hardware möchte man keine Aussage treffen. Welches Bluetooth-Headset in der Wireless-Version ist, kann ich auch nicht nachvollziehen, so dass eine Entscheidung zur richtigen Hardware schwierig fällt.
Mit einem angeschlossenen Diktiergerät von Olympus (DS-3300) geht es etwas besser, so richtig schön ist es aber auch nicht.
Insgesamt macht es ja einen ganz pfiffigen Eindruck, wobei ein Vergleich zu Voice Pro 11 gerade in Beziehung auf die Korrekturmöglichkeiten negativ ausfallen muss. Dort gab es solche Möglichkeiten wie „Macht das groß" oder "Verbinde das" und die vorgeschlagenen Korrekturalternativen beinhalteten durchaus auch mehrere Wörter und nicht nur ein einzelnes Wort. Außerdem konnte man Funktionen auch mit der Tastatur aufrufen, was bei der Korrektur auch sehr hilft.
Voice Pro 12 sollte daher eigentlich besser einen anderen Namen und eine niedrigere Versionsnummer haben, das wäre korrekt.

Stephan Küpper hat gesagt…

Hallo Herr Wagner,

Für diesen konkreten Test habe ich ein VXI Parrott TalkPro 100 verwendet. Was ein schnurloses Mikrofon angeht, kann ich zu einem Bluetooth-Standard nicht raten, sondern würde auf jeden Fall DECT empfehlen. Vielfach im Einsatz und bewährt ist das Plantronics CS 60, welches aber wohl inzwischen ausläuft. Im Internet sollte es noch zu recht günstigen Preisen erhältlich sein.

Natürlich haben sich von Version 11 zu Version 12 eine Menge Sachen verändert - immerhin liegt dem Programm ja kein via voice mehr zu Grunde, sondern die Spracherkennung aus Windows Vista, die sich von den Sprachbefehlen stärker an Dragon NaturallySpeaking anlehnt (wohl um den Umstieg leichter zu machen). Die Versionsbezeichnung ist aber nach wie vor korrekt. Die Zahl gibt ja nicht Auskunft über die Anzahl der Merkmale, sondern ist im Prinzip eine reine Ordnungszahl, und dann folgt die Zwölf auf die 11. Eine Version 8 gab es ja auch mal irgendwann um 2001 herum :-)

Viele Grüße, Stephan Küpper

Unknown hat gesagt…

Hallo Herr Wagner,

wir bieten ganz neu das drahtlose Bluetooth-Headset Plantronics Savi Go zu Voice Pro 12 an, das eine sehr gute Erkennung hat, weil es ein Breitband-Headset ist und eine sehr gute Erkennung hat. Der neue Befehl für die Großschreibung ist "Wort groß schreiben", um Wörter zu verbinden sagen Sie einfach " das hier verbinden" oder auch "das hier mit s verbinden", die Befehle stehen sowohl im mitgelieferten Druckhandbuch (236 Seiten) als auch im pdf-Handbuch, das Sie kostenlos auf www.linguatec.de runterladen können.
Viele Grüße,
Rike Bacher

ALexander Wagner hat gesagt…

Vielen Dank für den Hinweis wegen dem Headset. Inzwischen habe ich hier ein CS60 und es funktioniert doch wesentlich besser als mit dem alten Headset. Im Großen und Ganzen geht es jetzt recht gut, wobei ich eigentlich anhand der Ankündigungen wesentlich mehr erwartet hätte.
Die Korrekturen mache ich im Übrigen fast alle mit der Hand, ich habe den Eindruck, dass der Rechner davon in irgendeiner Weise auch lernt. Zumindest finde ich meine fehlerhaften Korrekturen auch öfters mal bei der Spracherkennung dann wieder.