18 Juli 2009

Zum Anfang, zum Ende, zurück

"Zum Anfang", "zum Ende" und "zurück" lauten drei weitgehend unbekannte Sprachbefehle für Dragon NaturallySpeaking. Die ersten beiden sprechen für sich, sie verkürzen das "zum Dokumentanfang" und "zum Dokumentende" um drei Silben bzw. stehen als Alternative zur Verfügung, wenn diese Befehle gerade mal nicht wollen.

"Zurück" setzt den Cursor an die letze Position zurück, z.B. nach dem Markieren und Formatieren eines Wortes. Der Befehl ist leichter auszuprobieren als zu beschreiben, also viel Spaß dabei!

(Tipps aus einem Forenbeitrag von Rüdiger Wilke)

02 Juli 2009

Plantronics und Linguatec bündeln Spracherkennung mit Bluetooth-Headset

Plantronics und Linguatec: Kooperation bei Spracherkennung mit Bluetooth-Headset.

Bluetooth-Headsets waren früher für Spracherkennung nicht wirklich geeignet, wie ich nicht müde wurde, zu betonen. Die Qualität des übertragenen Signals reicht einfach nicht aus, um eine vernünftige Erkennung zu gewährleisten, und darüber hinaus waren auch immer wieder Schwierigkeiten bei der Verbindung des Headsets mit dem PC zu verzeichnen (bei mir zumindest - soweit, das ich mich von Bluetooth als Verbindungsmedium meines PC verabschiedet habe).

Linguatec und Plantronics bieten jetzt eine Lösung an, die sowohl eine bessere Qualität der Übertragung gewährleistet wie auch (hoffentlich) mithilfe einer Ladestation eine sichere Verbindung zwischen Headset und Computer, die nicht abreißt. Alles zusammen wird im Paket als linguatec voice pro Wireless Edition für 249 € angeboten.

Ich habe übrigens vor kurzem ein neues Blue Parrott Bluetooth-Headset, ebenfalls mit größerer Bandbreite und verbesserter Qualität, zum Test erhalten, habe es aber noch nicht geschafft, das an einen Bluetooth-fähigen Rechner anzuschließen (was wirklich! an mir liegt). Sobald es mir gelingt, werde ich hier berichten.

Spracherkennung zum Spionieren (Kreative Wissenschaft)

Druckergeräusche verraten Patientenakten und Kontodaten, hat eine Forschergruppe der Universität des Saarlandes herausgefunden. Mithilfe einer Spracherkennung werden die charakteristischen Geräusche, die ein Nadeldrucker beim Ausdruck eines Wortes macht, analysiert und das Wort erkannt - mit ungefähr 70 prozentiger Genauigkeit. Dasselbe funktioniert auch bei Zahlen.

Der Nadeldrucker häufig noch in Arztpraxen und Banken im Einsatz sind, ist es hiermit theoretisch möglich, Kontonummer oder Patientendaten auszuspionieren. Wobei 70 % Erkennungsgenauigkeit bei einer Kontonummer nicht wirklich eine Sicherheitslücke sind - von 7 Stellen ist eine falsch, aber welche, und welche ist richtig? Da kann ich gleich einen Brute Force Attack starten :-)

Aber immerhin: wieder eine kreative Einsatzmöglichkeit für Spracherkennung.