21 Mai 2010

MacScribe - Transkription auf dem MAC

MacSpeech Dictate bringt die Spracherkennung auf den Mac. Die verwendete Erkennung Maschine ist seit einiger Zeit Dragon NaturallySpeaking. Während damit ein direktes Diktat in hoher Qualität möglich ist, war es bisher aber nicht möglich, auf dem Mac Diktate von digitalen Diktiergerät zu transkribieren.

MacScribe füllt nun diese Lücke. Audiodateien im Format wav, aif, aiff, m4v, mp4 und m4a können von der Software gelesen und in Text umgesetzt werden. Damit ergänzt das Produkt Macspeech Dictate um eine Transkriptionslösung - das eine Programm eignet sich für direktes Diktat in den Rechner, das andere Programm zum Umsetzen vom digitalen Diktiergerät. Mit 129 € ist diese Zusatzfunktion nicht zu teuer bezahlt, Zumal sie in den Sprachen Deutsch, Englisch, Französisch und Italienisch funktioniert.

Deutsche Informationen unter http://www.application-systems.de/scribe/

20 Mai 2010

Genauigkeitsmessungen

Im Knowbrainer-Forum hat David Peters schon vor 2 Jahren einen interessanten Beitrag eingestellt, wie sich die relative Erkennungsgenauigkeit eines Benutzerprofils messen lässt. Insbesondere geht es hier um die "gefühlte Verschlechterung" eines Benutzerprofils im Laufe der Arbeit, die sich seinen Messungen zufolge nicht nachweisen lässt, sondern die offensichtlich nur auf ein subjektives Empfinden des Benutzers zurückgeht.

Zum Zwecke der Messung hat er einen Text von ungefähr einer Seite diktiert (um sicher zu gehen, das keine unbekannten Wörter darin vorkommen), diesen Text als reine Ton Datei, also als WAV-Datei aufgenommen und von Dragon NaturallySpeaking umsetzen lassen. Es zeigte sich, das die Fehlerquote bei einem neuen Profil doppelt so hoch war wie bei demselben Profil nach einiger Zeit der Arbeit, obwohl sein subjektives Gefühl ihn annehmen ließ, dass sich die Erkennungsgenauigkeit verschlechtert hatte.

Sein Fazit (das sich weitgehend mit meinem deckt): sehr viel wichtiger als alles andere ist nach wie vor das korrekte Diktieren und eine deutliche Aussprache. In dem Maße, in dem man sich an Spracherkennung gewöhnt, lässt die Aufmerksamkeit beim Diktieren nach. Im selben Maße steigt aber die Fehlerquote. Hat man einen davon unabhängigen Input (wie eine WAV-Datei), zeigt sich, das das Programm tatsächlich spürbar hinzu lernt, das Problem also wie so häufig vor dem Bildschirm zu suchen ist.

Gruß aus der guten alten Zeit

Die Überschrift sollte zwar eigentlich "Aus der guten alten Zeit" heißen, aber es zeigt sich, dass der Drache in den Jahren seiner Existenz offensichtlich ein gewisses Maß an Intelligenz erworben hat, jedenfalls seinen eigenen Kopf besitzt. Wie dem auch sei:

Dieses Video zeigt die Markteinführung von Dragon NaturallySpeaking, der 1. Spracherkennung für kontinuierlich gesprochene Sprache, im Jahre 1997. Manchmal glaubt man, das sich gar nicht so viel verändert hat.

10 Mai 2010

Spinvox gibt den kostenlosen Service in Deutschland auf

Mehrere Jahre lang habe ich mir alle Sprachnachrichten, die auf mein Handy gesendet wurden, von kostenlosen Spinvox-Dienst im Text übertragen lassen (angeblich mit Spracherkennung, anscheinend aber doch mit menschlicher Hilfe). Dieser Dienst ist jetzt offenbar im Zusammenhang mit der Übernahme von Spinvox durch Nuance eingestellt worden.

Ein ähnlicher Dienst in Deutschland ist mir nicht bekannt, so dass ich zur guten alten Mailbox zurückkehren muss. Da ich in letzter Zeit sehr viel weniger Anrufe mobil erhalte, hält sich mein persönlicher Verlust in Grenzen. Schade ist es aber doch um einen sehr ausbaufähigen Service - jedoch können wir davon ausgehen, das Nuance demnächst etwas Eigenes mit eigener Technologie auf den Markt bringen wird und lediglich an den Kontakten von Spinvox in die Industrie, nicht aber deren Technologie interessiert war.