Auf der CeBIT wurde mehrere Male die Frage gestellt, ob es mit der Spracherkennung Dragon NaturallySpeaking möglich ist, zum Beispiel aus Radiosendungen oder Telefongesprächen einzelne Wörter herauszufiltern, nach denen die Aufnahmen verschlagwortet werden können. Nachdem mich genügend Anfragen dazu erreicht hatten, habe ich mich einmal kundig gemacht.
Im Internet bietet Nuance unter http://www.nuance.com/AudioMining (in englischer Sprache) Informationen zum Thema an. Als mündliche Auskunft habe ich darüber hinaus erfahren, dass die Software Teil des SDK (Software Development Kit) ist, welches sich an Software-Entwickler wendet, die Spracherkennung in ihre Produkte integrieren wollen. Dieses SdK wird zum Preis von 5.000 EUR inklusive einem Jahr Entwicklersupport angeboten. Enthalten ist unter anderem ein Werkzeug zum Audio mining. Dieses Werkzeug ist auch auf Deutsch verfügbar, es erreicht bei der Auswertung von Telefongesprächen eine Erkennungsgenauigkeit von circa 50 bis 60%. Auch hier wird empfohlen, aktiv am zu Grunde liegenden Vokabular zu arbeiten, um die Erkennungsgenauigkeit zu verbessern. Je genauer das Vokabular auf die Textsorte zugeschnitten ist, die bearbeitet werden soll, desto höher ist die Erkennungsgenauigkeit. Für den genannten Zweck reichen aber die 50 bis 60% meist schon aus, da es ja nur darum geht, einzelne Wörter zu isolieren.
Immer noch interessiert? Für Entwickler stelle ich gern einen Kontakt her.
1 Kommentar:
Ich kann auch das ACTNow SDK von Compure (www.compure.com)weiterempfehlen. Damit kann man auch extrem schell in einem Phonetischen Index nach beliebigen Wörtern suchen und die Genauigkeit ist extrem hoch, da nur nach den gewünschten Wörtern gesucht wird.
Kommentar veröffentlichen