"Kommen Sie solide rein!" und "Betrunken ist man erst, wenn man nicht mehr liegen kann, ohne sich festzuhalten" - zwischen diesen Ratschlägen spielte sich mein Übergang ins Neue Jahr ab. Ab heute bin ich also wieder solide und berichte weiter in unregelmäßigen Abständen aus der schönen Welt der Spracherkennung und des digitalen Diktierens.
Blogger ist inzwischen auf eine neue Version umgestiegen, so dass ich vor kurzem auch das Design des Blogs geändert habe. Leider ist das neue Blogger noch im Beta-Stadium, so dass es manchmal Probleme mit dem Layout, besonders mit den Zeilenumbrüchen, gibt. Das bitte ich zu entschuldigen. (Sehen Sie, was ich meine? :-)
Was mich angeht, so dürfte sich inzwischen herumgesprochen haben, dass ich im November 2006 von abitz.com zur 4voice AG gewechselt bin. Dort mache ich technischen Vertrieb, d.h. kümmere mich darum, dass unsere
Kunden auch wirklich das System erhalten, was sie brauchen. In den ersten zwei Monaten hieß das konkret:
reisen und installieren. War nicht so geplant, hat auch dazu geführt, dass die Beiträge hier seltener geworden sind, soll aber demnächst mal wieder anders werden.
Auf jeden Fall habe ich für alle Anfragen ein offenes Ohr, auich wenn die Antwort manchmal etwas länger dauert. Ich gebe auch gern weiterhin Tipps "off the record", also ohne spezifisches Verkaufsinteresse. Allerdings muss ich auch sagen: Wenn ich nicht überzeugt wäre, dass 4voice tatsächlich eine sinnvolle Lösung für Spracherkennung in einem professionellen Umfeld mit mehreren Arbeitsplätzen, evtl. Korrekturplätzen usw., böte, wäre ich nicht gewechselt. Vielleicht schreibe ich ja demnächst mal was darüber, was wir besser machen als Nuance, bzw. wo wir dem Drachen auf die Sprünge helfen (mein Chef wirds mir danken :-).
Jetzt über den eigenen Tellerrand hinaus:
Im letzten Jahr hat im Bereich Spracherkennung v.a. Microsoft von sich reden gemacht. Die Spracherkennung in Windows Vista wird allgemein gelobt, auch wenn sie offenbar noch nie jemand wirklich im Einsatz hatte - auch ich nicht; meinen neuen Rechner habe ich ein paar Wochen vor der Vista-Einführung erhalten. Es gibt bei Microsoft jetzt eine neue
Community, in der Vista Spracherkennung
genauer beschrieben wird.
Auch Nuance hat mit
Dragon NaturallySpeaking 9 eine neue Version auf den Markt gebracht, die die ohnehin gute Spracherkennung noch einmal verbessert hat, aber nichts wirklich revolutionär neues brachte.
Dies ist aber auch nicht unbedingt zu erwarten, solange man das Haupteinsatzgebiet im Diktieren sieht. Hier ist die Technik weitgehend ausgereizt; es kann nur noch darum gehen, die Erkennung auch für den letzten Stotterer (no offence meant) noch zu optimieren.
Der Dritte im Bunde, IBM, hat sich aus dem Diktiergeschäft de facto verabschiedet. Nur Linguatec hört nicht auf,
dem Eindringling Widerstand zu leisten aus alter Freundschaft ViaVoice weiterzuvertreiben, und hat in der Version 11 die dialektalen Varianten des Deutschen besser eingearbeitet. Somit ist vielleicht nicht jeder Stotterer, aber mancher Niederbayer jetzt mit
Linguatec Voice Pro 11 besser bedient als mit dem Vorgänger.
Das Urteil der Jury lautet aber nach wie vor: Dragon ist der Platzhirsch. Uneinig ist man sich jedoch, wie die Vista-Spracherkennung wirken wird - ob MS "
den Netscape macht", ob - wie ich befürchte - eine Reihe Heimanwender Spracherkennung ausprobiert und erfolglos wieder sein lässt (und damit allen Herstellern schadet), oder ob Vista der Spracherkennung zum Durchbruch verhelfen könnte. Ich sehe eine Chance v.a. in der Sprachsteuerung, die bei Dragon bisher unterschätzt wurde. Nicht, weil sie nicht möglich ist - im Gegenteil, mit der Dragon-eigenen Skriptsprache
ließen sich auf Wunsch ganze Anwendungen schreiben. Aber viele Anwender kennen nicht einmal den Befehl "geh schlafen", oder wenigstens die Taste zum Ein- und Ausschalten des Mikros (die Plus-Taste am Nummernblock - jetzt wssen Sie es auch), sondern klicken tatsächlich brav mit der Maus auf das Symbol oben links in der Ecke.
Ach, wenn man wollte, wie man könnte! Dann würde ich allen meinen Kunden - sei es meinen alten Bekannten von
abitz.com, sei es meinen neuen Profidiktierern aus dem
4voice-Kundenstamm - Sprachbefehle beibringen, dass der Cursor nur so tanzt. Fangen wir doch einfach zum neuen Jahr mal an:
"verbinde [Wörter]"
vereinigt zwei (oder mehr) Wörter zu einem - und setzt im Zweifel sogar ein korrektes Fugen-S! Probieren Sie es aus:
"Das Neujahr Konzert der Berliner Philharmoniker"
verbinde Neujahr Konzert
"Das Neujahrskonzert der Berliner Philharmoniker"
Ein, wie der Berliner wünscht, gesundes Neues Jahr Ihnen allen, und Dank an alle Leser, Beiträger, Kommentatoren!