28 Januar 2010

Neues zum Thema Diktat auf dem BlackBerry

Zum Thema Diktat auf dem BlackBerry habe ich immer mal wieder etwas geschrieben. In den letzten Tagen sind 2 neue Produkte angekündigt worden, die dem BlackBerry zum Ersatz für ein Diktiergerät machen.

1. (und dies ist nicht wirklich neu) hat die Firma Brainworks schon seit längerem eine Software ProMobile im Programm, die dem BlackBerry zum Diktiergerät macht und sich auch in die Architektur eines BlackBerry-Enterprise Servers einbindet. Eine Meldung wert ist diese Software, weil sie sich auch in die aktuellen BlackBerry-Modelle einbindet, zum Beispiel das brandneue BlackBerry® Storm2™ und das BlackBerry® Bold™ 9700.

2. hat auch Philips inzwischen eine Software zum Diktat in den BlackBerry entwickelt. Zum Schreiben der Diktate wird zusätzlich die Philips-SpeechExec Software benötigt. Die Software gibt es zum Download unter www.speechshop.net; weitere Informationen auch unter http://www.dictation.philips.com/index.php?id=1809. Auch hier ist eine Einbindung in den BlackBerry Enterprise Server möglich.

Spenden für Haiti

Aus gegebenem Anlass heute eine Nachricht zu einem ganz anderen Thema:

Das Erdbeben in Haiti hat weltweit eine große Welle der Hilfsbereitschaft ausgelöst. Eine der einfachsten Möglichkeiten, selber zu einer Spende beizutragen, findet sich auf dieser Webseite:

http://www.care2.com/click-to-donate/haiti/

Nur ein Klick am Tag trägt dazu bei, dass die Sponsoren der Seite eine Spende für die Erdbebenopfer in Haiti tun. Dies ersetzt zwar nicht die eigene Spende, ergänzt sie aber. Ich bitte um zahlreiche Unterstützung - jeden Morgen ein Klick!

Das gespendete Geld geht an die international bekannte Organisation Oxfam, die damit die Wasserversorgung wieder aufbauen wird. Hier weitere Informationen.

22 Januar 2010

Re-Speaking beim Schweizer Fernsehen

Ein Einsatz für Spracherkennung ist das sogenannte Re-Speaking, das Live-Untertiteln von Fernsehsendungen mit Hilfe von Spracherkennung. Eine trainierte Sprecherin spricht alles nach, was der Sprecher sagt, so dass die Untertitel in Echtzeit erscheinen. Das ist nicht so einfach, wie es sich anhört - dieses "Echo-Diktat" erfordert Übung und Routine.



Übrigens ist der gesamte Beitrag untertitelt, damit auch Nicht-Schweizer etwas davon haben :-)

Übrigens benutzen auch RBB und WDR ein Dragon-System zum selben Zweck, und in Österreich werden Parlamentsdebatten per Spracherkennung untertitelt.

Neues von der Spracherkennung in Microsoft Windows

Unter A Deeper Look at Speech NUI Führt der Chef der Entwicklungsabteilung für Spracherkennung bei Microsoft, Rob Chambers, die Neuigkeiten vor, die die Windows-Spracherkennung derzeit bietet: Diktat und Steuerung von Windows 7, daneben aber auch Spracherkennung auf dem neuen Exchange Server 2010 und auf mobilen Plattformen. Die Demonstration beschränkt sich allerdings auf Windows 7.

Einige Sachen wurden gegenüber Windows Vista verbessert, so zum Beispiel die Korrekturfunktion vereinfacht. In das Korrekturfenster zu tippen scheint aber immer noch nicht möglich zu sein :-)

Mehrere Male werden Studien zur Benutzerfreundlichkeit erwähnt, die gegenüber der Spracherkennung in Windows Vista einige Veränderungen gebracht haben - schön, dass hier Aufwand getrieben wird, um Sprache zu einem möglichst natürlichen Medium der Bedienung eines Computers zu machen!

Was allerdings auffällt, ist, dass selbst der Guru von Microsoft am Ende Maus und Tastatur benutzt, um einige Webseiten aufzurufen - das würde doch per Sprache genauso gut gehen, wie er vorher vorführt. Chance vertan!

15 Januar 2010

SpeechMagic 7 kommt

In einer Pressemitteilung kündigt Nuance das Erscheinen der neuesten Version 7 seiner Spracherkennungsengine SpeechMagic, die im Herbst 2008 vom ursprünglichen Entwickler Philips übernommen wurde, an. Die Spracherkennung wurde noch stärker an die Bedürfnisse des medizinischen Marktes angepasst und soll zum Beispiel über eine neue API ermöglichen, dass Schaltflächen in medizinischen Informationssystemen direkt per Sprache angesprochen werden können. Auch sonst weisen die Neuerungen vor allen Dingen darauf hin, dass die Installation und Administration in großen Einrichtungen, also in Krankenhäusern, verbessert werden soll.

Eine andere interessante Neuerung ist die Möglichkeit, die tatsächliche Leistungsfähigkeit der Spracherkennung zu messen und damit zu beziffern, welche Arbeitsweise im Einzelfall die effizienteste ist (direktes Diktat in den Rechner oder sogar direkt in die Anwendung; Umsetzung auf einem Spracherkennungsserver, Abschrift durch eine Sekretärin oder Korrektur des spracherkannten Diktates durch eine Sekretärin).

SpeechMagic ist nicht einzeln als Produkt erhältlich, sondern immer nur integriert in die jeweilige Krankenhaus-Verwaltungssoftware. Hier sind jetzt also die einzelnen Anbieter gefragt, wie die Maschine konkret angepasst wird bzw. wie die Schnittstellen aussehen. Mit den ersten Integrationen ist im Laufe des Jahres zu rechnen.

Nuance positioniert damit SpeechMagic noch stärker als medizinische Spracherkennung im Krankenhausbereich, wohingegen Dragon Medical, die medizinische Variante von Dragon NaturallySpeaking, stärker auf niedergelassene Ärzte und kleine Abteilungen in Krankenhäusern ausgerichtet werden soll. Da Dragon Medical auf Dragon NaturallySpeaking aufsetzt, ist es von seiner Architektur eher für den Einzelplatz als für eine Netzwerk-Installation geeignet (was nicht heißt, dass dies unmöglich wäre). Hier kann Dragon seine Stärke, nämlich die Anpassung an die individuelle Arbeitsweise, voll ausspielen. Auch hier sind in nächster Zeit Veränderungen zu erwarten, mit denen die Produktpolitik im Bereich Medizin ein schärferes Profil gewinnen wird.

12 Januar 2010

Nuance übernimmt Spinvox

Nuance auf Einkaufstour: diesmal wird der britische Dienst Spinvox übernommen.

Wie meine Leser wissen, ist Spinvox vor allen Dingen dadurch hervorgetreten, dass es eine Mailbox als Dienst bereitstellt, die eine Nachricht in eine SMS umwandelt und auf das Handy sendet. Angeblich sollte dies automatisch geschehen, im letzten Jahr gab es dann allerdings Berichte, denen zufolge jede Nachricht noch einmal händisch korrigiert, wenn nicht gar vollständig abgeschrieben wurde.

Insofern können beide Unternehmen nur profitieren: Nuance bekommt einen Fuß in die Tür auf dem Markt der Mobilfunk-Anbieter (man munkelt über einen bevorstehenden Vertrag mit einem großen südamerikanischen Anbieter), Spinvox bekommt eine bessere Spracherkennung. Da ich den Dienst immer noch sehr gerne nutze, bin ich auf die konkreten Auswirkungen gespannt.

In der Zwischenzeit gibt es in Deutschland einen neuen Dienst, mit dem man SMS diktieren kann. In den letzten Tagen bin ich gleich zweimal darauf hingewiesen worden: www.ssms.com ist die Adresse, unter der man sich informieren kann. Die ersten SMS sind kostenfrei, danach gibt es ein Prepaid-Modell. Erfahrungsberichte demnächst hier.

11 Januar 2010

Literatur, Musik, Spracherkennung

... sind meine Hobbys. In diesem Zusammenhang möchte ich übrigens endlich einmal den wunderbaren Roman "The Time of our Singing" von Richard Powers empfehlen, ein amerikanischer Autor, der ebenfalls intensiv mit Spracherkennung arbeitet, die in diesem Beitrag nachzulesen ist.

Während ich mein Hobby Spracherkennung zum Beruf gemacht habe (oder war's umgekehrt?), hat auch mein musikalisches Hobby endlich Früchte getragen: die 1. CD des Vintage Jazz Trio, meiner Berliner Jazzband ist soeben erschienen und kann hier bestellt werden: http://www.raumer-records.de/Shopsystem/Vintage-Jazz-Trio/Devil-to-pay.html

Da ich inzwischen Berlin verlassen habe und mein Glück in Erkrath bei Düsseldorf suche, ist die CD für mich eher eine schöne Erinnerung als ein aktives Projekt - das Vintage Jazz Trio gibt es aber weiter und ist zur CD-Release-Party am 21. Januar 2010 in Berlin in der Kleinen Weltlaterne, der traditionsreichen Künstler- und Jazzkneipe in der Nestorstraße, zu hören (20:30 Uhr,3 € Eintritt).