30 Dezember 2011

Dragon Recorder App jetzt auf Deutsch erhältlich

Die vor einigen Wochen angekündigte Dragon Recorder App für das iPhone ist seit kurzem auch auf Deutsch erhältlich und kann im AppStore heruntergeladen werden.

Die App macht es möglich, das iPhone wie ein digitales Diktiergerät zu benutzen, Diktate aufzusprechen, abzuhören, zu ergänzen und schließlich an den Rechner zu senden, wo sie von der Spracherkennung umgesetzt werden können. Inwieweit es möglich ist, auch Passagen in eine Diktat einzufügen, habe ich noch nicht herausfinden können.

Die Übertragung geschieht über WLAN oder über iTunes.

Ein Video zur Bedienung gibt es bisher nur auf Englisch. Die Erklärung ist sehr kleinschrittig gehalten und gut verständlich.

28 Dezember 2011

Apple-Fernseher mit Sprachsteuerung?

Digitimes hört das Gras wachsen: im nächsten Jahr soll ein Fernseher aus dem Hause Apple auf den Markt kommen. Ob der dann Fernsehen und Internet vermählt? Oder iTunes zur endgültig größten Videothek der Welt macht?

Spiegel Online vermutet auf jeden Fall schon Siri zur Bedienung. "Siri, heute abend will ich Dr. House sehen, aber ich komme erst um 22h nach Hause. Zeichnest du mir die Folge auf?"

Also das iPhone versteht so was... meistens. Gestern ausprobiert.

22 Dezember 2011

Nuance will Vlingo übernehmen

Wie heute bei Heise und in einer Nuance-Pressemitteilung zu lesen ist, bereitet Nuance die Übernahme des Spezialisten für mobile Spracherkennung, Vlingo, vor. Vlingo bietet einen Siri-ähnlichen sprachgestützten Assistenten für verschiedene mobile Geräte, z.B. BlackBerry, Androiden und Windows-gestützte Handys an.

Nuance-Technologie ist ja schon in Siri enthalten, wenn dies auch nicht an die große Glocke gehängt wird. Mit der angekündigten Übernahme wird Nuance versuchen, auch auf Smartphones seine marktbeherrschende Stellung zurückzuerobern bzw. auszubauen (je nachdem, aus welchem Blickwinkel man die aktuellen Technologien sieht).

Die Pressemitteilung ist da ganz eindeutig: nachdem in den letzten Monaten die Nachfrage nach Sprachsteuerung sprunghaft gestiegen ist (Hallo Siri!), sieht man einen Markt in der Größenordnung von 5 Milliarden $ für die Sprachsteuerung von Smartphones, Tablet PCs, Musik-Abspielgeräten, Navigationssystem usw. Die bewährte Strategie von Nuance ist, Anbieter von solchen Technologien aufzukaufen und die Technologie entweder in eigene Produkte einzubauen oder die Produkte gleich mit zu übernehmen.

5 Milliarden $ finde ich allerdings schon eine Hausnummer. Nuance geht offensichtlich davon aus, dass jetzt endlich die soziale Akzeptanz da ist, mobile Geräte, Computer usw. per Sprache zu steuern. Auch hier war Apple wieder Vorreiter.

Eigentlich merkwürdig, dass trotz hartnäckiger Bemühungen Spracherkennung und Sprachsteuerung am PC seit vielen Jahren ein Nischendasein fristet. Hat Nuance nicht laut genug verbreitet, welche Möglichkeiten Dragon NaturallySpeaking schon seit langem bietet, ist die Firma einfach nicht cool genug, oder liegt es am Ende doch an der Qualität des Produktes? Wir erinnern uns an die Reklamen von vor 12 Jahren, als die 1. Spracherkennungssysteme für Privatkunden auf den Markt kamen mit der Versprechungen, man könne ab sofort Tastatur und Maus verbrennen. Davon sind wir immer noch weit entfernt (und das wird auch so bleiben). Seitdem hat die Spracherkennung am Computer ein massives Imageproblem, und das völlig ohne Not: Dragon NaturallySpeaking kann den Computer komplett ohne Handy steuern, und auch die seit Windows Vista ins Betriebssystem eingebaute Spracherkennung hat in dieser Beziehung Maßstäbe gesetzt, die nur leider am Publikum völlig vorbeigegangen sind.

Und das sogar bei Anwendern, die eine Sprachsteuerung bitter nötig hätten. Vor ein paar Wochen habe ich noch mit einem Dragon NaturallySpeaking-Händler telefoniert, der Körperbehinderte ausstattet und berichtet, dass ein Großteil seiner Kunden sich weigert, den Computer per Sprachbefehl zu steuern, obwohl es viel einfacher für sie wäre…

Wenn Siri, Majel oder wer auch immer hier etwas bewirken, ist schon eine Menge erreicht.

15 Dezember 2011

Androiden und Drachen...

... im heutigen Netzwelt-Ticker von Spiegel Online.

Dass Google an einer Sprachsteuerung für Androiden-Handys arbeitet, die über das bisherige hinausgeht, ist eigentlich kein Geheimnis. Der Spiegel berichtet jetzt einige weitere Details über das "Majel" genannte Projekt, und natürlich tritt Google an, besser zu sein als Siri. Mal abwarten.

Auch Nuance arbeitet an einem vergleichbaren Produkt, Details dazu sind aber noch nicht bekannt.

Um aber endlich wieder einmal über unseren geliebten kleinen Drachen berichten zu können, kommt der Netzwelt-Ticker gerade recht: die 2. Meldung zeigt einen ebensolchen, der versucht, virtuelle Ameisen von einem Smartphone zu fressen. Klicken Sie sich durch oder schauen Sie sich einfach das Video hier an:



So viel zum Thema "Dragon auf Smartphones"!

07 Dezember 2011

Spracherkennung als Lügendetektor?

Spiegel online stellt heute eine neue Technologie vor, mit der Spracherkennung zur Identifikation von Emotion der Sprecher genutzt werden kann. Angeblich ist es aufgrund sprachlicher Muster bereits mit 70-prozentiger Wahrscheinlichkeit möglich, z.B. einer Aussage als Lüge zu entlarven – Menschen können das nur in ungefähr 57% der Fälle.

Außer als Lügendetektor lässt sich die Spracherkennung auch einsetzen, um in automatischen Benutzerdialogen festzustellen, ob ein Kunde glücklich oder genervt ist.

Soviel zum Thema Anthropomorphisierung...

FAZ über Siri

Nachdem bereits Spiegel online vor einigen Tagen einen ausführlichen Bericht über Siri, die neue Spracherkennung im iPhone, gebracht hat, jetzt auch ein ausführlicher Bericht in der FAZ (Technik und Motor, 06.12.2011). Autor ist wie immer Dr. Michael Spehr, der Spracherkennungsexperte der Frankfurter Allgemeinen Zeitung. (Artikel im Blog von Michael Spehr lesen)

Seiner Meinung nach liegt die wichtigste Neuerung von Siri in der engen Verzahnung der Spracherkennung mit dem Betriebssystem, die dafür sorgt, dass der Computer Anweisungen, die er per Sprache erhält, sofort umsetzen kann, ohne dass der Benutzer noch eingreifen muss. Das funktioniert deshalb, weil es auf dem iPhone praktisch keine Auswahlmöglichkeiten gibt, in welchem Programm der Befehl umgesetzt werden muss – ein Kalendereintrag greift immer auf denselben Kalender zu und hat nicht die Auswahl zwischen Outlook, dem Google-Kalender Kalender oder Lotus Notes; eine Websuche nutzt immer den Standard-Browser und die voreingestellte Suchmaschine Wolfram Alpha, die wiederum in der Lage ist, strukturierte Anfragen zu verarbeiten und zu beantworten. Damit ändert sich grundlegend die Interaktion des Nutzers mit dem Computer. Michael Spehr sieht solche Änderungen auch schon für Desktop-Computer voraus und prophezeit:

„Die Frage ist nicht mehr, ob und wie gut die Technik funktioniert, sondern ob man gewillt ist, in aller Öffentlichkeit oder zumindest im Büro mit seinem iPhone zu sprechen. Es geht allein um die soziale Akzeptanz. Wer die Idee für abstrus hält, denke zurück an eine Bürowelt ohne Telefone im 19. Jahrhundert.“

In der Tat scheint die soziale Akzeptanz, glaubt man zumindest den zahlreichen Kommentaren in diversen Foren, das entscheidende Kriterium zu werden. Noch immer können sich viele nicht vorstellen, unterwegs – also vor aller Augen der Öffentlichkeit – „mit ihrem Handy zu sprechen“. Obwohl sie natürlich schon seit vielen Jahren in aller Öffentlichkeit in ihr Handy sprechen und private Details vor den Ohren einer ganzen U-Bahn ausbreiten, aber das scheint etwas anderes zu sein.

Das Schlüsselwort ist tatsächlich „Anthropomorphisierung“. Schon das Diktat in einem Computer sorgt dafür, dass man ihm menschliche Eigenschaften zuschreibt (wie oft benutze ich eigentlich die Phrase „liebenswerte Eigenheiten unseres kleinen Drachen“?); Wenn die Maschine dann auch noch antwortet wie ein Mensch, verschwimmen die Unterschiede immer weiter. Neben der sozialen Akzeptanz stellt sich daher auch noch eine ethische Dimension. Wollen wir wirklich mit der Maschine umgehen wie mit einem Menschen? Dass auch hier die Kategorien bisweilen verrutschen, zeigt sich bei (fast) allen Hundebesitzern...

Aktuelle neue Fehlermeldung: Benutzerprofil kann nicht geöffnet werden

In den letzten Tagen häufen sich bei mir die Anfragen, dass ein Benutzerprofil, welches bisher vollkommen unschuldig vor sich hin gearbeitet hat, nicht mehr geöffnet werden kann.

Es scheint so, als sei dieses auf ein neues Windows-Update zurückzuführen. Dieses sorgt dafür, dass Benutzer (also unter Windows mit der Rolle „Benutzer“ angemeldete Anwender) keinen Zugriff mehr auf die Speicherorte haben, in denen Dragon NaturallySpeaking die Benutzerprofile lokal ablegt.

Abhilfe schafft hier folgendes:

Gehen Sie über den Windows Explorer in den Ordner C:\Program Data\Nuance\ und markieren Sie dort den Ordner „NaturallySpeaking11“. Machen sie einen Rechtsklick auf den Ordner und wählen Sie „Eigenschaften“ und dann „Sicherheit – Bearbeiten“. Geben Sie den Benutzern Vollzugriff auf diesen Ordner und bestätigen Sie alles mit O.K. Danach lässt sich das Benutzerprofil wieder öffnen.

Angegebene Dateipfade für Windows 7; unter Windows XP scheint das Problem nicht aufzutreten.

02 Dezember 2011

Philips Dictation hat eine neue Website

Philips kündigt die neue Website für seine Diktierprodukte an. Sie ist erreichbar unter http://www.dictation.philips.com/de/home/

Die alte Website ist offenbar schon vom Netz gegangen, jedenfalls kann ich sie nicht mehr aufrufen. (Hallo Philips: eine Umleitung wäre schön gewesen!)

Alles ist sehr viel farbenfroher geworden, aber auch übersichtlich und leicht zu navigieren. Etwas stutzen musste ich beim Produktsupport, weil dort zunächst eine komplette Übersicht aller Produkte angezeigt wird – klickt man aber auf das gewünschte Produkt, erhält man dort alles, was man braucht, in einer praktischen Übersicht.

Ein schicker Relaunch der Seite meiner bevorzugten Diktierhardware.