30 Dezember 2011

Dragon Recorder App jetzt auf Deutsch erhältlich

Die vor einigen Wochen angekündigte Dragon Recorder App für das iPhone ist seit kurzem auch auf Deutsch erhältlich und kann im AppStore heruntergeladen werden.

Die App macht es möglich, das iPhone wie ein digitales Diktiergerät zu benutzen, Diktate aufzusprechen, abzuhören, zu ergänzen und schließlich an den Rechner zu senden, wo sie von der Spracherkennung umgesetzt werden können. Inwieweit es möglich ist, auch Passagen in eine Diktat einzufügen, habe ich noch nicht herausfinden können.

Die Übertragung geschieht über WLAN oder über iTunes.

Ein Video zur Bedienung gibt es bisher nur auf Englisch. Die Erklärung ist sehr kleinschrittig gehalten und gut verständlich.

28 Dezember 2011

Apple-Fernseher mit Sprachsteuerung?

Digitimes hört das Gras wachsen: im nächsten Jahr soll ein Fernseher aus dem Hause Apple auf den Markt kommen. Ob der dann Fernsehen und Internet vermählt? Oder iTunes zur endgültig größten Videothek der Welt macht?

Spiegel Online vermutet auf jeden Fall schon Siri zur Bedienung. "Siri, heute abend will ich Dr. House sehen, aber ich komme erst um 22h nach Hause. Zeichnest du mir die Folge auf?"

Also das iPhone versteht so was... meistens. Gestern ausprobiert.

22 Dezember 2011

Nuance will Vlingo übernehmen

Wie heute bei Heise und in einer Nuance-Pressemitteilung zu lesen ist, bereitet Nuance die Übernahme des Spezialisten für mobile Spracherkennung, Vlingo, vor. Vlingo bietet einen Siri-ähnlichen sprachgestützten Assistenten für verschiedene mobile Geräte, z.B. BlackBerry, Androiden und Windows-gestützte Handys an.

Nuance-Technologie ist ja schon in Siri enthalten, wenn dies auch nicht an die große Glocke gehängt wird. Mit der angekündigten Übernahme wird Nuance versuchen, auch auf Smartphones seine marktbeherrschende Stellung zurückzuerobern bzw. auszubauen (je nachdem, aus welchem Blickwinkel man die aktuellen Technologien sieht).

Die Pressemitteilung ist da ganz eindeutig: nachdem in den letzten Monaten die Nachfrage nach Sprachsteuerung sprunghaft gestiegen ist (Hallo Siri!), sieht man einen Markt in der Größenordnung von 5 Milliarden $ für die Sprachsteuerung von Smartphones, Tablet PCs, Musik-Abspielgeräten, Navigationssystem usw. Die bewährte Strategie von Nuance ist, Anbieter von solchen Technologien aufzukaufen und die Technologie entweder in eigene Produkte einzubauen oder die Produkte gleich mit zu übernehmen.

5 Milliarden $ finde ich allerdings schon eine Hausnummer. Nuance geht offensichtlich davon aus, dass jetzt endlich die soziale Akzeptanz da ist, mobile Geräte, Computer usw. per Sprache zu steuern. Auch hier war Apple wieder Vorreiter.

Eigentlich merkwürdig, dass trotz hartnäckiger Bemühungen Spracherkennung und Sprachsteuerung am PC seit vielen Jahren ein Nischendasein fristet. Hat Nuance nicht laut genug verbreitet, welche Möglichkeiten Dragon NaturallySpeaking schon seit langem bietet, ist die Firma einfach nicht cool genug, oder liegt es am Ende doch an der Qualität des Produktes? Wir erinnern uns an die Reklamen von vor 12 Jahren, als die 1. Spracherkennungssysteme für Privatkunden auf den Markt kamen mit der Versprechungen, man könne ab sofort Tastatur und Maus verbrennen. Davon sind wir immer noch weit entfernt (und das wird auch so bleiben). Seitdem hat die Spracherkennung am Computer ein massives Imageproblem, und das völlig ohne Not: Dragon NaturallySpeaking kann den Computer komplett ohne Handy steuern, und auch die seit Windows Vista ins Betriebssystem eingebaute Spracherkennung hat in dieser Beziehung Maßstäbe gesetzt, die nur leider am Publikum völlig vorbeigegangen sind.

Und das sogar bei Anwendern, die eine Sprachsteuerung bitter nötig hätten. Vor ein paar Wochen habe ich noch mit einem Dragon NaturallySpeaking-Händler telefoniert, der Körperbehinderte ausstattet und berichtet, dass ein Großteil seiner Kunden sich weigert, den Computer per Sprachbefehl zu steuern, obwohl es viel einfacher für sie wäre…

Wenn Siri, Majel oder wer auch immer hier etwas bewirken, ist schon eine Menge erreicht.

15 Dezember 2011

Androiden und Drachen...

... im heutigen Netzwelt-Ticker von Spiegel Online.

Dass Google an einer Sprachsteuerung für Androiden-Handys arbeitet, die über das bisherige hinausgeht, ist eigentlich kein Geheimnis. Der Spiegel berichtet jetzt einige weitere Details über das "Majel" genannte Projekt, und natürlich tritt Google an, besser zu sein als Siri. Mal abwarten.

Auch Nuance arbeitet an einem vergleichbaren Produkt, Details dazu sind aber noch nicht bekannt.

Um aber endlich wieder einmal über unseren geliebten kleinen Drachen berichten zu können, kommt der Netzwelt-Ticker gerade recht: die 2. Meldung zeigt einen ebensolchen, der versucht, virtuelle Ameisen von einem Smartphone zu fressen. Klicken Sie sich durch oder schauen Sie sich einfach das Video hier an:



So viel zum Thema "Dragon auf Smartphones"!

07 Dezember 2011

Spracherkennung als Lügendetektor?

Spiegel online stellt heute eine neue Technologie vor, mit der Spracherkennung zur Identifikation von Emotion der Sprecher genutzt werden kann. Angeblich ist es aufgrund sprachlicher Muster bereits mit 70-prozentiger Wahrscheinlichkeit möglich, z.B. einer Aussage als Lüge zu entlarven – Menschen können das nur in ungefähr 57% der Fälle.

Außer als Lügendetektor lässt sich die Spracherkennung auch einsetzen, um in automatischen Benutzerdialogen festzustellen, ob ein Kunde glücklich oder genervt ist.

Soviel zum Thema Anthropomorphisierung...

FAZ über Siri

Nachdem bereits Spiegel online vor einigen Tagen einen ausführlichen Bericht über Siri, die neue Spracherkennung im iPhone, gebracht hat, jetzt auch ein ausführlicher Bericht in der FAZ (Technik und Motor, 06.12.2011). Autor ist wie immer Dr. Michael Spehr, der Spracherkennungsexperte der Frankfurter Allgemeinen Zeitung. (Artikel im Blog von Michael Spehr lesen)

Seiner Meinung nach liegt die wichtigste Neuerung von Siri in der engen Verzahnung der Spracherkennung mit dem Betriebssystem, die dafür sorgt, dass der Computer Anweisungen, die er per Sprache erhält, sofort umsetzen kann, ohne dass der Benutzer noch eingreifen muss. Das funktioniert deshalb, weil es auf dem iPhone praktisch keine Auswahlmöglichkeiten gibt, in welchem Programm der Befehl umgesetzt werden muss – ein Kalendereintrag greift immer auf denselben Kalender zu und hat nicht die Auswahl zwischen Outlook, dem Google-Kalender Kalender oder Lotus Notes; eine Websuche nutzt immer den Standard-Browser und die voreingestellte Suchmaschine Wolfram Alpha, die wiederum in der Lage ist, strukturierte Anfragen zu verarbeiten und zu beantworten. Damit ändert sich grundlegend die Interaktion des Nutzers mit dem Computer. Michael Spehr sieht solche Änderungen auch schon für Desktop-Computer voraus und prophezeit:

„Die Frage ist nicht mehr, ob und wie gut die Technik funktioniert, sondern ob man gewillt ist, in aller Öffentlichkeit oder zumindest im Büro mit seinem iPhone zu sprechen. Es geht allein um die soziale Akzeptanz. Wer die Idee für abstrus hält, denke zurück an eine Bürowelt ohne Telefone im 19. Jahrhundert.“

In der Tat scheint die soziale Akzeptanz, glaubt man zumindest den zahlreichen Kommentaren in diversen Foren, das entscheidende Kriterium zu werden. Noch immer können sich viele nicht vorstellen, unterwegs – also vor aller Augen der Öffentlichkeit – „mit ihrem Handy zu sprechen“. Obwohl sie natürlich schon seit vielen Jahren in aller Öffentlichkeit in ihr Handy sprechen und private Details vor den Ohren einer ganzen U-Bahn ausbreiten, aber das scheint etwas anderes zu sein.

Das Schlüsselwort ist tatsächlich „Anthropomorphisierung“. Schon das Diktat in einem Computer sorgt dafür, dass man ihm menschliche Eigenschaften zuschreibt (wie oft benutze ich eigentlich die Phrase „liebenswerte Eigenheiten unseres kleinen Drachen“?); Wenn die Maschine dann auch noch antwortet wie ein Mensch, verschwimmen die Unterschiede immer weiter. Neben der sozialen Akzeptanz stellt sich daher auch noch eine ethische Dimension. Wollen wir wirklich mit der Maschine umgehen wie mit einem Menschen? Dass auch hier die Kategorien bisweilen verrutschen, zeigt sich bei (fast) allen Hundebesitzern...

Aktuelle neue Fehlermeldung: Benutzerprofil kann nicht geöffnet werden

In den letzten Tagen häufen sich bei mir die Anfragen, dass ein Benutzerprofil, welches bisher vollkommen unschuldig vor sich hin gearbeitet hat, nicht mehr geöffnet werden kann.

Es scheint so, als sei dieses auf ein neues Windows-Update zurückzuführen. Dieses sorgt dafür, dass Benutzer (also unter Windows mit der Rolle „Benutzer“ angemeldete Anwender) keinen Zugriff mehr auf die Speicherorte haben, in denen Dragon NaturallySpeaking die Benutzerprofile lokal ablegt.

Abhilfe schafft hier folgendes:

Gehen Sie über den Windows Explorer in den Ordner C:\Program Data\Nuance\ und markieren Sie dort den Ordner „NaturallySpeaking11“. Machen sie einen Rechtsklick auf den Ordner und wählen Sie „Eigenschaften“ und dann „Sicherheit – Bearbeiten“. Geben Sie den Benutzern Vollzugriff auf diesen Ordner und bestätigen Sie alles mit O.K. Danach lässt sich das Benutzerprofil wieder öffnen.

Angegebene Dateipfade für Windows 7; unter Windows XP scheint das Problem nicht aufzutreten.

02 Dezember 2011

Philips Dictation hat eine neue Website

Philips kündigt die neue Website für seine Diktierprodukte an. Sie ist erreichbar unter http://www.dictation.philips.com/de/home/

Die alte Website ist offenbar schon vom Netz gegangen, jedenfalls kann ich sie nicht mehr aufrufen. (Hallo Philips: eine Umleitung wäre schön gewesen!)

Alles ist sehr viel farbenfroher geworden, aber auch übersichtlich und leicht zu navigieren. Etwas stutzen musste ich beim Produktsupport, weil dort zunächst eine komplette Übersicht aller Produkte angezeigt wird – klickt man aber auf das gewünschte Produkt, erhält man dort alles, was man braucht, in einer praktischen Übersicht.

Ein schicker Relaunch der Seite meiner bevorzugten Diktierhardware.

29 November 2011

Sascha Lobo macht sich Gedanken über Siri

Blogger Sascha Lobo macht sich auf Spiegel Online Gedanken über Siri, die Spracherkennung im neuen iPhone.

Tenor:
Spracherkennung ist der Nachfolger sozialer Netzwerke. Kontexterkennung erschafft einen Markt, vergleichbar mit dem Suchmaschinenmarkt.

Spracherkennung ist nur die Basis, um Informationen durch Einbezug des Kontextes (wer spricht? wo? welche Informationen sind schon bekannt?) zu verknüpfen. Während das eine sehr attraktive Technologie ist, bildet sie gleichzeitig ein sehr hohes vertriebliches Potential - lies: einen weiteren wesentlichen Schritt auf dem Wege zu immer genauerer Werbung.

16 November 2011

Dragon Recorder für iPhone

Die Palette der Anwendungen, die Nuance für das iPhone bereitstellt, ist um einen Recorder ergänzt worden, der das iPhone effektiv in ein digitales Diktiergerät verwandelt. Mit der Dragon Recorder App nehmen Sie auf dem iPhone Diktate auf, senden sie über iTunes oder WLAN an den PC oder Mac (mit MacScribe-Software) und lassen Sie dort mit Dragon NaturallySpeaking bzw. MacScribe transkribieren.

Aufnahmeformat ist WAV. Die drahtlose Übertragung funktioniert dann, wenn sich iPhone und Rechner im selben WLAN befinden.

Die App ist kostenlos im Appstore zu haben. Benötigte Software auf dem Rechner ist nach Aussage von Nuance Dragon 11.5 Premium, Professional oder Legal. bzw. auf einem Mac MacScribe. (DragonDictate für Mac enthält derzeit noch keine Umsetzungsfunktion für digitale Diktate.) Da die Diktate im WAV-Format vorliegen, sollte die Versionsnummer keine große Rolle spielen. Zwar wird das iPhone als Quelle erst ab Version 11.5 akzeptiert – für andere Versionen gibt es aber immer noch die Möglichkeit, „Audiodateien auf Festplatte“ als Quelle anzugeben. Somit dürfte auch Dragon Medical 11 kein Problem sein.

Hier ein englisches Video, in dem die Funktionsweise demonstriert wird, hier die Ankündigung auf der amerikanischen und der deutschen Nuance-Webseite.

15 November 2011

Siri ausführlich

Apples neue Spracheingabe fürs iPhone, Siri, wird von www.cio.de ausführlich getestet und besprochen.

Siri stellt die bisher verfügbaren Lösungen deutlich in den Schatten und zeigt, wie effektiv eine Sprachsteuerung sein kann, wenn man es richtig macht. Das iPhone hat in einigen Bereichen Maßstäbe gesetzt, zum Beispiel bei der Bedienung mittels Touchscreen oder bei der Nutzung des Internet am Smartphone. Auch Siri könnte ein solcher Meilenstein werden. Die Software befindet sich noch im Betastadium, leistet aber teilweise schon Erstaunliches.

Siri ist fast schon eine Sekretärin in der Tasche, die auch komplexe Anfragen und Aufgaben erledigt und bei Bedarf die nötigen Rückfragen stellt. Außerdem erlaubt sie Diktat per Spracherkennung direkt in Anwendungen auf dem iPhone - kein Umweg mehr nötig wie bei der Dragon-App.

Der Dienst läuft immer noch auf Apples Servern. Für wen das ein Sicherheitsproblem darstellt - denken Sie ein paar Sekunden darüber nach, was Ihr iPhone und damit Apple, Google & Co. ohnehin schon über Sie wissen...

14 November 2011

Amazon kauft Startup für Spracherkennung

Heise berichtet, dass Amazon das Startup Yap, welches bisher einen Dienst zur Transkription von Voicemail in Text angeboten hat, übernommen hat. Der Dienst ist zwischenzeitlich eingestellt worden.

Vermutlich macht Amazon es genauso wie Google vor einiger Zeit und kauft einen Anbieter von Spracherkennungs-Dienstleistungen auf, um diese in seine eigenen Produkte zu integrieren. Der Amazon Kindle Fire, der in den nächsten Tagen in den USA startet, ist ja mehr als ein reines Lesegerät und dürfte dem iPad gehörig Konkurrenz machen. Da wird auch ein Dienst ähnlich wie Siri dem Gerät gut zu Gesicht stehen.

Nuance arbeitet derweil selbst an einem ähnlichen Dienst, der sich aber im Moment noch im Planungsstadium befindet. Siri wird ja inzwischen sogar im Werbefernsehen beworben. Es ist doch nicht etwa der Punkt erreicht, an dem sich Spracherkennung tatsächlich in der Masse durchsetzt?

10 November 2011

Olympus vor dem Ende?

Seit eingen Tagen häufen sich die Meldungen, die japanische Firma Olympus habe mit kreativer Buchführung Milliardenverluste kaschiert. Der neue, europäische Chef, der die Unstimmigkeiten in den Bilanzen publik gemacht hat, wurde gegangen; der alte musste sich in japanischer Art entschuldigen und ist inzwischen zurückgetreten. Der Aktienwert des Traditionsunternehmens ist auf ein Fünftel geschrumpft.

Während Olympus hierzulande vor allem als Hersteller von Kameras bekannt ist, macht das Unternehmen den meisten Umsatz mit Medizintechnik und gehört zu den Großen Drei bei den digitalen Diktiergeräten. Das Olympus DS-5000 ist seit Jahren eines der hochwertigsten Diktiergeräte auf dem Markt, und das alte DS-330 war zu seiner Zeit das digitale Diktiergerät mit dem absolut besten Preis-Leistungs-Verhältnis. Mit Philips und Grundig zusammen hat Olympus den DSS-Standard (Digital Speech Standard), eine Art MP3 für Sprache, entwickelt, der digitale Diktate in hoher Qualität auf ein handhabbares Maß komprimiert.

Spiegel Online berichtet über "Falsche Bilanzen" bei Olympus.

12 Oktober 2011

iPhone 4S mit Siri-Sprachsteuerung

Das neue iPhone 4S, das in den nächsten Tagen auf den Markt kommt, verfügt über einen "Siri" genannten Sprachassistenten, der Steuerung der Geräts, Suchen und auch Diktat erlaubt. (Zur Erinnerung: Apple hatte Siri vor einiger Zeit gekauft.) Die Spracheingabe dürfte zu den spektakuläreren Neuerungen gehören, da sie nicht mehr als App geladen wird wie das hinlänglich besprochene Dragon Dictate für iPhone, sondern fest im Betriebssystem verdrahtet ist. Die meisten Beprechungen, die ich bisher gelesen habe, erwähnen sie auch an prominenter Stelle; jedoch scheint den Rezensenten am wichtigsten zu sein, dass das neue Gerät immer noch so aussieht wie das alte - Apple verkauft halt über Design.

Eingehend bespricht Siri der Heise-Bericht über das iPhone 4S. Dort gibt es auch ein Video: Siri in Aktion in lauter Umgebung.

M. Spehr von der FAZ hat Siri im Auto ausprobiert. Sein Fazit in faz.net:

Die Erkennung ist deutlich leistungsfähiger als das Pendant von Nuance mit der Dragon-Dictation-App, obwohl die Software vermutlich von Nuance stammt... Siri ... ist großartig.

Wie Dragon Dictate auch findet die Siri-Erkennung auf einem Remote-Server statt. Zu allfälligen Sicherheitsbedenken will ich mich hier nicht verbreiten - nur: wer Spracheingabe in der Öffentlichkeit nutzt, hat genug Mithörer, auch ohne sich über Spionageserver Gedanken machen zu müssen.

Sprachbefehle besser nutzen mit der Dragon-Randleiste (Sidebar)

Die Dragon-Randleiste gibt es schon lange. Früher öffnete der Befehl "Was kann ich sagen" einen schlicht gestalteten Kasten mit den wesentlichen Befehlen für die gerade aktive Anwendung; seit Version 11 ist die Randleiste optisch auffälliger gestaltet und enthält mehrere Kategorien, u.a. die selbst erstellten Befehle. Nuance hat jetzt eine Umfrage (englisch) gestartet, ob und wie die Anwender von Dragon NaturallySpeaking die Randleiste nutzen. Nehmen Sie teil!

Sie kennen die Sidebar gar nicht? Über das Menü "Extras - Optionen - weitere Einstellungen können Sie sie einblenden. Ich empfehle, sie "frei beweglich" zu halten. Das geht durch Rechtsklick auf die Randleiste; im sich öffnenden Menü können Sie die Position auswählen.

Praktisch ist die Dragon-Randleiste auch für alle, die eigene Befehle programmiert haben: über die Registerkarte "Eigene Befehle" können Sie sich alle selbst programmierten Befehle anzeigen lassen. Auch wer von seinem Dragon NaturallySpeaking-Händler Steuerungsbefehle für seine Anwendungen erhalten hat, kann diese hier einsehen.

Und weil man selbst ja auch immer wieder Neues entdeckt, fand ich in der Randleiste eine Liste der Befehle, mit der sich die Maus per Sprache bewegen lässt. Dies ist sicherlich nicht für alle interessant, aber wer in der Bewegung seiner Hand eingeschränkt ist oder (wie ich) gelegentlich Schmerzen beim Mausschubsen hat, findet diese vielleicht ganz hilfreich.

Dabei ist übrigens noch zu ergänzen, dass man in vielen Programmen die Programmmenüs und Schaltflächen per Sprache ansprechen kann, indem man einfach „klick“ und dann den Namen der Schaltfläche sagt. Dies funktioniert z.B. in Microsoft Word und Outlook, aber auch in Mozilla Firefox.

Genauso lassen sich alle installierten Anwendungen per Sprachbefehl öffnen, indem man „öffne“ und dann den Namen der Anwendung sagt, und zwar so, wie er im Windows-Startmenü eingetragen ist. Gängige Microsoft Office-Anwendungen kann man auch einfach mit ihrem Kurznamen aufrufen, also z.B. „öffne Microsoft Word“. Einfach ausprobieren!

Ach so: man schließt die Dragon-Randleiste über den Befehl „Randleiste schließen“.

23 August 2011

FAZ testet Dragon 11.5

In der heutigen FAZ vom 23.08.2011 findet sich ein Test von Dragon 11.5 in Verbindung mit dem iPhone als Eingabegerät. Detailliert wird beschrieben, wie das iPhone angeschlossen und als Diktierquelle eingerichtet wird. Die Erkennungsgenauigkeit ist durch die sehr gute Tonqualität des im Gerät verbauten Mikrofons der eines Philips SpeechMike Air beinahe ebenbürtig.

Interessant auch das Zitat:

Wir hatten die iPhone-Anbindung des neuen Dragon zuerst für eine Spielerei gehalten, fanden sie im Laufe der Zeit doch sehr praktisch – und natürlich ausgesprochen günstig im Vergleich mit einem ordentlichen Drahtlosmikrofon, das mehr als 400 € kostet. E-Mails auf dem Sofa liegend diktieren: das hat was.


– Wenn man ein iPhone hat, möchte man hinzufügen, denn ansonsten wäre die Anschaffung wohl doch noch etwas teurer :-)

Der Autor geht mit unserer Auffassung konform, dass die neuen Befehle für Twitter und Facebook, insbesondere im professionellen Bereich, als "Spielerei" einzuordnen sind. Zu weiteren Verbesserungen habe ich bereits 2 Beiträge geschrieben, die hier und hier eingesehen werden können.

Apropos professioneller Bereich: die professionellen Versionen von Dragon NaturallySpeaking sind zwar um einiges teurer als die vom Autor im Artikel mit 130 € bepreiste und als Mindestlösung genannte Premium-Variante, bieten darüber hinaus aber auch eine sehr gute Vokabular-Verwaltung, Netzwerkfähigkeiten und die Möglichkeit, seine eigenen Sprachbefehle zu erstellen. Immer wieder werde ich gefragt, ob das denn so nötig sei. Und immer wieder lautet meine Antwort: wer sich nicht bewegt, spürt seine Fesseln nicht. Ich zumindest möchte meine zahlreichen Sprachbefehle nicht mehr missen, mit denen ich mir hier die Arbeit erleichtere.

22 August 2011

Der SPIEGEL über Spracherkennung

Der Spiegel 28/2011 berichtet über den derzeitigen Stand der Spracherkennung mit besonderer Berücksichtigung von mobilen Geräten wie Smartphones und Navigationsgeräten:

http://www.spiegel.de/spiegel/print/d-79408646.html

Kein schlechter Überblick über den derzeitigen Stand der Technik, auch im Hinblick auf Weiterentwicklungen der Spracherkennung z.B. durch neue Mikrofon-Techniken und den Einsatz von künstlicher Intelligenz.

18 Juli 2011

Neue Befehle in Dragon 11.5 (Teil 2)

Zu meinen Favoriten in Dragon NaturallySpeaking 11 gehört die Möglichkeit, mehrere Vorkommen desselben Wortes in einem Arbeitsgang zu formatieren oder zu korrigieren. Hat man einen Satz wie "wenn du denkst du denkst, dann denkst du nur du denkst", lassen sich alle Vorkommen des Wortes "denkst" mit einem einzigen Sprachbefehl bearbeiten, also z.B. "Fett denkst". Resultat: "Wenn du denkst du denkst, dann denkst du nur du denkst".

Will man diese Aktion rückgängig machen, gibt es in Dragon 11 jetzt einen neuen Befehl "alles rückgängig machen".

Es soll ja noch einige geben, die sich das alte Verhalten zurück wünschen, bei dem Dragon immer nur das letzte Vorkommen eines Wortes vor dem Cursor markiert hat. Dazu meine ich: Will man tatsächlich nur ein Vorkommen bearbeiten, braucht man einen Schritt mehr. Will man aber alle Vorkommen eines Wortes oder Ausdrucks bearbeiten, spart man sich unter Umständen 5 oder 6 Sprachbefehle. Da ist für mich klar, wo der Vorteil liegt.


PS:
Wer findet, dass in dem Zitat oben das eine oder andere Komma fehlt, bedienen sich bitte aus folgenden und setze sie an passender Stelle ein:

,,,,,,

Neue Befehle in Dragon 11.5

Never mind the hype, here's the news:

Dragon 11.5 enthält 2 neue, sehr nützliche Befehle: "setz das in Anführungszeichen" und "setz das in Klammern". Beide funktionieren entweder mit der Markierung oder für die letzte Äußerung. Es wird also entweder die jeweils markierte Passage oder aber alles seit der letzten Sprechpause in Anführungszeichen bzw. Klammern gesetzt.

Typografische Anführungszeichen sind es leider nicht.

14 Juni 2011

Dragon 11.5 kommt

Am vergangenen Donnerstag wurde die Information zuerst an die Händler weitergegeben, ab heute ist sie öffentlich und offiziell: Dragon NaturallySpeaking 11.5 steht vor der Tür. Hier die Nuance-Pressemitteilung. Dr. Spehr hat in seinem Blog sogar schon ein paar Screenshots. Das Video zur neuen Version gibt es hier.

Das Feature, welches am meisten in den Vordergrund geschoben wird, ist die Einbindung eines IPhone als mobiles Mikrofon. Dies funktioniert, wenn IPhone und Rechner sich im selben WLAN befinden, ohne Probleme über einen Assistenten. Es ist sogar möglich, ein ad hoc-Netzwerk anzulegen, wenn man Notebook und iPhone einmal außerhalb des gewohnten WLAN verwenden will.

Des weiteren ist die Unterstützung einiger aktualisierter Anwendungen, z.B. Internet Explorer 9, OpenOffice 3.3 oder Windows Live Mail hinzugekommen. Die Unterstützung von Microsoft Office 2010 wurde überarbeitet und verbessert.

Mit einem neuen Sprachbefehl lässt sich jetzt auch ein Text sofort an Facebook oder Twitter senden.

Neben diesen Neuerungen, die sich in einer Pressemitteilung immer sehr sexy machen (Social Media! IPhone! Nuance-Apple-Verhandlungsgerüchte!) steht auch zu erwarten, dass einige der in Version 11 bekannten Probleme beseitigt wurden. Dies bezieht sich insbesondere darauf, dass Dragon – z.B. beim Einschalten des Mikrofons und beim 1. Diktat, oder beim Öffnen des Buchstabierfensters - unter bestimmten Bedingungen sehr träge reagiert.

Die Inkompatibilität mit dem Adobe Reader 10 ist dagegen ein Problem von Adobe, das auch durch das Upgrade nicht behoben werden kann.

Allen Anwendern sei gesagt, dass es sich bei Dragon 11.5 um ein für Anwender von Dragon 11 kostenloses Upgrade handelt. Sollten Sie also in den nächsten Tagen E-Mail von Nuance erhalten, in der die Version 11.5 "zum Einführungspreis" angeboten wird – warten Sie noch ein paar Tage.

Mit der Auslieferung von Dragon 11.5 Professional und Legal wird Ende Juni - Anfang Juli begonnen. Wer seine Spracherkennung von einem zertifizierten Händler erworben hat, sollte sich von dem darüber beraten lassen, wie er das Update erhält und wie es installiert wird. Ende Juli wird das Update dann auch über das eingebaute Software-Update automatisch bereitgestellt. Wer Dragon NaturallySpeaking 11 neu kauft oder von einer Vorversion updated, erhält ab Erscheinungstermin der 11.5 automatisch die neue Version.

26 Mai 2011

Dragon-Workshop in Frankfurt

Dragon-Anwender in Frankfurt/Main und Umgebung haben vielleicht Interesse an einem Workshop "Effektives Arbeiten mit Dragon NaturallySpeaking" in Frankfurt am 16. und 17.06.2011. Inhalte des Workshops und Anmeldeformular finden sich unter dem angegebenen Link. Themen sind unter anderem Neuerungen in der aktuellen Version und Möglichkeiten, mit Spracherkennung möglichst effizient zu arbeiten. Ansonsten kann auch auf konkrete Fragen der Teilnehmer eingegangen werden.

Die veranstaltende Firma Evabyte blickt auf eine Erfahrung mit Spracherkennung zurück, die noch wesentlich länger ist als meine. Die Teilnahmegebühr für einen halbtägigen Workshop beträgt 198 €.

25 Mai 2011

Grundig Digta 7 digitales Diktiergerät

Die neue Digta 7-Serie von Grundig habe ich bisher nur kurz in der Hand gehabt. Der erste Eindruck war gut, mir fiel vor allem auf, dass die Geräte größer sind als andere digitale Diktiergeräte.

Heute kamen Neuigkeiten von Grundig Business Systems ins Postfach, u.a. diese:

Das britische Magazin Business Info hat die „Digta 7“-Diktiergerätereihe mit dem begehrten Editors Choice Award ausgezeichnet. Mit diesem Award werden Produkte prämiert, die sich in den Bereichen Design, Funktionalität und Innovation von anderen Produkten abheben. Das Digta 7 setzt mit zahlreichen Innovationen neue Standards für die Diktierbranche. So zeichnen sich die Premium-Geräte beispielsweise durch einen Beschleunigungssensor für eine automatische Datensicherung im freien Fall aus – das bedeutet, dass ein Diktat automatisch gesichert wird, sollte es versehentlich auf den Boden fallen.


Coole Funktion, wirklich! Aber auch interessante Grammatik...

19 Mai 2011

Inzwischen auch im SPIEGEL angekommen: Apple will Nuance Spracherkennung ins iPhone integrieren

Die Gerüchteküche weiß es schon seit einiger Zeit, mit diesem Artikel in Spiegel online wird es jetzt einer größeren Leserschaft zugänglich gemacht: Apple und Nuance verhandeln offensichtlich seit einiger Zeit über die Integration von Sprachsteuerung und/oder Diktat in die nächste Version des Betriebssystems iOS 5 für das iPhone.

Die Integration in das Betriebssystem geht über die bisher vorhandenen Apps weit hinaus – diese funktionieren ja bekanntermaßen im wesentlichen Dank der seit einiger Zeit endlich enthaltenen Zwischenablage. Abgesehen davon wird bei DragonDictate für das iPhone die eigentliche Spracherkennung auf einem entfernten Server und nicht auf dem Gerät durchgeführt.

Die mögliche Kooperation geht so weit, dass Gerüchten zufolge Apple bereits darüber nachdenkt, Nuance zu kaufen. Geld genug wäre vorhanden, aber will man sich wirklich für ein Feature auch alle möglichen anderen Geschäftsbereiche ans Bein hängen, die mit Apple überhaupt nichts zu tun haben? Immerhin würde dann das Preisdumping bei den Consumer-Versionen der Spracherkennung Dragon NaturallySpeaking vermutlich aufhören :-)

05 Mai 2011

FAZ-Test: Dragon Dictate 2.0 für Mac

Zu einem eher kritischen Resultat kommt der Test von Michael Spehr in der FAZ vom letzten Dienstag über das aktuelle Dragon Dictate 2.0: Für private Anwender (mit Abstrichen) empfehlenswert, für den professionellen Bereich, z.B. Ärzte und Anwälte, wird weiterhin Dragon NaturallySpeaking für Windows empfohlen.

Gut, dass Dragon NaturallySpeaking für Windows inzwischen unter Parallels oder ähnlichen Programmen auch auf einer Mac-Hardware läuft.

26 April 2011

Aus gegebenem Anlass: Probleme mit Adobe Acrobat Reader X und Dragon NaturallySpeaking

Ich habe schon einmal darauf hingewiesen: Der Acrobat Reader X, der in letzter Zeit per automatischer Update-Funktion auf immer mehr Rechnern installiert wird, verträgt sich nicht mit Dragon NaturallySpeaking. Eine typische Fehlermeldung ist: "Sendkeys wurde abgebrochen…" oder "HOOKERR…".

Wenn Sie diese Fehler erhalten, weisen sie mit großer Sicherheit darauf hin, dass Sie neulich den Adobe Acrobat Reader X installiert haben. Dieser verträgt sich nicht mit Dragon NaturallySpeaking, egal in welcher Version. Deinstallieren Sie ihn.

Folgende Alternativen bieten sich an:

Vorversionen des Adobe Reader finden Sie unter http://get.adobe.com/de/reader/otherversions/.

Nuance bietet selbst einen alternativen PDF-Reader an. Sie finden ihn unter http://www.nuance.de/imaging/products/pdf-reader.asp oder zum direkten Download unter folgender Adresse: http://imagingcontent.nuance.com/PDFreader/NuancePDFReader_EFGDIS.exe
Natürlich können Sie auch einen beliebigen anderen PDF-Reader verwenden.

Das Problem liegt übrigens begründet in der neuen Sprachausgabe des Adobe Reader X, die sich mit der seit Jahren in Dragon NaturallySpeaking enthaltenen Vera nicht verträgt.

14 April 2011

Endlich! Spracherkennung kann Kaffee kochen!

Endlich können wir auf die am häufigsten gestellte Frage bei der Vorführung von Spracherkennung mit "ja" antworten – die Spracherkennung kann auch Kaffee kochen! Der 1. Kaffeevollautomat mit Sprachsteuerung ist auf dem Markt!

Der Kaffeevollautomat Jura IMPRESSA Z7 One Touch nimmt sprachgesteuerte Bestellungen entgegen, fragt nach, wenn eine Kaffeesorte nicht richtig verstanden wurde – und erinnert per Sprachausgabe daran, wenn die Milch nachgefüllt werden muss.

Das ideale Zubehör für die Praxis oder Kanzlei, die in der Spracherkennung schon alles hat! Zum empfohlenen Verkaufspreis von 1990 € ein must-have.

24 März 2011

Spracherkennung für Android-Smartphones im FAZ-Test

Michael Spehr testet die Spracherkennung für Android-Smartphones und ist sehr angetan. Gegenüber der kostenlosen Spracherkennung für das iPhone kostet die Anwendung zwar 3,58 €, bietet aber deutlich mehr, z.B. eine direkte Einbindung in alle Android-Anwendungen. Außerdem ist Spracherkennung nur ein Eingabemedium, das von der Anwendung bereitgestellt wird; andere sind eine verbesserte Tastatur, Worterkennung und dergleichen mehr.

24 Februar 2011

Supercomputer mit Spracherkennung

Der Supercomputer "Dr. Watson", der in der letzten Zeit für Schlagzeilen gesorgt hat, weil er bei einer Quizshow menschliche Bewerber mit seinem Wissen schlagen konnte, soll demnächst auch im medizinischen Umfeld eingesetzt werden, und zwar dabei, Medizinern bei der Diagnose zu helfen. Dass dieses Projekt recht umfangreich sein dürfte, steht außer Zweifel, insbesondere weil die Aufbereitung der Daten ein großes Problem darstellt. Viele Daten liegen nur als Sprachnotizen oder Videos vor, aus denen es sehr viel schwerer ist, Information zu extrahieren als aus geschriebenen Texten.

Weshalb ich das hier berichte? Weil Nuance mit seinen Sprachtechnologien in dem Projekt involviert ist. Spracherkennung wird sowohl für die Auswertung dieser Texte als auch später für die Abfrage eine wesentliche Rolle spielen.

Eine verständliche Erklärung, wie die Maschine funktioniert und "denkt", das heißt Informationen aus wird, findet sich hier. Die genannten Beispiele zeigen, dass tatsächlich eine Vielzahl an Informationen ausgewertet miteinander verglichen wird; außerdem dass der Computer in der Lage ist, Risiken einzuschätzen. Die Spracherkennung ist allerdings bisher noch nicht implementiert; die Fragen wurden ganz herkömmlich über die Tastatur eingegeben.

Wenn das erst einmal so weit ist, sind wir wieder einen Schritt weiter auf dem Weg zum Star Trek-Rechner. Bis dahin nutze ich fröhlich weiter die Suchfunktion meines Dragon NaturallySpeaking und frage z.B.: "durchsuche das Web nach Dr. Watson". Das Ergebnis zeigt allerdings, dass Google noch einen Schritt hinter Dr. Watson zurück ist – hier erfährt man etwas über den Helfer von Sherlock Holmes und einen gleichnamigen Windows-Dienst, der Informationen über den Computer sammelt, wenn in einer Anwendung ein Fehler aufgetreten ist.

12 Januar 2011

Benutzerumfrage

Nuance hat eine Umfrage gestartet, wie die Anwender von Dragon NaturallySpeaking die Spracherkennung nutzen, was sie sich wünschen und in welchem Rahmen sie eingesetzt wird. Die Umfrage finden Sie hier:

http://www.surveymonkey.com/s.aspx?sm=prxKOLhl5h80W5Up9llseA%3d%3d

(Englisch)

Ich habe schon teilgenommen, auch wenn ich sicherlich kein typischer Anwender bin – aber dafür habe ich einige Wünsche geäußert, was die Software noch an Möglichkeiten vertragen könnte. Zugegebenermaßen bewegen die sich auf hohem Niveau – ich musste schon einige Zeit nachdenken, damit mir überhaupt noch etwas einfällt, was sich an Dragon 11 verbessern lässt. Wie wäre es mit zusätzlichen Worteigenschaften, die auch zu exportieren sind?