31 Oktober 2013

Patch für Dragon NaturallySpeaking 12.5

 
Der Patch für Dragon NaturallySpeaking 12.5 wurde am 29.10.2013 veröffentlicht und ist über „Hilfe – Software-Aktualisierungen“ erhältlich. Wir empfehlen, die Datei nicht sofort zu installieren, sondern die Option „nur herunterladen“ zu wählen und anschließend zu installieren.
Der Patch trägt die Versionsnummer 12.50.000.142.
 

Hinweise zur Installation

Systemvoraussetzungen sind alle Versionen von Dragon NaturallySpeaking 12.5 in allen Sprachen. Andere Versionen können den Patch nicht installieren. Insbesondere Dragon Medical Practice Edition ist nicht betroffen.
Wird Dragon aus irgend einem Grunde neu installiert, muss der Patch nachträglich wieder installiert werden.
Der Patch wirkt sich nicht auf die Benutzerprofile aus. Es wird trotzdem empfohlen, die Benutzerprofile zu sichern.
 

Behobene Probleme

  • Beim Schließen von Dragon NaturallySpeaking kann es sein, dass die NatSpeak.Exe nicht richtig geschlossen wird und bei einem Neustart das zuletzt geöffnete Benutzerprofil sofort geöffnet wird. Dieses Verhalten ist durch den Patch behoben.
  • Beim Anlegen eines neuen Benutzerprofils kam es vor, dass Dragon während der Mikrofonprüfung oder des Trainings sich aufhängte. Dieses Problem wurde hervorgerufen durch die Art und Weise, in der Windows 8.1 die Anfragen von Dragon NaturallySpeaking verarbeitet. Dieses Problem wird durch den Patch behoben.
  • Einige Mikrofone wurden nicht korrekt erkannt, unter anderem Andrea und Logitech drahtlose Mikrofone. Dieses Problem ist durch den Patch behoben.
  • Integration für Internet Explorer 11
  • Integration für Firefox 22 und 23
  • Verbesserte dragon.log protokolliert jetzt zusätzliche Mikrofon-Einstellungen
  • Beim Diktat in einer E-Mail in Mozilla Thunderbird erscheint jetzt keine überflüssige Leerstelle mehr vor einem Wort.
  • Office 2003-Anwendungen können jetzt per Sprachbefehl gestartet werden.
  • Funktion „von gesendeten E-Mails lernen“ funktioniert jetzt mit Office 2013
  • springender Cursor in WordPerfect X6 behoben
  • „poste das auf Twitter“-Befehl: Probleme behoben
Ohne Gewähr! Alle Angaben folgen der Herstellerbeschreibung und werden von uns sukzessive getestet.

15 Oktober 2013

Spracherkennung und Big Data

In einem TED-Video (1) zeigen Eric Berlow und Sean Gourley, wie sich auf YouTube veröffentlichte TED-Vorträge auf gemeinsame Ideen, Themen und Konzepte durchsuchen lassen, Gemeinsamkeiten und Verbindungen herausgefunden, analysiert und angezeigt werden können. Zur Transkription der Vorträge wird Spracherkennung verwendet, die zumindest die wesentlichen Schlagwörter findet. Die solcherart ausgewerteten Vorträge können dann nach verschiedenen Kriterien visualisiert werden - Themen, Interessenten, Gemeinsamkeiten und Verbindungen zwischen Themengruppen, zentralen Vorträgen zu einem Thema und Außenseitern, sogar nach Geschlecht und Alter der Interessenten.

Der Link zu Video stammt aus dem Blog einer Marketing-Agentur. War ja klar, dass den Leuten als erstes einfällt, dass sie uns mit Hilfe von Big Data noch mehr verkaufen können.

Geauso interessant ist, dass sich Privatsphäre im Internet als ein wesentliches Thema der letzten Zeit hearuskristallisiert - zwar wenig überraschend, doch zeigt diese Methode der Datenauswertung, wie viel heute an Wissen aus scheinbar verstreuten, heterogenen Quellen zusammengetragen werden kann, und dass von einer "virtuellen Privatsphäre" im Netz nicht mehr die Rede sein kann. Schon die Metadaten, d.h. die reinen Aussagen über die Verbindungen, können unabhängig vom Inhalt ausreichen, potentielle Verdächtige einzukreisen. Dass Spracherkennung dann potentiell auch zur Überwachung eingesetzt werden kann, habe ich ja schon beschrieben.


(1) Wer TED nicht kennt: Die Website verspricht (zu Recht) "Ideas worth spreading" und zeigt zahlreiche wissenschaftliche Vorträge zu aktuell relevanten Themen aus so ziemlich allen Gebieten. Die jährliche Konferenz ist inzwischen ein Riesen-Event geworden, das in Stunden ausverkauft ist - trotz astronomischer Eintritte, zu denen ja auch noch die Anreise kommt. Dafür erhält man Einblick in Themen, die jetzt schon gesellschaftlich, politisch oder technisch relevant sind, oder es demnächst werden, oder die neue Entwicklungen aufzeigen und forcieren - nichts, was man auf der Arbeit aufrufen sollte also.

05 September 2013

Spracherkennung im Alltag: neue Perspektiven

In mehreren Artikeln wird in den letzten Tagen darüber berichtet, wo Spracherkennung in der nächsten Zeit hinführen kann. Professionelle Diktiersysteme werden sicherlich ein mächtiger Bestandteil bleiben, jedoch geht die Entwicklung immer weiter in die Richtung, Spracherkennung in den Alltag zu integrieren. Das macht Sinn: in dem Maße, wo immer mehr Geräte in Wirklichkeit kleine Computer sind, ist Sprache zumindest in der Theorie die natürlichste und einfachste Eingabemöglichkeit. Wer schon einmal im fahrenden Auto versucht hat, seinen Bordcomputer über den Touchpad zu bedienen, wird bestätigen können, dass er nicht nur de jure, sondern auch de facto eine kriminelle Handlung begeht – da wäre es viel einfacher, mit einer klaren Ansage das zu erreichen, was man erreichen möchte.

Über die neuesten Entwicklungen aus dem Hause Nuance berichtet das Hamburger Abendblatt:
http://www.abendblatt.de/wirtschaft/article119679867/Wo-Maschinen-die-menschliche-Sprache-erlernen.html

PCWorld geht auf die Konzeption eines digitalen Assistenten ein, der eine eigene Persönlichkeit entwickelt:
http://www.pcworld.com/article/2046694/how-nuance-is-building-a-digital-persona-that-loves-you.html

Für die New York Times rezensiert der Technikkolumnist David Pogue die Spracheingabe für iPhone und Android (Anm.:  die Spracheingabe für Android funktioniert im Moment auf englisch noch sehr viel besser als auf deutsch):
http://www.nytimes.com/2013/08/22/technology/personaltech/android-vs-siri-the-voice-recognition-sequel.html

Ein recht reißerischer ARD-Bericht zeigt schließlich noch eine ganz andere Einsatzmöglichkeit: Spracherkennung, die zur Überwachung von Telefongesprächen eingesetzt wird. Ohne in Zeiten des NSA-Skandals diese Überwachung verharmlosen zu wollen, können wir davon ausgehen, dass nicht sämtliche Telefongespräche auf diese Weise analysiert werden. Wenn allerdings eine Verbindung erstmal in das Visier der Ermittler gerückt ist, muss nicht mehr unbedingt ein Mensch mithören.

20 Juni 2013

Immer eine Nuance besser!



Das neue Internetportal „immer-eine-Nuance-besser.de“ öffnet seine Pforten. Ab sofort finden Sie hier eine Vorstellung der professionellen und hochwertigen Software- und Hardware-Lösungen rund um den Bereich „professionelle Spracherkennung“.

Ab sofort zieht dieses Blog auf http://immer-eine-nuance-besser.de/#blog um. Dort finden Sie weiterhin regelmäßig Produktvorstellungen, Testberichte, Tipps und Tricks rund um die Themen „professionelle Spracherkennung“, „digitales Diktat“ und Diktierhardware. Für eine Übergangszeit werde ich neue Artikel auf beiden Blogs posten, bitte aber meine regelmäßigen Leser um Aktualisierung ihrer Lesezeichen, Feeds usw.

Im Anwenderforum können Sie mit anderen Anwendern und zertifizierten Fachhändlern diskutieren und gemeinsam Lösungen oder Workarounds erarbeiten. Gerne stehen Ihnen hier die Experten zur Verfügung. Auch ich lese und schreibe dort regelmäßig mit.

Im Bereich „über uns“ finden Sie eine Liste der teilnehmenden Nuance Certified Solutions Partner (nach Postleitzahlen sortiert) so dass Sie bei allen Fragen zur Spracherkennung und zum digitalen Diktat schnell Ihren Ansprechpartner vor Ort finden.

Bei Interesse können Sie direkt über das Kontaktformular die für Sie interessanten Produkte auswählen und eine gezielte Anfrage nach Präsentation und Beratung starten.

immer-eine-Nuance-besser.de ist eine Internetseite von egs Computer Vertrieb GmbH in Zusammenarbeit mit den auf der Seite gelistet Dragon-Fachhändlern.

11 Juni 2013

Philips DPM 4 digitales Diktiergerät in der FAZ

Unter dem Titel "Schlank, schön und schlau" rezensiert Dr. Michael Spehr das neue Philips DPM 4-Diktiergerät. Der Artikel ist am 4. Juni in Technik und Motor-Teil erschienen und inzwischen auf faz.net öffentlich zugänglich (siehe Link oben).

Fazit:
Alles in allem ist das DPM 8000 unser neues Referenzgerät: Akkulaufzeit, Display und Mikrofontechnik geben den Ausschlag.
Ich persönlich fand übrigens die Qualität der Konferenzaufnahmen durchaus überzeugend – das Gerät klingt natürlich anders, wenn es auf dem Tisch liegt, aber die Aufzeichnung war bei meinem Versuch genauso deutlich wie bei der klassischen Haltung für das Diktat.

07 Juni 2013

Philips Digital Pocket Memo 4: die neue Referenz für digitale Diktiergeräte

Seit einer Woche steht das Philips Digital Pocket Memo 4 auf meinem Schreibtisch. Das neueste digitale Diktiergerät von Philips sieht nicht nur extrem edel aus, sondern bietet auch eine ganze Reihe neuer, interessanter Funktionen, die für professionelle Diktanten interessant sind.

Das Element, was wahrscheinlich am meisten Spaß macht, ist nicht etwa der extrem leichtgängige Schiebeschalter, den es wie gewohnt in 2 Versionen – International oder Deutsch – zur Auswahl gibt. Nein: Der Bewegungssensor, der im neuen Diktiergerät eingebaut ist, ermöglicht einen extremen Zugewinn an Komfort.

So unterscheidet das Diktiergerät z.B. von alleine, ob es in der Hand gehalten wird oder auf dem Tisch liegt, und schaltet das Mikrofonelement entsprechend um. Damit eignet sich das Diktiergerät ohne weitere Einstellungen zu Änderungen sowohl zum direkten Diktat als auch zum Aufzeichnen von Gesprächen, Konferenzen usw. Und wenn man das Gerät aus der Hand legt, um in einer Akte zu blättern, muss das Diktat nicht unterbrochen werden, sondern wird in nahezu identischer Aufnahmequalität fortgeführt.

Einige weitere Highlights sind:

  • Ein großes Farbdisplay mit hoher Auflösung
  • Möglichkeit, Arbeitslisten, Patientenlisten usw. zu importieren, die Listen werden im Display angezeigt
  • Aufnahmeformate: DSS, DSS Pro, MP3 und WAV (!)
  • Batterielaufzeit von 23 Stunden bei der Aufnahme, 200 Tage Stand-by
  • schnelles Aufladen über USB mithilfe der mitgelieferten Ladestation
  • durch Standard-USB Anschluss mit allen Handy-Netzteile zu verwenden, kein eigenes Netzteil nötig
  • der Zugriff kann über eine PIN gesichert werden, die mit dem Autorenprofil verknüpft ist: Meldet sich ein Autor über seine PIN an, hat er sofort alle Einstellungen
Die Diktatverwaltung, der Download vom Gerät, der Versand ans Sekretariat zur Abschrift oder zur Spracherkennung, geschieht über die Philips SpeechExec Pro Dictate-Software, die im Paket mit dem Gerät erhältlich ist. Wer diese Software bereits besitzt, kann sich bei Philips ein kostenloses Update auf die aktuelle Version 7.5 herunterladen, die das Digital Pocket Memo 4 voll unterstützt.

Interessant ist auch das Zubehör, welches optional angeboten wird. So kann ein Fußschalter direkt an die Ladestation angeschlossen werden, um das Diktat oder die Wiedergabe per Fußschalter zu steuern.

Angekündigt ist auch ein WLAN-Adapter für die Ladestation, mit dem Diktate drahtlos ins Sekretariat übertragen werden können. Dies funktioniert allerdings nur im firmeneigenen WLAN und nicht uneingeschränkt von unterwegs.

Immer häufiger werden Akten mit einem Barcode gekennzeichnet. Das Philips Digital Pocket Memo ist daher optional mit einem integrierten Barcodescanner erhältlich, der das Gerät kaum größer macht und sich dadurch vorteilhaft von allen ähnlichen Lösungen unterscheidet.

Die Philips Digital Pocket Memo-Geräte der neuesten Version sind ab sofort im Fachhandel erhältlich! Die Preise beginnen bei 449 € für das Gerät ohne Software bis 699 € für das Gerät mit integriertem Barcode Scanner (jeweils zuzüglich Mehrwertsteuer).

Videos gibt es unter http://www.youtube.com/user/philipsdictation.

22 April 2013

Dragons Befehlscenter richtig nutzen

Ein Poweruser aus den USA, Eric Wright, hat in seinem Blog einen umfangreichen Artikel geschrieben, wie sich das Befehlscenter richtig nutzen lässt. Empfohlene Lektüre für alle, die sich mit Sprachbefehlen auseinander setzen wollen und ein wenig Englisch beherrschen!

(Leider ist die Blues-Harmonika in Deutschland nicht verfügbar, da die GEMA die Verlagsrechte hieran nicht eingeräumt hat.)

16 April 2013

Dialogmarketing neu definiert


Wie kürzlich bekannt gegeben, arbeitet Nuance an einer Möglichkeit, Werbung auf dem Smartphone mithilfe von Spracherkennung interaktiv zu machen. In einer ersten Demo spricht eine Billardkugel (eine Schwarze 8) mit dem Anwender, gibt einige Antworten auf seine Fragen, und beendet das ganze mit dem Hinweis auf ein (fiktives) Video.

Würden Sie mit Ihrem Smartphone reden? Sie ganz bestimmt. Aber mit einer Anzeige? Und wo sollte die geschaltet werden? Wer würde sich tatsächlich so eine App freiwillig herunterladen? Und wenn sie ungefragt käme, würde ich genau 2 Wörter zu ihr sagen, auf Gälisch.

15 April 2013

FAZ-Test: Mikrofone für die Spracherkennung

Auf FAZ.NET testet Michael Spehr das Philips SpeechMike Premium, das Plantronics Savi 440 und das Plantronics Voyager Legend auf ihre Verwendung für Spracherkennung hin. Das SpeechMike und das Plantronics Savi 440 erzielen ähnlich gute Ergebnisse, die Frage nach dem besten Gerät für unterwegs muss allerdings offen bleiben.

Folgende Anmerkung zum Bluetooth-Headset sei noch gestartet:

Meiner Erfahrung nach kommt die Verzögerung bei der Korrektur in der Regel daher, dass Dragon im Korrekturmodus jedes noch so geringe Geräusch - und sei es ein Rauschen vom Audioeingang - erst als Sprache analysiert, bevor es eine Eingabe über die Tastatur oder mithilfe des Buchstabieralphabets akzeptiert. Wenn Sie Ihre Korrekturen „von Hand“ machen, empfehle ich das Mikrofon vorher umzuschalten, dann geht alles wieder in gewohnter Geschwindigkeit.

14 März 2013

Auf dem Weg zum rollenden Büro

Am Dienstag im Blatt, heute auf FAZ.NET:

Mobiler E-Mail-Abruf und Diktat im neuen 7er BMW.

Ganz reif scheint die Technik noch nicht zu sein. Dafür kann man demnächst sein Auto updaten.

04 März 2013

Servicepack für Dragon NaturallySpeaking 12

Seit Ende letzer Woche ist das Service Pack für Dragon NaturallySpeaking 12 erhältlich, das im Vorfeld einige Geburtswehen hatte.

Um das Servicepack herunterzuladen, gehen Sie in der Dragon-Leiste auf „Hilfe – Software-Aktualisierungen“ und lassen Sie den Software Manager nach dem Update suchen.Wählen Sie dann „Herunterladen (Download)“.

Installieren Sie das Servicepack nicht direkt! Sollte bei der Installation etwas fehlschlagen, haben Sie die Installationsdatei auf jeden Fall für einen 2. Versuch zur Verfügung.

Das Servicepack gilt für alle Versionen von Dragon NaturallySpeaking 12 und alle Sprachen. Bitte achten Sie bei der Installation auf die richtige Sprache.

Ein Servicepack für Dragon Medical wird erst im Sommer bereitgestellt werden.

Das Servicepack bringt grundlegende Verbesserung für Windows 8, wobei die neue Kachel-Oberfläche nicht zur Arbeit mit Dragon gedacht ist und daher auch nicht in vollem Umfang unterstützt wird. Für die Kachel-Oberfläche gibt es eine Miniatur-Dragon-Leiste, die zumindest das Diktat in dieser Ansicht ermöglicht. In der gewohnten Desktop-Oberfläche funktionieren jetzt die aus anderen Versionen bekannten Steuerungsbefehl.

Auch der Internet Explorer 10 wird jetzt unterstützt.

Einige Fehler sind behoben worden, so z.B. das Problem, dass beim Diktat von „neuer Absatz“ eine neue Zeile eingefügt wird. Für das Sprachmodell BestMatch V hat sich die Latenz bei der Umsetzung der Sprache deutlich verringert, wer aber viele Sprachbefehle braucht, ist immer noch mit dem Sprachmodell BestMatch IV besser bedient.

25 Februar 2013

Warum Dragon langsam startet

Inzwischen gibt es ausführlichere Informationen zur Frage, warum Dragon beim Start so lange braucht.

Das Problem ist verbunden mit dem automatischen Update des Service Packs auf 12.5. Trennen Sie die Verbindung zum Netzwerk, Dragon startet dann in normaler Geschwindigkeit. Löschen Sie den Haken in den administrativen Einstellungen, Registerkarte „Weitere Einstellungen“, vor „beim Start nach automatischen Updates suchen“.

Alternativ können Sie auch über den Taskmanager die Agent.Exe beenden. Auch das beschleunigt den Start.

Es wurde außerdem beobachtet, dass der Haken vor „beim Start nach automatischen Updates suchen“ von Dragon selbstständig wieder gesetzt wird, obwohl er vom Anwender/Händler entfernt wurde.

Hier auch ein Link zum Eintrag in der Nuance Knowledge Base:
http://nuance.custhelp.com/app/answers/detail/a_id/15105

21 Februar 2013

Warum braucht Dragon beim Start so lange?

Warum startet Dragon heute nicht?
Warum bleibt Dragon beim Start stehen?

Warum, kann ich nur vermuten. Als Abhilfe empfehle ich nach ersten Tests,
  1. das Netzwerkkabel zu ziehen bzw. das WLAN zu deaktivieren, um Dragon zu starten;
  2. nach dem Start in "Extras - Administrative Einstellungen - Weitere Einstellungen" zu gehen und dort den Haken vor "Beim Start nach Updates suchen" zu löschen.
Danach sollte Dragon auch bei gestecktem Kabel wieder in gewohntem Tempo starten.

Weitere Hinweise sind willkommen! Sollte dieser Trick bei Ihnen nicht funktionieren, melden Sie sich unter Angabe von Dragon-Version und Betriebssystem im Forum von immer-eine-nuance-besser.de!

19 Februar 2013

FAZ über Dragon TV

In ihrer heutigen Ausgabe (19.02.2013) berichtet die FAZ im Technik und Motor-Teil über neue Prototypen eines Dragon TV, welches die Steuerung des Fernsehgerätes per Sprache erlauben soll. Weit über die von einem Diktiersystem bekannten Fähigkeiten hinaus soll die Sprachsteuerung des Fernsehers ähnlich intelligent arbeiten wie das vom iPhone hinlänglich bekannte Siri.

In ihrer heutigen Ausgabe (19.02.2013) berichtet die FAZ im Technik und Motor-Teil über neue Prototypen eines Dragon TV, welches die Steuerung des Fernsehgerätes per Sprache erlauben soll. Weit über die von einem Diktiersystem bekannten Fähigkeiten hinaus soll die Sprachsteuerung des Fernsehers ähnlich intelligent arbeiten wie das vom iPhone hinlänglich bekannte Siri.

Einige Auszüge:

„(Das Fernsehgerät) hört nämlich ständig in den Raum hinein, man muss nicht in ein Mikrofon sprechen, Hintergrundgeräusche werden ausgeblendet, und mit dem Zauberwort ‚Dragon TV‘ macht die Software aus dem Tiefschlaf auf und nimmt Kommandos entgegen. Und zwar Befehle in natürlicher Sprache, die weit über das hinausreichen, was sich Fink mit einigen Tastendruck auf der Fernbedienung erledigen lässt.… Man kann mit Sprachkommandos auch nach bestimmten Serien oder Schauspielern oder Genres suchen lassen.“

„Die Nuance-Software steuert nämlich geräteübergreifend nicht nur den TV-Apparat, sondern auch den Receiver und den Festplattenrekorder.… Zudem sind nicht zuletzt Streaming-Dienste eingebunden… Wer am PC mit der Dragon-Software nach einem im Japan spielenden Film mit Bill Murray gesucht und „Lost in Translation“ gestartet hat, kann wenig später im Wohnzimmer das Filmvergnügen fortsetzen.“

Das ganze funktioniert vor ausgesuchten Journalisten einwandfrei. Wieder ein Schritt weiter zum elektronischen Butler?

21 Januar 2013

Google Chrome mit Spracherkennung

Die neueste version von google chrome enthält eine spracherkennung die aber noch nicht so gut ist wie die von dragon naturally speaking satzzeichen kann ich zum beispiel nicht mit diktieren doppelpunkt die werden ausgeschrieben punkt neuer absatz die erkennung ist aber gar nicht übel ausrufezeichen warum aber nur kleine buchstaben geschrieben werden komma wissen die entwickler selbst am besten neuer absatz wie dem auch sei doppelpunkt hier wächst ein konkurrent herren

Zum Vergleich derselbe Text mit Dragon NaturallySpeaking diktiert (inklusive aller diktierten und ausgelassenen Satzzeichen):

Die neueste Version von Google Chrome enthält eine Spracherkennung die aber noch nicht so gut ist wie die von Dragon NaturallySpeaking. Satzzeichen kann ich z.B. nicht mit diktieren: die werden ausgeschrieben.

Die Erkennung ist aber gar nicht übel! Warum aber nur geschrieben werden, essen die Entwickler selbst am besten

Wie dem auch sei: hier wächst ein Konkurrent heran

Und wer es selber ausprobieren will, lädt sich die Beta-Version 25 von Google Chrome herunter und probiert dort folgenden Link aus: https://www.google.com/intl/en/chrome/demos/speech.html

Technisch gesprochen handelt es sich bei diesem Feature um die Implementierung einer API, mit der Entwickler ihre Webseiten für die Eingabe per Sprache programmieren können. Die eigentliche Erkennung findet auf den Google-Servern statt. Wenn man sich die Spezifikationen etwas näher ansieht, findet man dort auch, dass Ausdrücke wie „neuer Absatz“ eigentlich unterstützt werden müssten. Hier scheint bei der Demo also etwas nicht so zu funktionieren. Der Download von Google Chrome 25 ersetzt also nicht den Kauf einer Spracherkennung zum Diktat in den Browser! (Und ich hatte mich schon gefreut und überlegt, mir ein Chromebook anzuschaffen.)

Anm.: das Wort „Kleinbuchstaben“ ist ein Steuerungsbefehl in Dragon NaturallySpeaking und wurde deswegen ausgelassen. Die Google-Spracherkennung schreibt sie dagegen gnadenlos aus. Ansonsten sehe ich in beiden Texten jeweils genau einen Erkennungsfehler.

Ach so: hier der Bericht bei Heise online, der mich darauf aufmerksam machte.