25 Oktober 2014

Dragon 13, Mozilla Firefox und Google Maps

Viel Gutes gibt es von der Version Dragon 13 zu berichten, aber auch ein paar Kinderkrankheiten. So fiel uns zum Beispiel auf, dass Dragon 13 zwar ein Addon für Mozilla Firefox mitbringt, das es ermöglicht, problemlos in den Browser zu diktieren (wie zum Beispiel diesen Beitrag hier), dass jedoch auf manchen Rechnern Google Maps einfriert, sobald dieses Addon geladen ist.

Wir haben das Problem dem Hersteller gemeldet. Dieser hat bereits einen Patch fertiggestellt und wird ihn im nächsten Servicepack veröffentlichen.

Bis dahin empfehlen wir entweder einen alternativen Kartendienst zu nutzen oder, bevor Sie Google Maps aufrufen, über Addons – Erweiterungen die Dragon Web Extension temporär zu deaktivieren. Sobald Google Maps geladen ist, können Sie die Extension wieder aktivieren.

24 Oktober 2014

Dragon Legal 13

dns13legal_leftfacing_345x297
Die Dragon 13-Familie ist komplett: als letzte Version ist Dragon NaturallySpeaking Legal 13 jetzt von Nuance angekündigt und wird ab Ende nächster Woche bei Ihrem Fachhändler erhältlich sein.

Dragon Legal 13 enthält alle Features von Dragon NaturallySpeaking Premium und Professional, zusätzlich aber noch ein juristisches Fachwörterbuch, das neben zahlreichen fachspezifischen Ausdrücken auch besondere Formatierungsregeln enthält. So werden zum Beispiel nur im juristischen Fachwortschatz der Paragraf und Absatz korrekt abgekürzt.

Weiterhin sind Namen und Abkürzungen von Gesetzen enthalten, die den gängigen Regeln nach formatiert werden, egal wie sie diktiert werden: „gemäß der Straßenverkehrsordnung“, aber „§ 1 StVO“ – beides mal gesprochen als „Straßenverkehrsordnung“.

Diese zusätzlichen Ausdrücke und Formatierungsregeln machen den Mehrwert des juristischen Vokabulars gegenüber den in den anderen Editionen enthaltenen Vokabularen aus. Ziel ist es, möglichst natürlich diktieren zu können, und trotzdem sofort den Text den Konventionen gemäß zu formatieren.

Natürlich enthält Dragon Legal 13 wie alle anderen professionellen Editionen von Dragon NaturallySpeaking die Möglichkeit, Diktate vom Diktiergerät umsetzen zu lassen, im Sekretariat korrigieren zu lassen, den Wortschatz aus eigenen Schriftsätzen umfangreich zu ergänzen und an die persönlichen Bedürfnisse anzupassen, den Rechner per Sprachbefehl zu steuern, Routineaufgaben per Sprachbefehl zu erledigen, und vieles andere mehr.

Auch die anderen neuen Funktionen – verbesserte Erkennung auch ohne Training, vereinfachte Anlage eines Benutzerprofils, verbesserte Verwaltung von Mikrofonen, leichtes Zurücksetzen des Benutzerprofils bei nachlassender Erkennungsgenauigkeit, neue Dragon-Leiste, Unterstützung von Mozilla Firefox und Google Chrome und anderes – sind selbstverständlich in Dragon Legal 13 enthalten.

In den nächsten Wochen werden wir die 1. eigenen Erfahrungen mit Dragon Legal 13 sammeln und veröffentlichen. Dann wird es auch neue Fachvokabulare LegalPlus geben.

23 September 2014

Dragon NaturallySpeaking Professional 13 ist erschienen

Wie Nuance auf seiner Webseite ankündigt, ist Dragon NaturallySpeaking Professional 13 soeben erschienen.

Dragon NaturallySpeaking Professional enthält alle Features von Dragon NaturallySpeaking Premium 13, sowie zusätzlich:
  • Fachvokabular: Mehrere Vokabulare pro Sprecher, die umfangreichen Wortschatz eines Spezialgebietes enthalten können
  • praktisch unbegrenzte Sprachbefehle zur Automatisierung aller Arbeitsabläufe auf dem PC
  • Netzwerkfähigkeit: Benutzerprofile können im Netz gespeichert und synchronisiert werden
  • automatische Transkription von digitalen Diktaten im Hintergrund
  • Barrierefreiheit für Anwender mit Behinderungen
  • zentrale Verteilung von Wortlisten, Vokabularen und Sprachbefehlen
  • Export und Import von Wortlisten im XML-Format inklusive besonderen Formatierungen
Zu den interessantesten Neuerungen gehört die Möglichkeit, Sprachbefehle anzulegen, die freies Diktat enthalten. So lässt sich beispielsweise eine Textvorlage definieren, in der nur noch ein Platzhalter für den Namen des Ansprechpartners steht, der dann gleich mit diktiert werden kann. Ein Diktat von „Angebot Herr Müller“ oder „Angebot Frau Meyer“ ruft dann die entsprechende Vorlage auf und trägt den Ansprechpartner an der korrekten Stelle ein.

Auch in Skriptbefehlen ist jetzt freies Diktat möglich. Welche Möglichkeiten sich hier auftun, müssen wir erst noch ausloten.

Dragon NaturallySpeaking Professional ist ab sofort bei Ihrem Fachhändler bestellbar! Vollversionen und Updates werden in dieser Woche ausgeliefert. Der empfohlene Verkaufspreis beträgt 849 € inklusive Mehrwertsteuer. Upgrade von Version 11 und 12 sind zum Preis von 299 € erhältlich.

03 September 2014

Neuheiten in Dragon 13

Im Blog unter www.immer-eine-Nuance-besser.de finden Sie ab heute eine Serie mit Neuheiten in Dragon 13. Los geht es mit der neuen Dragon-Leiste, es folgen Hinweise zu Mikrofonen, zum Vokabular-Editor und zu vielen anderen Funktionen.

Schauen Sie regelmäßig hinein und informieren Sie sich über die Neuheiten in Dragon NaturallySpeaking 13!

02 September 2014

FAZ-Rezension von Dragon 13

In der Frankfurter Allgemeinen Zeitung vom heutigen Dienstag, 02.09.2014, findet sich eine gewohnt kenntnisreiche Rezension der neuen Version Dragon NaturallySpeaking Premium 13 von Michel Spehr.

Der Rezensent hebt lobend hervor, dass Dragon in der neuen Version die Hürden für Einsteiger deutlich gesenkt hat:

„Die zur Verfügung stehenden Mikrofone sind nun übersichtlich aufgeführt, und erstmals unterstützt das Programm die eingebauten Mikrofone eines Notebooks, vorausgesetzt, ihre Audioqualität ist hinreichend… Zweitens ist das obligatorische Übungsdiktat bei der Einrichtung des Drachens nun drastisch reduziert worden. So einfach und bequem hat man es noch nie gehabt.“


Auch die Erkennungsgenauigkeit der neuen Version wird lobend hervorgehoben. Insbesondere bestätigt der Rezensent unseren Eindruck, dass die neue Version sehr viel toleranter geworden ist. Natürlich ließ sich auch in Vorversionen bei entsprechend diszipliniertem Diktat eine Genauigkeit von praktisch 100 % erreichen, Dragon 13 macht das aber sehr viel einfacher. Man muss kein Spracherkennungsspezialist werden, um mit Dragon 13 arbeiten zu können.

Auch auf die verbesserte Unterstützung von Mozilla Firefox und Google Chrome sowie die deutlich schnellere Leistung des Systems wird eingegangen. Als Fazit bleibt:

„Die neue Version 13 verblüfft selbst Fachleute… Der Fortschritt ist sofort zu sehen. Mit diesem Windows-Programm ist die Spracherkennung nun angekommen. Sie funktioniert so gut und perfekt wie in der Werbung. Ja, der PC versteht einen.“


06 August 2014

Dragon NaturallySpeaking Premium 13 ist da

Als 1. Produkt der neuen Dragon NaturallySpeaking 13-Versionsreihe hat Nuance Dragon NaturallySpeaking Premium 13 vorgestellt. Dragon NaturallySpeaking Premium wendet sich vor allem an Heimanwender, die sich mit Spracherkennung die Arbeit am Computer erleichtern wollen. Dragon NaturallySpeaking Premium 13 wird ab dem 15.08.2014 bei Ihrem Händler erhältlich sein.
Professionelle Anwender, die mit Dragon NaturallySpeaking Professional und Dragon NaturallySpeaking Legal arbeiten,  müssen sich noch etwas gedulden – einen Erscheinungstermin für diese Versionen gibt es leider noch nicht. Dasselbe gilt für Dragon Medical, welches inzwischen eine eigene Versionsnummer und einen eigenen Erscheinungszyklus hat.

Folgendes gefällt uns an Dragon NaturallySpeaking 13 besonders gut:
  • verbesserte Erkennungsgenauigkeit: auch bei weniger deutlicher Aussprache wird das Diktat praktisch fehlerfrei erkannt
  • Systemvoraussetzungen bleiben gleich, Dragon läuft auf dem selben Rechner schneller als die Vorversion
  • besserer Ausnutzung von starken Prozessoren (Sprachmodell BestMatch V funktioniert jetzt reibungslos)
  • einfache Benutzerverwaltung: ein Sprecherprofil ist in 2 Minuten angelegt.
  • Übersichtliche Verwaltung von Mikrofonen: alle verfügbaren Mikrofone werden angezeigt und können ausgewählt werden
  • verbesserte Behandlung von Abkürzungen: Abkürzungen in Großbuchstaben werden ohne zusätzliche „gesprochene Form“ erkannt
  • neugestaltete Dragon-Leiste nimmt weniger Platz auf dem Bildschirm ein; die gewohnte Dragon-Leiste kann auf Wunsch wiederhergestellt werden
  • Diktat nach Mozilla Firefox und Google Chrome wird unterstützt
  • verbesserte Behandlung von alternativen Schreibweisen: Dragon schreibt ein Wort je nach Kontext anders
Auch auf einige verbreitete Probleme wurde reagiert. So erscheint z.B. ein Hinweis, wenn Microsoft Word die Diktatunterstützung für Dragon NaturallySpeaking verloren hat. Wenn die Erkennung nach einiger Zeit schlechter wird (ein häufig verbreitetes Phänomen!), kann das Profil ohne Verlust des Vokabulars  und der Einstellungen neu trainiert werden. Auch die Übersicht, die die tatsächlich verwendeten Mikrofone anzeigt, ist sehr viel besser als die aus früheren Versionen bekannter Verwaltung von so genannten Diktierquellen.

Alles in allem also ein rundum erfreuliches Update! Trotzdem raten wir allen, die mit den professionellen Versionen der Spracherkennung Dragon NaturallySpeaking Professional, Dragon NaturallySpeaking Legal und Dragon Medical arbeiten, mit dem Kauf zu warten, bis die neue Version ihrer Software-Version erschienen ist, auch wenn es im Moment interessante Einführungsangebote gibt. Die volle Leistung Ihrer professionellen Diktiersoftware erhalten Sie nur mit dem richtigen Update! Außerdem zeigt die Erfahrung, dass ein Update von einer der professionellen Versionen auf Premium die gesamte Spracherkennung zerstört.

Bis dahin schauen Sie hier vorbei, wo wir Tipps und Tricks zum Umgang mit Dragon NaturallySpeaking 13 veröffentlichen werden.

22 Juli 2014

Test: Philips Device Control Center 3.3

Die Versionsnummer täuscht: die neue Version des Philips Device Control Center 3.3 hat mehr zu bieten als Verbesserungen gegenüber der (guten und stabilen) Version 3.2.

Das Philips Device Control Center ist bekanntermaßen eine kostenlose Software, die allen Philips-Mikrofonen und Fußschaltern beiliegt (und unter https://www.dictation.philips.com/de/produkte/product/speechmike_premium_usb_diktiermikrofon_lfh35003600_serie/support/ kostenlos heruntergeladen werden kann). Mit dieser Software kann ein Philips SpeechMike zur Steuerung der Spracherkennung Dragon NaturallySpeaking bzw. Dragon Medical konfiguriert werden.

Wichtigste Neuerung: es ist jetzt möglich, Tastenbelegungen (so genannte Schemata) zentral zu speichern und zu verteilen. Das ist vor allen Dingen dann interessant, wenn in einer Organisation mehrere SpeechMike an mehreren Rechnern vorhanden sind, die alle gleich bedient werden sollen. Früher musste man jede Änderung an jedem Rechner einzeln vornehmen. Heute reicht es, ein SpeechMike so zu konfigurieren wie gewünscht und das Schema zentral auf einem Server abzulegen. Alle anderen SpeechMike laden sich dann dieselbe Konfiguration vom Server.

Will ein Anwender eine bestimmte Taste anders belegt haben, ist das kein Problem: im Device Control Center wird die Taste entsprechend konfiguriert und sein persönliches Schema in einem Unterordner auf dem Server abgelegt. Wenn er sich an einem anderen Rechner mit seinem Windows-Benutzernamen anmeldet, wird das geänderte Schema dort aufgerufen.

Die mitgelieferte Konfigurationsanleitung (leider nur auf Englisch) erläutert gut und umfangreich, wie die Installation und Konfiguration vorgenommen wird. Es empfiehlt sich, sie vorher zu lesen.

Als Extra liegen neben der Standard-Konfiguration 2 weitere Konfigurationen (auf der CD im Ordner „Tools\Application Control Profiles“) bei, die über das Device Control Center importiert werden können. Neben dem Standard-Schema für Dragon Professional/Legal gibt es 2 Schemata für Dragon Medical, die beide recht gut durchdacht sind.

An ein paar Stellen würde ich noch eingreifen:
  • mir persönlich fehlt die Möglichkeit, aus dem PDCC heraus zu bestimmen, wo die Schemata abgelegt werden sollen (lokal oder zentral). So könnte man nachträglich die Konfiguration noch anpassen, ohne an die Registry zu müssen.
  • Ich würde die Funktionstasten für Befehlsmodus (F1) und Normalmodus (F3) stilllegen. Die Gefahr ist zu groß, versehentlich im falschen Modus zu landen.
  • Die Funktionstaste F4 für den Verborgen-Modus ist für aktuelle Dragon-Versionen nicht mehr relevant. In Dragon Medical 2 funktioniert dieser Modus ganz anders (und wird am SpeechMike über die „Instruktion“-Taste aufgerufen).
  • Die Taste für „Textübertragung“ (die obere Taste auf der Rückseite) liegt ungünstig und ist schwer zu bedienen.
  • Nach wie vor funktioniert das Kommando „Transfer Text“ („Textübertragung“) nicht, sondern schreibt das Wort „Übertragung“ ins Diktierfenster. Abhilfe: an dieser Stelle den Hotkey (standardmäßig Strg + Umschalt + T) eintragen.
Dies sind Kleinigkeiten, die durch die zentrale Verteilung eines Schemas leicht angepasst werden können. Von daher: eine echte Verbesserung für das Philips SpeechMike Premium, die die Bedienung von Dragon noch viel komfortabler gestaltet!

26 Mai 2014

Google Glass im Krankenhaus

Technology Review berichtet über Einsatzmöglichkeiten der Google Glass-Datenbrille im Krankenhaus. Ärzte testen in einem Pilotprojekt an einer Klinik in Boston, wie die Datenbrille den Klinikalltag verbessern können.

In der Notaufnahme werden Daten zu Patienten direkt auf das Display der Brille eingeblendet, so dass die Notwendigkeit entfällt, in Akten blättern zu müssen, und der behandelnde Arzt die Hände frei hat.

Dabei ist die Anwendung so programmiert, dass die Google-Datenbrille Video-Verbindungen deaktiviert, während im Krankenhaus mit ihr gearbeitet wird. Das verhindert, dass Patientendaten usw. nach außen gelingen, und hält außerdem Ablenkungen vom Arzt fern.

Spracherkennung ist geplant, aber zu diesem Zeitpunkt noch nicht im Einsatz – die Google-Technologie ist für die Medizin wohl noch nicht ausgereift, so dass man darüber nachdenkt, einen anderen Anbieter zu integrieren (wer das wohl sein kann?).

Während die Anwendung im medizinischen Bereich sicherlich noch in den Kinderschuhen steckt, zeigt sie auf jeden Fall, dass Google Glass mehr sein kann als als Spielzeug für Nerds. Informationen jederzeit eingeblendet zu bekommen kann für viele Spezialanwendungen hilfreich sein – und bestimmt hilfreicher als die Information, was irgendein Gast vor zweieinhalb Jahren mal über die Pizzeria gesagt, vor der ich gerade stehe.

04 April 2014

FAZ-Artikel über Diktieren in der Cloud jetzt auch online erhältlich

Der Artikel „In die Cloud gesprochen“ aus der FAZ vom vergangenen Dienstag ist jetzt auch online erhältlich:

http://www.faz.net/aktuell/technik-motor/computer-internet/diktiertechnik-in-der-cloud-12871775.html

Im Artikel berichtet Redakteur Michael Spehr über die von DictaTeam und EGS vorgestellte Lösung dra.picture safe. Diktieren Sie unterwegs mit dem iPhone, machen Sie Fotos während des Diktates, senden Sie alles ins Büro und lassen Sie das fertige Dokument inklusive Fotos von Spracherkennung erstellen!

01 April 2014

FAZ-Bericht: Dictate on Demand und Dra.picture (FAZ, 1.4.2014)

Die FAZ hat in ihrer heutigen Beilage „Technik und Motor“ einen ausführlichen Artikel über zwei Cloud-basierte Diktierlösungen veröffentlicht: zum einen Philips Speech Live, zum anderen das von DictaTeam und EGS Computer Vertrieb GmbH gemeinsam entwickelte Dictate on demand und dra.picture.

Beiden Lösungen ist gemeinsam, dass Diktate auf einem mobilen Eingabegerät, im Klartext also einem iPhone, aufgezeichnet werden und über eine Cloud mehr oder weniger sicher versandt werden. Während Speech Live im wesentlichen dazu da ist, Diktate von unterwegs in den Philips-Diktatworkflow zu übergeben, geht Dictate on demand mit dra.picture einen ganz anderen Weg.
Dr. Michael Spehr, FAZ-Redakteur, beschreibt:

„EGS, die Spracherkennungsspezialisten aus Erkrath haben zusammen mit dem Unternehmen DictaTeam eine iPhone App entwickelt, die einzigartig ist: Sie erlaubt nicht nur das Diktieren von Text, sondern sie hat auch eine Kamerafunktion gleich eingebaut. Und nun der Clou: im Workflow von EGS übernimmt der Spracherkenner Dragon NaturallySpeaking die Transkriptions des Textes und fügt die Fotos genau dort ein, wo der Auslöser betätigt wurde. Architekten, Gutachter und andere erhalten gleich den fertigen Bericht mitsamt Fotodokumentation. Die lästige Fleißarbeit des Heraussuchen von Fotos und des Platzierens an der richtigen Stelle übernimmt das System von EGS…
Der weitere Workflow findet auf dem Server statt. Dragon NaturallySpeaking verarbeitet automatisch die eintreffenden neuen Sprachdateien, wobei das eigene Sprachprofil zum Einsatz kommt. Die Software fügt ferner die Bilder ein und schickt das Ergebnis als Word-Datei in ein frei wählbares Ausgabeverzeichnis.… Es lassen sich eigene Word-Vorlagen verwenden, so dass ein Bericht gleich mit der Optik und dem Layout des Unternehmens erstellt wird. Bei der Transkriptionen mit Dragon kann nachträglich korrigiert und damit der Sprachprofil verbessert werden.
Für den Einsatz des iPhone als Diktiergerät-Ersatz haben sich die Entwickler von DictaTeam und EGS ein weiteres Extra ausgedacht, das ebenfalls einzigartig ist: wer den Schiebeschalter des herkömmlichen Diktiergeräts am Smartphone vermisst, bekommt hier eine Alternative geboten, die verblüffend gut funktioniert: man legt den Daumen auf die Anzeige, und mit Bewegungen nach oben und unten löst man die gewohnten Kommandos aus. Da alles über Software läuft, gibt es den virtuellen Schiebeschalter sowohl für Links- wie auch für Rechtshänder. Auf das eigenständige Diktiergerät solle man also vollends verzichten können“.
Die iPhone App Dictate on demand ist als kostenlose Testversion im App Store erhältlich. Der gesamte Workflow kann über EGS Computer Vertrieb GmbH oder einen Fachhandelspartner bezogen werden.

09 März 2014

Interview zum sicheren mobilen Diktieren

Auf communicate4crm, eine spezielle Informationsplattform zum Thema CRM Customer-Relationship-Management, ist unter

http://bit.ly/1ijDdqD

ein Interview mit Claus Michael Sattler, Datenschutzbeauftragter bei DictaTeam und Gutachter für den Datenschutz, zu den Themen "Datenschutz, Cloud und Sprache in Geschäftsprozessen" im Vorfeld der CeBIT 2014 veröffentlicht. Dabei geht es unter anderem um die Frage, wie auch und auch unterwegs mit einem Smartphone digitales Diktat auf sichere Art versandt und zur Transkription gesendet werden kann.

Eine Schlüsselrolle dabei spielen die neuen Produkte dra.text safe und dra.picture safe, die es ermöglichen, auf dem iPhone ein Diktat aufzuzeichnen, vollständig verschlüsselt an einen Transkriptionsserver im eigenen Hause zu senden und dort von der Spracherkennung Dragon NaturallySpeaking Professional/Legal/Medical umsetzen zu lassen. Dabei ist es sogar möglich, während des Diktats Fotos aufzunehmen, diese mit dem Diktat zu versenden und an der richtigen Stelle in das umgesetzte Dikat einzubauen.

Egs Computer Vertrieb GmbH hat diese Weltneuheit zuerst auf der Medica 2013 vorgestellt. In Kürze wird die Lösung deutschlandweit erhältlich sein.

Welche Gründe für dra.text safe und dra.picture safe sprechen – Datenschutz, Bewahren von persönlichen Geheimnissen im Sinne von § 203 StGB, aber auch Praktikabilität und Effizienz – erfahren Sie aus dem Interview.

31 Oktober 2013

Patch für Dragon NaturallySpeaking 12.5

 
Der Patch für Dragon NaturallySpeaking 12.5 wurde am 29.10.2013 veröffentlicht und ist über „Hilfe – Software-Aktualisierungen“ erhältlich. Wir empfehlen, die Datei nicht sofort zu installieren, sondern die Option „nur herunterladen“ zu wählen und anschließend zu installieren.
Der Patch trägt die Versionsnummer 12.50.000.142.
 

Hinweise zur Installation

Systemvoraussetzungen sind alle Versionen von Dragon NaturallySpeaking 12.5 in allen Sprachen. Andere Versionen können den Patch nicht installieren. Insbesondere Dragon Medical Practice Edition ist nicht betroffen.
Wird Dragon aus irgend einem Grunde neu installiert, muss der Patch nachträglich wieder installiert werden.
Der Patch wirkt sich nicht auf die Benutzerprofile aus. Es wird trotzdem empfohlen, die Benutzerprofile zu sichern.
 

Behobene Probleme

  • Beim Schließen von Dragon NaturallySpeaking kann es sein, dass die NatSpeak.Exe nicht richtig geschlossen wird und bei einem Neustart das zuletzt geöffnete Benutzerprofil sofort geöffnet wird. Dieses Verhalten ist durch den Patch behoben.
  • Beim Anlegen eines neuen Benutzerprofils kam es vor, dass Dragon während der Mikrofonprüfung oder des Trainings sich aufhängte. Dieses Problem wurde hervorgerufen durch die Art und Weise, in der Windows 8.1 die Anfragen von Dragon NaturallySpeaking verarbeitet. Dieses Problem wird durch den Patch behoben.
  • Einige Mikrofone wurden nicht korrekt erkannt, unter anderem Andrea und Logitech drahtlose Mikrofone. Dieses Problem ist durch den Patch behoben.
  • Integration für Internet Explorer 11
  • Integration für Firefox 22 und 23
  • Verbesserte dragon.log protokolliert jetzt zusätzliche Mikrofon-Einstellungen
  • Beim Diktat in einer E-Mail in Mozilla Thunderbird erscheint jetzt keine überflüssige Leerstelle mehr vor einem Wort.
  • Office 2003-Anwendungen können jetzt per Sprachbefehl gestartet werden.
  • Funktion „von gesendeten E-Mails lernen“ funktioniert jetzt mit Office 2013
  • springender Cursor in WordPerfect X6 behoben
  • „poste das auf Twitter“-Befehl: Probleme behoben
Ohne Gewähr! Alle Angaben folgen der Herstellerbeschreibung und werden von uns sukzessive getestet.

15 Oktober 2013

Spracherkennung und Big Data

In einem TED-Video (1) zeigen Eric Berlow und Sean Gourley, wie sich auf YouTube veröffentlichte TED-Vorträge auf gemeinsame Ideen, Themen und Konzepte durchsuchen lassen, Gemeinsamkeiten und Verbindungen herausgefunden, analysiert und angezeigt werden können. Zur Transkription der Vorträge wird Spracherkennung verwendet, die zumindest die wesentlichen Schlagwörter findet. Die solcherart ausgewerteten Vorträge können dann nach verschiedenen Kriterien visualisiert werden - Themen, Interessenten, Gemeinsamkeiten und Verbindungen zwischen Themengruppen, zentralen Vorträgen zu einem Thema und Außenseitern, sogar nach Geschlecht und Alter der Interessenten.

Der Link zu Video stammt aus dem Blog einer Marketing-Agentur. War ja klar, dass den Leuten als erstes einfällt, dass sie uns mit Hilfe von Big Data noch mehr verkaufen können.

Geauso interessant ist, dass sich Privatsphäre im Internet als ein wesentliches Thema der letzten Zeit hearuskristallisiert - zwar wenig überraschend, doch zeigt diese Methode der Datenauswertung, wie viel heute an Wissen aus scheinbar verstreuten, heterogenen Quellen zusammengetragen werden kann, und dass von einer "virtuellen Privatsphäre" im Netz nicht mehr die Rede sein kann. Schon die Metadaten, d.h. die reinen Aussagen über die Verbindungen, können unabhängig vom Inhalt ausreichen, potentielle Verdächtige einzukreisen. Dass Spracherkennung dann potentiell auch zur Überwachung eingesetzt werden kann, habe ich ja schon beschrieben.


(1) Wer TED nicht kennt: Die Website verspricht (zu Recht) "Ideas worth spreading" und zeigt zahlreiche wissenschaftliche Vorträge zu aktuell relevanten Themen aus so ziemlich allen Gebieten. Die jährliche Konferenz ist inzwischen ein Riesen-Event geworden, das in Stunden ausverkauft ist - trotz astronomischer Eintritte, zu denen ja auch noch die Anreise kommt. Dafür erhält man Einblick in Themen, die jetzt schon gesellschaftlich, politisch oder technisch relevant sind, oder es demnächst werden, oder die neue Entwicklungen aufzeigen und forcieren - nichts, was man auf der Arbeit aufrufen sollte also.

05 September 2013

Spracherkennung im Alltag: neue Perspektiven

In mehreren Artikeln wird in den letzten Tagen darüber berichtet, wo Spracherkennung in der nächsten Zeit hinführen kann. Professionelle Diktiersysteme werden sicherlich ein mächtiger Bestandteil bleiben, jedoch geht die Entwicklung immer weiter in die Richtung, Spracherkennung in den Alltag zu integrieren. Das macht Sinn: in dem Maße, wo immer mehr Geräte in Wirklichkeit kleine Computer sind, ist Sprache zumindest in der Theorie die natürlichste und einfachste Eingabemöglichkeit. Wer schon einmal im fahrenden Auto versucht hat, seinen Bordcomputer über den Touchpad zu bedienen, wird bestätigen können, dass er nicht nur de jure, sondern auch de facto eine kriminelle Handlung begeht – da wäre es viel einfacher, mit einer klaren Ansage das zu erreichen, was man erreichen möchte.

Über die neuesten Entwicklungen aus dem Hause Nuance berichtet das Hamburger Abendblatt:
http://www.abendblatt.de/wirtschaft/article119679867/Wo-Maschinen-die-menschliche-Sprache-erlernen.html

PCWorld geht auf die Konzeption eines digitalen Assistenten ein, der eine eigene Persönlichkeit entwickelt:
http://www.pcworld.com/article/2046694/how-nuance-is-building-a-digital-persona-that-loves-you.html

Für die New York Times rezensiert der Technikkolumnist David Pogue die Spracheingabe für iPhone und Android (Anm.:  die Spracheingabe für Android funktioniert im Moment auf englisch noch sehr viel besser als auf deutsch):
http://www.nytimes.com/2013/08/22/technology/personaltech/android-vs-siri-the-voice-recognition-sequel.html

Ein recht reißerischer ARD-Bericht zeigt schließlich noch eine ganz andere Einsatzmöglichkeit: Spracherkennung, die zur Überwachung von Telefongesprächen eingesetzt wird. Ohne in Zeiten des NSA-Skandals diese Überwachung verharmlosen zu wollen, können wir davon ausgehen, dass nicht sämtliche Telefongespräche auf diese Weise analysiert werden. Wenn allerdings eine Verbindung erstmal in das Visier der Ermittler gerückt ist, muss nicht mehr unbedingt ein Mensch mithören.

20 Juni 2013

Immer eine Nuance besser!



Das neue Internetportal „immer-eine-Nuance-besser.de“ öffnet seine Pforten. Ab sofort finden Sie hier eine Vorstellung der professionellen und hochwertigen Software- und Hardware-Lösungen rund um den Bereich „professionelle Spracherkennung“.

Ab sofort zieht dieses Blog auf http://immer-eine-nuance-besser.de/#blog um. Dort finden Sie weiterhin regelmäßig Produktvorstellungen, Testberichte, Tipps und Tricks rund um die Themen „professionelle Spracherkennung“, „digitales Diktat“ und Diktierhardware. Für eine Übergangszeit werde ich neue Artikel auf beiden Blogs posten, bitte aber meine regelmäßigen Leser um Aktualisierung ihrer Lesezeichen, Feeds usw.

Im Anwenderforum können Sie mit anderen Anwendern und zertifizierten Fachhändlern diskutieren und gemeinsam Lösungen oder Workarounds erarbeiten. Gerne stehen Ihnen hier die Experten zur Verfügung. Auch ich lese und schreibe dort regelmäßig mit.

Im Bereich „über uns“ finden Sie eine Liste der teilnehmenden Nuance Certified Solutions Partner (nach Postleitzahlen sortiert) so dass Sie bei allen Fragen zur Spracherkennung und zum digitalen Diktat schnell Ihren Ansprechpartner vor Ort finden.

Bei Interesse können Sie direkt über das Kontaktformular die für Sie interessanten Produkte auswählen und eine gezielte Anfrage nach Präsentation und Beratung starten.

immer-eine-Nuance-besser.de ist eine Internetseite von egs Computer Vertrieb GmbH in Zusammenarbeit mit den auf der Seite gelistet Dragon-Fachhändlern.

11 Juni 2013

Philips DPM 4 digitales Diktiergerät in der FAZ

Unter dem Titel "Schlank, schön und schlau" rezensiert Dr. Michael Spehr das neue Philips DPM 4-Diktiergerät. Der Artikel ist am 4. Juni in Technik und Motor-Teil erschienen und inzwischen auf faz.net öffentlich zugänglich (siehe Link oben).

Fazit:
Alles in allem ist das DPM 8000 unser neues Referenzgerät: Akkulaufzeit, Display und Mikrofontechnik geben den Ausschlag.
Ich persönlich fand übrigens die Qualität der Konferenzaufnahmen durchaus überzeugend – das Gerät klingt natürlich anders, wenn es auf dem Tisch liegt, aber die Aufzeichnung war bei meinem Versuch genauso deutlich wie bei der klassischen Haltung für das Diktat.

07 Juni 2013

Philips Digital Pocket Memo 4: die neue Referenz für digitale Diktiergeräte

Seit einer Woche steht das Philips Digital Pocket Memo 4 auf meinem Schreibtisch. Das neueste digitale Diktiergerät von Philips sieht nicht nur extrem edel aus, sondern bietet auch eine ganze Reihe neuer, interessanter Funktionen, die für professionelle Diktanten interessant sind.

Das Element, was wahrscheinlich am meisten Spaß macht, ist nicht etwa der extrem leichtgängige Schiebeschalter, den es wie gewohnt in 2 Versionen – International oder Deutsch – zur Auswahl gibt. Nein: Der Bewegungssensor, der im neuen Diktiergerät eingebaut ist, ermöglicht einen extremen Zugewinn an Komfort.

So unterscheidet das Diktiergerät z.B. von alleine, ob es in der Hand gehalten wird oder auf dem Tisch liegt, und schaltet das Mikrofonelement entsprechend um. Damit eignet sich das Diktiergerät ohne weitere Einstellungen zu Änderungen sowohl zum direkten Diktat als auch zum Aufzeichnen von Gesprächen, Konferenzen usw. Und wenn man das Gerät aus der Hand legt, um in einer Akte zu blättern, muss das Diktat nicht unterbrochen werden, sondern wird in nahezu identischer Aufnahmequalität fortgeführt.

Einige weitere Highlights sind:

  • Ein großes Farbdisplay mit hoher Auflösung
  • Möglichkeit, Arbeitslisten, Patientenlisten usw. zu importieren, die Listen werden im Display angezeigt
  • Aufnahmeformate: DSS, DSS Pro, MP3 und WAV (!)
  • Batterielaufzeit von 23 Stunden bei der Aufnahme, 200 Tage Stand-by
  • schnelles Aufladen über USB mithilfe der mitgelieferten Ladestation
  • durch Standard-USB Anschluss mit allen Handy-Netzteile zu verwenden, kein eigenes Netzteil nötig
  • der Zugriff kann über eine PIN gesichert werden, die mit dem Autorenprofil verknüpft ist: Meldet sich ein Autor über seine PIN an, hat er sofort alle Einstellungen
Die Diktatverwaltung, der Download vom Gerät, der Versand ans Sekretariat zur Abschrift oder zur Spracherkennung, geschieht über die Philips SpeechExec Pro Dictate-Software, die im Paket mit dem Gerät erhältlich ist. Wer diese Software bereits besitzt, kann sich bei Philips ein kostenloses Update auf die aktuelle Version 7.5 herunterladen, die das Digital Pocket Memo 4 voll unterstützt.

Interessant ist auch das Zubehör, welches optional angeboten wird. So kann ein Fußschalter direkt an die Ladestation angeschlossen werden, um das Diktat oder die Wiedergabe per Fußschalter zu steuern.

Angekündigt ist auch ein WLAN-Adapter für die Ladestation, mit dem Diktate drahtlos ins Sekretariat übertragen werden können. Dies funktioniert allerdings nur im firmeneigenen WLAN und nicht uneingeschränkt von unterwegs.

Immer häufiger werden Akten mit einem Barcode gekennzeichnet. Das Philips Digital Pocket Memo ist daher optional mit einem integrierten Barcodescanner erhältlich, der das Gerät kaum größer macht und sich dadurch vorteilhaft von allen ähnlichen Lösungen unterscheidet.

Die Philips Digital Pocket Memo-Geräte der neuesten Version sind ab sofort im Fachhandel erhältlich! Die Preise beginnen bei 449 € für das Gerät ohne Software bis 699 € für das Gerät mit integriertem Barcode Scanner (jeweils zuzüglich Mehrwertsteuer).

Videos gibt es unter http://www.youtube.com/user/philipsdictation.

22 April 2013

Dragons Befehlscenter richtig nutzen

Ein Poweruser aus den USA, Eric Wright, hat in seinem Blog einen umfangreichen Artikel geschrieben, wie sich das Befehlscenter richtig nutzen lässt. Empfohlene Lektüre für alle, die sich mit Sprachbefehlen auseinander setzen wollen und ein wenig Englisch beherrschen!

(Leider ist die Blues-Harmonika in Deutschland nicht verfügbar, da die GEMA die Verlagsrechte hieran nicht eingeräumt hat.)

16 April 2013

Dialogmarketing neu definiert


Wie kürzlich bekannt gegeben, arbeitet Nuance an einer Möglichkeit, Werbung auf dem Smartphone mithilfe von Spracherkennung interaktiv zu machen. In einer ersten Demo spricht eine Billardkugel (eine Schwarze 8) mit dem Anwender, gibt einige Antworten auf seine Fragen, und beendet das ganze mit dem Hinweis auf ein (fiktives) Video.

Würden Sie mit Ihrem Smartphone reden? Sie ganz bestimmt. Aber mit einer Anzeige? Und wo sollte die geschaltet werden? Wer würde sich tatsächlich so eine App freiwillig herunterladen? Und wenn sie ungefragt käme, würde ich genau 2 Wörter zu ihr sagen, auf Gälisch.