04 Oktober 2012

Das optimale Sprachmodell

Dragon 12 bietet inzwischen 3 Sprachmodelle an: BestMatch III, BestMatch IV und BestMatch V. Diese Sprachmodelle sind jeweils auf bestimmte Prozessoren hin optimiert. BestMatch III ist das altbekannte Sprachmodell zur Verwendung mit einem Prozessorkern. BestMatch IV wurde in Dragon 11 eingeführt und nützt 2 Prozessorkerne. BestMatch V nützt mehrere Prozessorkerne gleichzeitig, benötigt aber mindestens 8 GB Arbeitsspeicher.

Durch die Verwendung des jeweils für den Rechner am besten geeigneten Sprachmodells erhofft man sich eine optimale Erkennungsgenauigkeit und Geschwindigkeit.  Das Sprachmodell wird von Dragon selbstständig ausgewählt, während ein Benutzerprofil erstellt wird. Auf der Registerkarte „Überprüfen Sie Ihre Einstellungen“ können Sie unter „Erweitert“ ein anderes Sprachmodell wählen. 




BestMatch III


BestMatch III ist das Sprachmodell, welches sich für die Verwendung mit vielen Sprachbefehlen und auf schwächeren Prozessoren anbietet. Die Erfahrung zeigt aber, dass ein ein Benutzerprofil mit BestMatch III-Sprachmodell auch bei für BestMatch V ausreichenden Systemanforderungen viel schneller läuft, besonders wenn man viele Sprachbefehle benötigt. Die Erkennungsgenauigkeit leidet nicht.

Um ein Benutzerprofil mit Sprachmodell BestMatch III anzulegen, erstellen Sie einen neuen Benutzer über den Benutzerassistenten. Im abschließenden Bildschirm werden Sie gebeten, Ihre Angaben noch einmal zu überprüfen. Wählen Sie dort „Erweitert“ und in dem Fenster, welches dann erscheint, „BestMatch III“. Folgen Sie dann weiter dem Assistenten.

BestMatch V


BestMatch V läuft nur auf mehreren Prozessorkernen und mindestens 8 GB Arbeitsspeicher und soll dort höchstmögliche Geschwindigkeit und Genauigkeit garantieren. Wir empfehlen, dieses Sprachmodell dann einzusetzen, wenn nicht mit Sprachbefehlen gearbeitet wird, und in den Dragon-Optionen, Registerkarte „Befehle“, die dort aufgeführten Sprachbefehle nach Möglichkeit zu deaktivieren, sowie unter „Extras – Optionen – weitere Einstellungen“ die Sprachsteuerung für Menüs usw. komplett abzuschalten.

7 Kommentare:

Unknown hat gesagt…

Hallo Stephan!

BestMatch V gibt es bereits ab 4GB RAM, nicht erst ab 8GB, wie Du schreibst. Man braucht aber ein 64bit Betriebssystem, damit die 4GB auch komplett verfügbar sind. :)

Grüße,
mav

Stephan Küpper hat gesagt…

Hallo Mav,

grundsätzlich richtig, aber nicht empfohlen. Die automatische Anwahl ist sich auch nicht immer sicher: mit 8 GB RAM habe ich auch schon BestMatch IV angeboten bekommen.

Im Moment rate ich aufgrund meiner Erfahrung zu BestMatch III; damit ist man auf der sicheren Seite.

Viele Grüße, Stephan

Unknown hat gesagt…
Dieser Kommentar wurde vom Autor entfernt.
Unknown hat gesagt…

Hallo liebe Experten,
kann mir einer mal erklären, warum es BestMatch IV und V gibt, wenn die Erkennungsgenauigkeit auch bei BM III nicht leidet?
Meine Erfahrung: Update auf Version 12 wandelte automatisch mein Sprachprofil in BM V um, trotz nur 2-Kern Prozessor und 4 GB RAM. Diktieren war zwar fast unmöglich, da äußerst zäh, aber die Erkennungsgenauigkeit phänomenal. Ich bin dann wieder auf BM IV umgestiegen. Geschwindigkeit beim Diktieren OK, aber Erkennungsgenauigkeit etwas schlechter.
Gruß, Wolfgang

Stephan Küpper hat gesagt…

Hallo Wolfgang,

So muss halt jeder für sich herausfinden, was am besten funktioniert. Ich habe keine spürbare Verschlechterung der Erkennung festgestellt, von anderen aber inzwischen auch gehört, dass sie mit einem BestMatch IV oder BestMatch V-Sprachmodell eine bessere (wenn auch manchmal langsamere) Erkennung haben.

Empfehlungen sind Empfehlungen, die sich auf Erfahrung, aber auch Praktikabilität gründen. Ich kann schlecht jedem Kunden empfehlen, er möge zunächst 3 verschiedene Sprecherprofile mit 3 Sprachmodellen anlegen, und dann das beste auswählen – das käme nicht gut an.

Die verschiedenen Sprachmodelle gibt es, weil sie die vorhandene Rechenleistung unterschiedlich ausnutzen. BestMatch III braucht einen Prozessorkern. BestMatch IV belegt 2 Prozessorkerne; BestMatch V belegt mehrere (ich weiß nicht, wie viele) Kerne, steuert die aber in anderer Weise an als BestMatch IV. Hat man keine oder nur wenige Sprachbefehle, ist BestMatch V auf einem entsprechend schnellen Rechner sicherlich zu empfehlen.

Viele Grüße, Stephan Küpper

Mailproxy hat gesagt…

Kann es sein, dass man bei DPI 15 gar nicht mehr wählen kann, welches Sprachmodell verwendet wird?

Mir wird keine derartige Option angeboten, wenn ich ein neues Benutzerprofil erstelle.

Stephan Küpper hat gesagt…

Die Version 15 hat einen komplett neuen Erkenner. Deswegen hat sich die Frage nach den Sprachmodellen erledigt. BestMatch V wurde sowieso nie vernünftig umgesetzt. Wie oben bereits diskutiert, lassen sich Unterschiede zwischen den einzelnen Sprachmodellen sowieso nur auf Erbsenzählerniveau feststellen. Viel wichtiger war die Frage nach der Verarbeitungsgeschwindigkeit, und da hatte BestMatch IV immer die Nase vorn.