12 Oktober 2011

iPhone 4S mit Siri-Sprachsteuerung

Das neue iPhone 4S, das in den nächsten Tagen auf den Markt kommt, verfügt über einen "Siri" genannten Sprachassistenten, der Steuerung der Geräts, Suchen und auch Diktat erlaubt. (Zur Erinnerung: Apple hatte Siri vor einiger Zeit gekauft.) Die Spracheingabe dürfte zu den spektakuläreren Neuerungen gehören, da sie nicht mehr als App geladen wird wie das hinlänglich besprochene Dragon Dictate für iPhone, sondern fest im Betriebssystem verdrahtet ist. Die meisten Beprechungen, die ich bisher gelesen habe, erwähnen sie auch an prominenter Stelle; jedoch scheint den Rezensenten am wichtigsten zu sein, dass das neue Gerät immer noch so aussieht wie das alte - Apple verkauft halt über Design.

Eingehend bespricht Siri der Heise-Bericht über das iPhone 4S. Dort gibt es auch ein Video: Siri in Aktion in lauter Umgebung.

M. Spehr von der FAZ hat Siri im Auto ausprobiert. Sein Fazit in faz.net:

Die Erkennung ist deutlich leistungsfähiger als das Pendant von Nuance mit der Dragon-Dictation-App, obwohl die Software vermutlich von Nuance stammt... Siri ... ist großartig.

Wie Dragon Dictate auch findet die Siri-Erkennung auf einem Remote-Server statt. Zu allfälligen Sicherheitsbedenken will ich mich hier nicht verbreiten - nur: wer Spracheingabe in der Öffentlichkeit nutzt, hat genug Mithörer, auch ohne sich über Spionageserver Gedanken machen zu müssen.

Sprachbefehle besser nutzen mit der Dragon-Randleiste (Sidebar)

Die Dragon-Randleiste gibt es schon lange. Früher öffnete der Befehl "Was kann ich sagen" einen schlicht gestalteten Kasten mit den wesentlichen Befehlen für die gerade aktive Anwendung; seit Version 11 ist die Randleiste optisch auffälliger gestaltet und enthält mehrere Kategorien, u.a. die selbst erstellten Befehle. Nuance hat jetzt eine Umfrage (englisch) gestartet, ob und wie die Anwender von Dragon NaturallySpeaking die Randleiste nutzen. Nehmen Sie teil!

Sie kennen die Sidebar gar nicht? Über das Menü "Extras - Optionen - weitere Einstellungen können Sie sie einblenden. Ich empfehle, sie "frei beweglich" zu halten. Das geht durch Rechtsklick auf die Randleiste; im sich öffnenden Menü können Sie die Position auswählen.

Praktisch ist die Dragon-Randleiste auch für alle, die eigene Befehle programmiert haben: über die Registerkarte "Eigene Befehle" können Sie sich alle selbst programmierten Befehle anzeigen lassen. Auch wer von seinem Dragon NaturallySpeaking-Händler Steuerungsbefehle für seine Anwendungen erhalten hat, kann diese hier einsehen.

Und weil man selbst ja auch immer wieder Neues entdeckt, fand ich in der Randleiste eine Liste der Befehle, mit der sich die Maus per Sprache bewegen lässt. Dies ist sicherlich nicht für alle interessant, aber wer in der Bewegung seiner Hand eingeschränkt ist oder (wie ich) gelegentlich Schmerzen beim Mausschubsen hat, findet diese vielleicht ganz hilfreich.

Dabei ist übrigens noch zu ergänzen, dass man in vielen Programmen die Programmmenüs und Schaltflächen per Sprache ansprechen kann, indem man einfach „klick“ und dann den Namen der Schaltfläche sagt. Dies funktioniert z.B. in Microsoft Word und Outlook, aber auch in Mozilla Firefox.

Genauso lassen sich alle installierten Anwendungen per Sprachbefehl öffnen, indem man „öffne“ und dann den Namen der Anwendung sagt, und zwar so, wie er im Windows-Startmenü eingetragen ist. Gängige Microsoft Office-Anwendungen kann man auch einfach mit ihrem Kurznamen aufrufen, also z.B. „öffne Microsoft Word“. Einfach ausprobieren!

Ach so: man schließt die Dragon-Randleiste über den Befehl „Randleiste schließen“.