19 Dezember 2008

Spracherkennung unter Linux als Open Source

Simon listens ist der Titel eines österreichischen Projekts, das unter Windows, aber auch unter Linux eine Open-Source-Spracherkennung zur Verfügung stellen will. Die erste Alpha-Version ist vor kurzem erschienen. Ein Video der Funktionsweise ist auf der Webseite abrufbar.

Bei Simon handelt es sich um eine einfach zu benutzende grafische Schnittstelle für die Spracherkennungs-Software Julius und das HTK-Toolkit. Die benötigten Wörterbücher holt Simon direkt aus dem Wiktionary, einem Wikipedia-Schwesterprojekt. Dateien importiert die Software im HADIFIX- oder HTK-Format. Simon trainiert die Sprache anhand einfacher Beispiele und erkennt so neue Wörter. Da Simon über das TCP/IP-Protokoll auf die Julius-Engine zugreift (die man separat startet), kann die Spracherkennung auf einem zentralen Server erfolgen.

Die Julius-Engine gibt es schon etwas länger, wobei sie als Erkenner zunächst sprachunabhängig entwickelt wurde, um Sprachmodelle beliebiger Sprachen aufzunehmen. Konkret gab es dort Entwicklungen für Japanisch und Englisch, beide noch nicht sehr weit fortgeschritten. Simon-Listens integriert nun ein deutsches Sprachmodell in die Engine, so dass auch Deutsch erkannt wird.

Simon Listens bezieht sich übrigens darauf, dass das Projekt ursprünglich angetreten ist, einem behinderten Jungen namens Simon den Zugang zum Computer zu ermöglichen. Unterstützer werden noch gesucht (mehr dazu hier). Gerade zur Weihnachtszeit doch eine schöne Sache!

(mit Informationen von http://www.linux-community.de/Internal/Nachrichten/Simon-freie-Spracherkennung-fuer-Linux

Keine Kommentare: