Höre meine Worte

Freie Spracherkennungs-Suite Simon in stabiler Version 0.2 erschienen

Freie Spracherkennungs-Suite Simon in stabiler Version 0.2 erschienen

Falko Benthin
13.07.2009 Knapp drei Jahre nach Entwicklungsstart ist mit der Version 0.2 die erste stabile Version der freien Spracherkennungssuite Simon erschienen. Dank ihr hört der Rechner auf's Wort und führt Befehle via "Zuruf" aus.

Anders als viele andere Spracherkennungen basiert Simon auf einem hybriden Modell aus neuronalen Netzwerken und HM-Modellen. Dadurch ist Simon nicht an ein bestimmtes Sprachmodell gekoppelt, sondern funktioniert nach einer Trainingsphase für jeden Sprecher individuell. Die Architektur von Simon, bestehend aus der Spracherkennungs-Engine Julius und dem HTK-Toolkit, sorgt dafür, dass die Spracherkennung mit jeder Aussprache, auch bei vorliegenden Sprachstörungen, funktioniert.

Durch die individuelle Trainingsphase eignet sich Simon als Eingabeschnittstelle für Personen mit eingeschränkter Motorik, was auch die Motivation hinter der Spracherkennungssuite ist. Dank der Client-Server-Technologie ist es möglich, dass ein Server die Spracherkennung für mehrere Rechner übernimmt.

Simon 0.2 setzt auf KDE4 auf und integriert sich in jedes KDE-Setup. Durch die Verwendung von KDE kann Simon auch auf KIO (KDE Input/-Output), und damit unter anderem auf transparente Netzwerk- und Kompressionsfunktionalitäten, zurückgreifen. Der in früheren Versionen verwendete Juliusd, ein Daemon, der auf Sprachbefehle lauert, wurde durch den leistungsfähigeren simond, ebenfalls ein Kommandozeilenprogramm, ersetzt, welcher auch Streamings durch das Netzwerk und via Plugins individuelle Trigger unterstützt.

Für Endanwender hat Simon mit ksimond ein grafisches Frontend dabei. Mit neuen Plugins für Listen, Kombinationen (Makros) und Nummerneingabe sowie einer künstlichen Intelligenz wurden die schon in früheren Simon-Versionen verwendeten Kommando-Plugins auf zehn erweitert.

Simon 0.2 kann neben Hadifix- und Wiktionary-Wörterbüchern auch Wörterbücher in den Formaten PLS und SPHINX lesen, was die Tür für Wörterbücher wie das deutsche GPL Wörterbuch von Voxforge öffnet. Für Simon 0.2 liegen aufgrund der steigenden Benutzeranzahl Lokalisierungen in Deutsch, Englisch und Französisch vor, tschechische, spanische und holländische Lokalisierungen sind teilweise vorgenommen worden. Simon 0.2 ist nicht nur die erste als stabil geltende Version, sondern auch das erste Simon, das mit einem deutschen oder englischen Anwenderhandbuch ausgeliefert wird.

Simon ist ein Projekt, welches auf Initiative von Franz Stieger ins Leben gerufen und von SchülerInnen der HTBLA Kaindorf umgesetzt wurde und wird. Mittlerweile kümmert sich der gemeinnützige Verein "simon listens" um die Entwicklung und Koordination des Projekts. Zukünftig ist eine Portierung auf den Mac geplant, personelle und finanzielle Unterstützung, auch durch einen Einkauf im Solidaritäts-Shop sind willkommen.

Die freie Spracherkennungssuite Simon 0.2 kann als Quelltext von der Projektwebseite herunter geladen werden. Neben den Quelltexten bieten die Entwickler auch Binärpakete für Ubuntu und Opensuse sowie für Microsoft Windows an.

Ähnliche Artikel

Kommentare
Steuern...schön und gut
Meo (unangemeldet), Freitag, 17. Juli 2009 09:34:56
Ein/Ausklappen

Steuern mit Simon geht ja schon sehr gut, doch was immernoch vielen Behinderten fehlt ist eine Speech2Text anwendung, die es mit Mickysoft Programmen aufnehmen kann.

So stelle ich mir doch die frage, warum man mit Simon "nur" steuern aber nicht Diktieren kann.


Bewertung: 152 Punkte bei 20 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Aktuelle Fragen

eeepc 1005HA externer sound Ausgang geht nicht
Dieter Drewanz, 18.03.2015 15:00, 0 Antworten
Hallo LC, nach dem Update () funktioniert unter KDE der externe Soundausgang an der Klinkenbuc...
AceCad DigiMemo A 402
Dr. Ulrich Andree, 15.03.2015 17:38, 2 Antworten
Moin zusammen, ich habe mir den elektronischen Notizblock "AceCad DigiMemo A 402" zugelegt und m...
Start-Job behindert Bootvorgang, Suse 13.2, KDE,
Wimpy *, 20.02.2015 10:32, 4 Antworten
Beim Bootvorgang ist ein Timeout von 1 Min 30 Sec. weil eine Partition sdb1 gesucht und nicht gef...
Konfiguration RAID 1 mit 2 SSDs: Performance?
Markus Mertens, 16.02.2015 10:02, 6 Antworten
Hallo! Ich möchte bei einer Workstation (2x Xeon E5-2687Wv3, 256GB RAM) 2 SATA-SSDs (512GB) al...
Treiber für Canon Laserbase MF5650
Sven Bremer, 10.02.2015 09:46, 1 Antworten
Hallo ich weiß mittlerweile das Canon nicht der beste Drucker für ein Linux System ist. Trotzd...