Freie Spracherkennungs-Suite Simon in stabiler Version 0.2 erschienen

Freie Spracherkennungs-Suite Simon in stabiler Version 0.2 erschienen

Höre meine Worte

Falko Benthin
13.07.2009 Knapp drei Jahre nach Entwicklungsstart ist mit der Version 0.2 die erste stabile Version der freien Spracherkennungssuite Simon erschienen. Dank ihr hört der Rechner auf's Wort und führt Befehle via "Zuruf" aus.

Anders als viele andere Spracherkennungen basiert Simon auf einem hybriden Modell aus neuronalen Netzwerken und HM-Modellen. Dadurch ist Simon nicht an ein bestimmtes Sprachmodell gekoppelt, sondern funktioniert nach einer Trainingsphase für jeden Sprecher individuell. Die Architektur von Simon, bestehend aus der Spracherkennungs-Engine Julius und dem HTK-Toolkit, sorgt dafür, dass die Spracherkennung mit jeder Aussprache, auch bei vorliegenden Sprachstörungen, funktioniert.

Durch die individuelle Trainingsphase eignet sich Simon als Eingabeschnittstelle für Personen mit eingeschränkter Motorik, was auch die Motivation hinter der Spracherkennungssuite ist. Dank der Client-Server-Technologie ist es möglich, dass ein Server die Spracherkennung für mehrere Rechner übernimmt.

Simon 0.2 setzt auf KDE4 auf und integriert sich in jedes KDE-Setup. Durch die Verwendung von KDE kann Simon auch auf KIO (KDE Input/-Output), und damit unter anderem auf transparente Netzwerk- und Kompressionsfunktionalitäten, zurückgreifen. Der in früheren Versionen verwendete Juliusd, ein Daemon, der auf Sprachbefehle lauert, wurde durch den leistungsfähigeren simond, ebenfalls ein Kommandozeilenprogramm, ersetzt, welcher auch Streamings durch das Netzwerk und via Plugins individuelle Trigger unterstützt.

Für Endanwender hat Simon mit ksimond ein grafisches Frontend dabei. Mit neuen Plugins für Listen, Kombinationen (Makros) und Nummerneingabe sowie einer künstlichen Intelligenz wurden die schon in früheren Simon-Versionen verwendeten Kommando-Plugins auf zehn erweitert.

Simon 0.2 kann neben Hadifix- und Wiktionary-Wörterbüchern auch Wörterbücher in den Formaten PLS und SPHINX lesen, was die Tür für Wörterbücher wie das deutsche GPL Wörterbuch von Voxforge öffnet. Für Simon 0.2 liegen aufgrund der steigenden Benutzeranzahl Lokalisierungen in Deutsch, Englisch und Französisch vor, tschechische, spanische und holländische Lokalisierungen sind teilweise vorgenommen worden. Simon 0.2 ist nicht nur die erste als stabil geltende Version, sondern auch das erste Simon, das mit einem deutschen oder englischen Anwenderhandbuch ausgeliefert wird.

Simon ist ein Projekt, welches auf Initiative von Franz Stieger ins Leben gerufen und von SchülerInnen der HTBLA Kaindorf umgesetzt wurde und wird. Mittlerweile kümmert sich der gemeinnützige Verein "simon listens" um die Entwicklung und Koordination des Projekts. Zukünftig ist eine Portierung auf den Mac geplant, personelle und finanzielle Unterstützung, auch durch einen Einkauf im Solidaritäts-Shop sind willkommen.

Die freie Spracherkennungssuite Simon 0.2 kann als Quelltext von der Projektwebseite herunter geladen werden. Neben den Quelltexten bieten die Entwickler auch Binärpakete für Ubuntu und Opensuse sowie für Microsoft Windows an.

Ähnliche Artikel

Kommentare
Steuern...schön und gut
Meo (unangemeldet), Freitag, 17. Juli 2009 09:34:56
Ein/Ausklappen

Steuern mit Simon geht ja schon sehr gut, doch was immernoch vielen Behinderten fehlt ist eine Speech2Text anwendung, die es mit Mickysoft Programmen aufnehmen kann.

So stelle ich mir doch die frage, warum man mit Simon "nur" steuern aber nicht Diktieren kann.


Bewertung: 300 Punkte bei 94 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Aktuelle Fragen

Internet abschalten
Karl-Heinz Hauser, 20.02.2018 20:10, 0 Antworten
In der Symbolleiste kann man das Kabelnetzwerk ein und ausschalten. Wie sicher ist die Abschaltu...
JQuery-Script läuft nicht mit Linux-Browsern
Stefan Jahn, 16.02.2018 12:49, 2 Antworten
Hallo zusammen, ...folgender goldener Code (ein jQuery-Script als Ergebnis verschiedener Exper...
XSane-Fotokopie druckt nicht mehr
Wimpy *, 30.01.2018 13:29, 2 Antworten
openSuse 42.3 KDE 5.8.7 Seit einem Software-Update druckt XSane keine Fotokopie mehr aus. Fehler...
TOR-Browser stürzt wegen Wikipedia ab
Wimpy *, 27.01.2018 14:57, 0 Antworten
Tor-Browser 7.5 based on Mozilla Firefox 52.8.0 64-Bit. Bei Aufruf von http: oder https://de.wi...
Wifikarte verhindert Bootvorgang
Maik Kühn, 21.01.2018 22:23, 1 Antworten
iwlwifi-7265D -26 failed to load iwlwifi-7265D -25 failed to load iwlwifi-7265D -24 failed to l...