Zwiegespräch
Spracherkennungssystem "Simon listens"
Fazit
Am Projekt Simon arbeiten zur Zeit nur wenigen Entwickler mit. Aber bereit in der Alpha-Version bringt es eine reiche Vielfalt an Funktionen mit. Um allerdings richtig mit Simon zu arbeiten, kommen Sie nicht um einen langes Training herum. Die Software belohnt Sie aber dafür am Ende mit einer hohen Trefferquote beim Erkennen von Sprache.
Zum Zeitpunkt des Tests gab es noch einige kleine Probleme mit dem Kodieren von Umlauten und seltene Programmabstürze. Nichts desto trotz lieferte das Programm viele erfreuliche Erfolge. Die Entwicklern reagierten zudem sehr schnell auf das Feedback der Tester und behoben eine Vielzahl von Fehler.
Entwickelt sich Simon in diesem Tempo weiter und stoßen vielleicht noch mehr Entwickler zu dem jungen Team, geht der Traum von einer freien, gut funktionierenden Spracherkennungssoftware womöglich bald in Erfüllung.
Simon braucht Hilfe
Um die Entwicklung von Simon weiter voranzubringen brauchen die Entwickler und der Verein weitere Hilfen. Finanziellen Zuwendungen bezieht das Projekt aus Spenden sowie aus dem Verkauf von Artikeln aus dem Online-Shop [11]. Weiterhin sucht das Projekt Interessierte, die die Software testen und weiterentwickeln. Entwickler sollten vor allem Kenntnissen in C++ und Qt 4 mitbringen. Auch weitere Lokalisierungen sind erwünscht.
Glossar
HTK-Toolkit
Eine vom Machine Intelligence Laboratory – besser bekannt als Speech Vision and Robotics Group – des Cambridge University Engineering Department (CUED) entwickelte Toolbox, die unter anderem beim Erkennen von Sprachmustern zum Einsatz kommt.
Hadifix
Ein vom Institut für Kommunikationsforschung und Phonetik der Universität Bonn entwickeltes Sprachsynthesesystem. Es erzeugt aus einer orthografischen Eingabe ein Sprachsignal, dessen Abschnitte sich in Halbsilben, Diphone und Suffixe aufteilt. Hadifix-Bomb ist ein maschinenlesbares deutsches Aussprachewörterbuch in der Sampa-Notation, das zusätzlich Silbengrenzen und Wortformen enthält.
Sampa
Ein computerlesbares phonemisches Alphabet.
Haupttrigger
Schlüsselwort, mit dem Sie in Simon aus der Texteingabe per Sprache in einen Modus wechseln, in dem Sie verbale Steuerbefehle an den Rechner absetzen.
[1] Simon-Projektwebsite: http://simon-listens.org
[2] Julius-Sprachengine: http://julius.sourceforge.jp/en_index.php
[3] HTK-Toolkit: http://htk.eng.cam.ac.uk/
[4] Höhere Technische Bundeslehranstalt Kaindorf: http://www.htl-kaindorf.ac.at/
[5] Freie Wörterbücher: http://de.wiktionary.org/wiki/Wiktionary:Hauptseite
[6] Interactive Speech Technology Consortium: http://www.astem.or.jp/istc/index_e.html
[7] HTK-Download: http://htk.eng.cam.ac.uk/download.shtml
[8] Simon: http://sourceforge.net/project/showfiles.php?group_id=190872
[9] Fehlerbereinigte Wörterbücher der Uni Bonn: http://www.ifk.uni-bonn.de/forschung/abteilung-sprache-und-kommunikation/phonetik/sprachsynthese
[10] Sampa http://www.phon.ucl.ac.uk/home/sampa/
[11] Simon-Hardwareshop: http://shop.Simon-listens.org
[12] Dsnoop: http://alsa.opensrc.org/Dsnoop



