Das Computerprogramm JEliza ist ein Gesprächssimulator, der nach eigenen Angaben die leistungsstärkste Deutsch sprechende künstliche Intelligenz, die den Prinzipien freier Software folgt, ist. Es handelt sich dabei um einen Konversationssimulator, also eine künstliche Intelligenz, mit der Unterhaltungen ermöglicht werden. Die erste Version erschien im Juni 2006.
JEliza ist in der Programmiersprache C++ geschrieben und verwendet Python 2.5 als Scriptsprache für die eigentliche Programmlogik. Es enthält ein einen Parser für Sätze, der eingegebene Fakten in seine semantischen Bestandteile aufteilt und ein semantisches Netz, mit dem Verknüpfungen zwischen diesen Begriffen hergestellt werden. Entspricht ein Satz also den Regeln, die auf der Website beschrieben werden, kann er logisch in das Netz eingebracht werden; der Mensch kann sie dann ebenfalls durch Eingaben wieder abfragen.
Im Auslieferungszustand enthält JEliza ein semantisches Netz mit über 30000 Begriffen und über 41000 Verbindungen; diese Technik wird seit Revision 1 verwendet. Da die bekannten Begriffe noch nicht optimal vernetzt sind, ist es die Aufgabe des Benutzers, seine JEliza-Kopie auf ein bestimmtes Themengebiet hin zu trainieren. Nach Angaben der Autoren im Entwicklertagebuch ist ein semantisches Netz optimal verknüpft, wenn jedes Wort in einem bestimmten Themengebiet über maximal vier bis fünf Zusammenhänge mit jedem anderen Wort verbunden ist.
Das Programm ist nach einem Server-Client-Prinzip aufgebaut. Der Server übernimmt die eigentlichen Antwortmechanismen, während der Benutzer mit dem Client interagiert. Es existiert ein auf Qt basierender GUI-Client für gewöhnliche Anwendungen, ein shell-basierter Client für Unix und Linux sowie ein auf PHP basierender Client zum Einbau in die eigene Website.
Nun ist JEliza in der neuen Revision 43 erschienen, in der das Limit von maximal einem Nebensatz mit einer Konjunktion aufgehoben wurde. Seit Revision 43 unterstützt JEliza die englische Sprache, wenn man in die Datei “temp\language.tmp” die beiden Buchstaben “en” statt “de” schreibt, was in Zukunft einfacher gelöst werden soll.




