Omnipage SDK für Linux

Omnipage SDK für Linux

Die Texterkennungssoftware OmniPage von Scansoft/Nuance ist aus der Windows- und Mac-Welt seit vielen Jahren bekannt. Der Hersteller von OmniPage bietet zwar (noch) keinen Linux-Port der Applikation an, allerdings ein OmniPage SDK, um damit eigene Texterkennungsprogramme zu basteln. Leider verrät der Hersteller auf seiner Webseite nichts über die Lizenzbedingungen. Es wäre schön, wenn man ihn dazu überreden könnte, das SDK der Opensource-Gemeinde auf eine ähnliche Weise zur Verfügung zu stellen wie Trolltech das Qt-Entwicklungs-Kit, mit einer Dual-Lizenz-Strategie.

Unter Linux gab es lange Zeit überhaupt keine OCR-Lösungen. Mittlerweile gibt es freie OCR-Software (etwa das von Google zu neuem Leben erweckte Tesseract), jedoch ist das Thema eine heikle Sache, da viele OCR-Programme – ob kommerziell oder frei einfach zu viele Fehler machen.

E-Mail Benachrichtigung
Benachrichtige mich zu:
6 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Kevin Krammer
19 Jahre her

Es gibt auch keine Informationen über die Lizenzbedingungen für das Windows SDK.

Vermutlich fällt neben den Kosten der Entwicklungslizenz auch noch eine Runtime Lizenz an.

Interessant wäre in erster Linie, ob der Ausgabeteil das OpenDocument Standardformat unterstützt, denn das würde die Integration in die meisten Zielprogramme deutlich vereinfachen.

GoaSkin
19 Jahre her
Reply to  Kevin Krammer

zu den Formaten steht unter Key Features folgendes auf der Webseite:

The OmniPage Capture SDK provides support for a wide range of image and application format support, including BMP, GIF, TIF, PDF, HTML, Microsoft Office formats, XML, Open eBook and more. New throughput capabilities provide significant advantages over other SDKs, allowing developers to achieve optimal image throughput for their applications.

OpenDocument ist nicht explizit erwähnt, kenne allerdings Open eBook nicht.

Kevin Krammer
19 Jahre her
Reply to  GoaSkin

Natürlich könnte es theoretisch in “…more” versteckt sein, oder die Webseiten wurden schon länger nicht mehr überarbeitet, aber ich gehe davon aus, daß es derzeit leider nicht unterstützt wird.

Vermutlich ist das aber nur eine Frage der Zeit, die steigende Popularität von OpenDocument vorallem im Verwaltungsbereich und im Kontext der Langzeitarchivierung machen das Format praktisch zu einem Muß für Dokumentdigitalisierer.

GoaSkin
19 Jahre her
Reply to  Kevin Krammer

Da steht was von XML, aber gibt es denn überhaupt einen XML-Standard für Dokumente? OpenDocument
basiert doch auf XML.

arebenti
19 Jahre her
Reply to  GoaSkin

Gute Frage. Einen Hammer und Dich verbindet auch die Eigenschaft, dass ihr aus Atomen besteht. Dich und einen Frosch verbindet z.B., dass ihr beide einen DNA-Bauplan habt.

XML erleichtert schon einiges, etwa die Lesbarkeit, die Strukturierung, das Einlesen des Formats, das Umwandeln. Aber jedes XML-basierende Format ist für sich eigenständig. Frösche in Menschen umwandeln, das geht nur im Märchen.

GoaSkin
19 Jahre her

gerade gelesen, daß Abbyy die Engine seiner OCR-Software FineReader ebenfalls in einer Linux-Version
zur Verfügung stellt.

http://www.golem.de/0609/47894.html

Nach oben