Home / Nachrichten / Msoscheme: Framework für Powerpoint-Umwandlung in XML bereit

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(179 Punkte bei 5 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)
Mageia 2 ist fertig
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Powerpoint-Parser

Msoscheme: Framework für Powerpoint-Umwandlung in XML bereit

22.09.2009 Durch die Übernahme von Trolltech und dem vermehrten Einsatz von Qt kommt der Office-Suite KOffice auf mobilen Geräten eine wachsende Bedeutung zu: es tut sich etwas.

Letzte Woche veröffentlichte der bei Nokia angestellte KOffice-Entwickler Thomas Zander in seinem Blog die Info, dass KOffice auf den künftigen Maemo-Versionen als Standard-Dokumentenbetrachter zum Einsatz kommen wird, praktisch gleichzeitig hat das KOffice-Team eine neue Beta-Version freigegeben, die unter anderem über einen deutlich verbesserten MS-Word-Importfilter verfügt.

Jetzt hat Jos van den Oever ein weiteres Stück Software geschrieben, um den Import von MS-Office-Dokumenten in KOffice zu verbessern: Einen Parser, der Powerpoint-Folien in XML umwandelt. Wie er in seinem Blog berichtet, besteht die Dokumentation zum Powerpoint-Format aus rund 660 Seiten, die Details zu den Grafiken (welche einen wichtigen Teil der Präsentationen ausmachen) umfassen weitere 620 Seiten.

Um sich nicht durch alle Seiten wälzen zu müssen, hat Van den Oever die Dokumentation in ein maschinenlesbares Format umgewandelt und daraus einen Parser entwickelt, der Powerpoint-Dateien ins XML-Format umwandelt. Über diese Methode lassen sich große Mengen von Powerpoint-Dateien einlesen und eventuelle Schwachstellen und Fehler finden. Das resultierende XML wiederum kann als Basis für einen Import-Filter benutzt werden.

Als Resultat steht nun das Qt-Programm ppttoxml zum Download bereit, welches einen C++- und Java-Parser enthält. Jos van den Oever bittet auch andere Entwickler, Parser für ihre Lieblingssprache zu schreiben, was mit weniger als 700 Zeilen Code erledigt werden könne.

Wer sich für Msoscheme interessiert und sich an der Entwicklung beteiligen möchte, kommt über folgende Befehle zum Quellcode und zum Binary:

git clone git://gitorious.org/msoscheme/msoscheme.git
mkdir msoscheme/cpp/build
cd msoscheme/cpp/build
cmake ..
make
./ppttoxml myfile.ppt myfile.xml

Treibende Kraft hinter den neuesten KOffice-Entwicklungen ist in erster Linie die von KOffice-Entwicklern gegründete KO GmbH, zu der auch Jos van den Oever gehört.

Einem Freund empfehlen    Druckansicht Bookmark and Share

Kommentare
Das verstehe ich nicht.
Wolfgang (unangemeldet), Dienstag, 22. September 2009 09:50:00
Ein/Ausklappen

Van den Oever nimmt ein Buch, wandelt den Inhalt in Nullen und Einsen um und fertig ist der Parser?!


Bewertung: 75 Punkte bei 5 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Das verstehe ich nicht.
max. (unangemeldet), Dienstag, 22. September 2009 10:42:44
Ein/Ausklappen

Also im Original steht folgendes:
It is easier to convert the documentation to a computer readable format and generate parsers for different situations from that. This is now being done in msoscheme. It comes with a big file called mso.xml which already contains a very large part of the documentation. From this file, a C++ and a Java parser are generated (Java, C++). Both parsers can deserialize ppt files to a runtime representation that can be the start for conversion to e.g. ODF.

Ich verstehe es zwar auch nicht ganz, aber vermutlich stimmt es, was der Artikel sagt.


Bewertung: 130 Punkte bei 6 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

799 Hits
Wertung: 149 Punkte (5 Stimmen)

Schlecht Gut

Infos zum Autor

Marcel Hilzinger

Marcel Hilzinger

Marcel Hilzinger arbeitet als Redakteur für die Zeitschriften LinuxUser und EasyLinux. Am liebsten schreibt er Artikel zu netten Gadgets oder Multimedia-Software. In seiner Freizeit spielt er gerne Kicker.

Zum Blog von Marcel Hilzinger →


Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...