3 06 2009
pdf2xml compilieren
http://www.mobipocket.com/dev/pdf2xml/
1.:
madmat@intranetserver:~/Work$ which pdf2xml
/usr/bin/pdf2xml
Ist das gleiche wie auf deinem g4 server. Hab einfach den ganzen Source-Tree genommen und probier ob es auf linux geht.. und siehe da es geht: Folgende Command Line habe ich verwendet:
g++ -Wall -I/usr/include/libpng12 -I/usr/lib/ -I ./xpdf/goo -I ./xpdf/xpdf -I ./image/zlib -I ./image/png -I ./xpdf/ -I ./xpdf/fofi/ -DPNG_NO_READ_SUPPORTED -DPNG_NO_MNG_FEATURES -o pdf2xml ./xpdf/goo/gmem.c ./xpdf/fofi/FoFiBase.cc ./xpdf/fofi/FoFiEncodings.cc ./xpdf/fofi/FoFiTrueType.cc ./xpdf/fofi/FoFiType1.cc ./xpdf/fofi/FoFiType1C.cc ./xpdf/goo/gfile.cc ./xpdf/goo/GHash.cc ./xpdf/goo/GList.cc ./xpdf/goo/gmempp.cc ./xpdf/goo/GString.cc ./xpdf/xpdf/Annot.cc ./xpdf/xpdf/Array.cc ./xpdf/xpdf/BuiltinFont.cc ./xpdf/xpdf/BuiltinFontTables.cc ./xpdf/xpdf/Catalog.cc ./xpdf/xpdf/CharCodeToUnicode.cc ./xpdf/xpdf/CMap.cc ./xpdf/xpdf/Decrypt.cc ./xpdf/xpdf/Dict.cc ./xpdf/xpdf/Error.cc ./xpdf/xpdf/FontEncodingTables.cc ./xpdf/xpdf/Function.cc ./xpdf/xpdf/Gfx.cc ./xpdf/xpdf/GfxFont.cc ./xpdf/xpdf/GfxState.cc ./xpdf/xpdf/GlobalParams.cc ./xpdf/xpdf/JArithmeticDecoder.cc ./xpdf/xpdf/JBIG2Stream.cc ./xpdf/xpdf/JPXStream.cc ./xpdf/xpdf/Lexer.cc ./xpdf/xpdf/Link.cc ./xpdf/xpdf/NameToCharCode.cc ./xpdf/xpdf/Object.cc ./xpdf/xpdf/Outline.cc ./xpdf/xpdf/OutputDev.cc ./xpdf/xpdf/Page.cc ./xpdf/xpdf/Parser.cc ./xpdf/xpdf/PDFDoc.cc ./xpdf/xpdf/PDFDocEncoding.cc ./xpdf/xpdf/PSTokenizer.cc ./xpdf/xpdf/SecurityHandler.cc ./xpdf/xpdf/Stream.cc ./xpdf/xpdf/UnicodeMap.cc ./xpdf/xpdf/XRef.cc pdf2xml.cpp -lpng
Das ist ziemlich genau das was auf der Website steht: “Once that is setup, simply compile and link all cpp files.” Irgendwas habe ich noch verändert damals bei deiner Mac Installation, das müsste man dann halt mal diff-en wenn da eine neue Version rauskommt. (Was ich nichgt g
Ist das hier: http://www.mobipocket.com/dev/pdf2xml/
2.: Es gibt ein zweites pdftoxml, ist eine SourceForge Projekt:
http://sourceforge.net/projects/pdf2xml/
ist installiert unter
madmat@intranetserver:~/Work/pdf2xml$ which pdftoxml
/usr/bin/pdftoxml
pdftoxml version 1.2
(Based on Xpdf version 3.02, Copyright 1996-2007 Glyph & Cog, LLC)
Copyright 2004-2006 XRCE
Usage: pdftoxml [options] <PDF-file> [<xml-file>]
-f <int> : first page to convert
-l <int> : last page to convert
-verbose : display pdf attributes
-noText : do not extract textual objects
-noImage : do not extract Images (Bitmap and Vectorial)
-noImageInline : do not include images inline in the stream
-outline : create an outline file xml
-annots : create an annotations file xml
-cutPages : cut all pages in separately files
-blocks : add blocks informations whithin the structure
-fullFontName : fonts names are not normalized
-nsURI <string> : add the specified namespace URI
-opw <string> : owner password (for encrypted files)
-upw <string> : user password (for encrypted files)
-q : don’t print any messages or errors
-v : print copyright and version info
-h : print usage information
-help : print usage information
–help : print usage information
-? : print usage information
–saveconf <string> : save all command line parameters in the specified XML <file>
vielleicht ist das stabiler und für eure Zwecke besser.. BTW: Bei dem Teil gabs ein kompiliertes Binary auf obiger Website…
Comments are currently closed.