baumi's blog

baumi's personal blog … Linux, OS X, Windows, Random things, …

pdf2xml compilieren

http://www.mobipocket.com/dev/pdf2xml/

1.:

 madmat@intranetserver:~/Work$ which pdf2xml
/usr/bin/pdf2xml

Ist das gleiche wie auf deinem g4 server. Hab einfach den ganzen Source-Tree genommen und probier ob es auf linux geht.. und siehe da es geht: Folgende Command Line habe ich verwendet:

g++ -Wall -I/usr/include/libpng12 -I/usr/lib/ -I ./xpdf/goo -I ./xpdf/xpdf -I ./image/zlib -I ./image/png -I ./xpdf/ -I ./xpdf/fofi/ -DPNG_NO_READ_SUPPORTED -DPNG_NO_MNG_FEATURES -o pdf2xml ./xpdf/goo/gmem.c ./xpdf/fofi/FoFiBase.cc ./xpdf/fofi/FoFiEncodings.cc ./xpdf/fofi/FoFiTrueType.cc ./xpdf/fofi/FoFiType1.cc ./xpdf/fofi/FoFiType1C.cc ./xpdf/goo/gfile.cc ./xpdf/goo/GHash.cc ./xpdf/goo/GList.cc ./xpdf/goo/gmempp.cc ./xpdf/goo/GString.cc ./xpdf/xpdf/Annot.cc ./xpdf/xpdf/Array.cc ./xpdf/xpdf/BuiltinFont.cc ./xpdf/xpdf/BuiltinFontTables.cc ./xpdf/xpdf/Catalog.cc ./xpdf/xpdf/CharCodeToUnicode.cc ./xpdf/xpdf/CMap.cc ./xpdf/xpdf/Decrypt.cc ./xpdf/xpdf/Dict.cc ./xpdf/xpdf/Error.cc ./xpdf/xpdf/FontEncodingTables.cc ./xpdf/xpdf/Function.cc ./xpdf/xpdf/Gfx.cc ./xpdf/xpdf/GfxFont.cc ./xpdf/xpdf/GfxState.cc ./xpdf/xpdf/GlobalParams.cc ./xpdf/xpdf/JArithmeticDecoder.cc ./xpdf/xpdf/JBIG2Stream.cc ./xpdf/xpdf/JPXStream.cc ./xpdf/xpdf/Lexer.cc ./xpdf/xpdf/Link.cc ./xpdf/xpdf/NameToCharCode.cc ./xpdf/xpdf/Object.cc ./xpdf/xpdf/Outline.cc ./xpdf/xpdf/OutputDev.cc ./xpdf/xpdf/Page.cc ./xpdf/xpdf/Parser.cc ./xpdf/xpdf/PDFDoc.cc ./xpdf/xpdf/PDFDocEncoding.cc ./xpdf/xpdf/PSTokenizer.cc ./xpdf/xpdf/SecurityHandler.cc ./xpdf/xpdf/Stream.cc ./xpdf/xpdf/UnicodeMap.cc ./xpdf/xpdf/XRef.cc pdf2xml.cpp -lpng

Das ist ziemlich genau das was auf der Website steht: “Once that is setup, simply compile and link all cpp files.” Irgendwas habe ich noch verändert damals bei deiner Mac Installation, das müsste man dann halt mal diff-en wenn da eine neue Version rauskommt. (Was ich nichgt g

Ist das hier: http://www.mobipocket.com/dev/pdf2xml/

2.: Es gibt ein zweites pdftoxml, ist eine SourceForge Projekt:
http://sourceforge.net/projects/pdf2xml/

ist installiert unter

madmat@intranetserver:~/Work/pdf2xml$ which pdftoxml
/usr/bin/pdftoxml

pdftoxml version 1.2
(Based on Xpdf version 3.02, Copyright 1996-2007 Glyph & Cog, LLC)
Copyright 2004-2006 XRCE
Usage: pdftoxml [options] <PDF-file> [<xml-file>]
  -f <int>               : first page to convert
  -l <int>               : last page to convert
  -verbose               : display pdf attributes
  -noText                : do not extract textual objects
  -noImage               : do not extract Images (Bitmap and Vectorial)
  -noImageInline         : do not include images inline in the stream
  -outline               : create an outline file xml
  -annots                : create an annotations file xml
  -cutPages              : cut all pages in separately files
  -blocks                : add blocks informations whithin the structure
  -fullFontName          : fonts names are not normalized
  -nsURI <string>        : add the specified namespace URI
  -opw <string>          : owner password (for encrypted files)
  -upw <string>          : user password (for encrypted files)
  -q                     : don’t print any messages or errors
  -v                     : print copyright and version info
  -h                     : print usage information
  -help                  : print usage information
  –help                 : print usage information
  -?                     : print usage information
  –saveconf <string>    : save all command line parameters in the specified XML <file>

vielleicht ist das stabiler und für eure Zwecke besser.. BTW: Bei dem Teil gabs ein kompiliertes Binary auf obiger Website…

Comments are currently closed.