003
08.09.2005, 02:30 Uhr
Hans
Library Walker (Operator)
|
Zitat von Österreini: |
Wir müssen pdf-Files ... auslesen und interpretieren können.
|
Hi, da wird Euch nichts anderes übrig bleiben, als das Ihr Euch eingehend mit der Spezifikation dieses Dateiformats auseinander setzt. Die Spezifikation findet Ihr hier.
Zitat: |
Naja ... wollte wissen ob das mit C# möglich sein wird ...
|
Natürlich geht das, - die verwendete Programmiersprache ist dabei egal. Viel wichtiger ist, das Ihr wisst, was Ihr tut, d.h. das Ihr wisst, wie der Inhalt einer PDF-Datei zu deuten ist.
Zitat: |
oder ob ihr denkt, dass das self-made konvertieren scheitern wird, zumal ein pdf-File in txt konvertiert beim ersten mal nicht wirklich sinnhaftig erscheint ^^
|
Ich weis ja nicht, wie Ihr das gemacht habt, aber um dabei erfolgreich zu sein, muss man z.B. wissen, das die Texte in PDF-dateien mit dem LZH- oder einem ähnlichen Algo komprimiert sind. Das erfährt man z.B. aus der Spezifikation... Ansonsten findet Ihr im Wikipedia-Artikel über PDF noch Verweise zu Programmbibliotheken zur Arbeit mit PDF. Oder seht mal bei Source Forge nach...
Hans -- Man muss nicht alles wissen, aber man sollte wissen, wo es steht. Zum Beispiel hier: Nachdenkseiten oder Infoportal Globalisierung. |