Herzlich Willkommen, lieber Gast!
  Sie befinden sich hier:

  Forum » Allgemeines (OffTopic) » PDF-File mit Grafiken auslesen

Forum | Hilfe | Team | Links | Impressum | > Suche < | Mitglieder | Registrieren | Einloggen
  Quicklinks: MSDN-Online || STL || clib Reference Grundlagen || Literatur || E-Books || Zubehör || > F.A.Q. < || Downloads   

Autor Thread - Seiten: > 1 <
000
07.09.2005, 19:56 Uhr
Österreini



Hallo!
(Ich hoffe mal ich bin hier richtig ^^ [Topic])

Nachdem bei uns in 1er Woche die Schule wieder anfängt und da unser neues Projekt startet ... mal ne Frage bezüglich realisierbarkeit:

Wir müssen pdf-Files (Ausstattungs-Angaben von Autos), die auch Grafiken [Grafik-Punkte] enthalten, auslesen und interpretieren können.
Wir hätten jetzt schon ein paar Converter pdf->html oder pdf->doc gesucht, aber nicht wirklich was Brauchbares gefunden (uA weil da OCR-Software dabei war, das ja echt schwachsinnig is irgendwie) ...

Naja ... wollte wissen ob das mit C# möglich sein wird ... mit Hilfe von RegEx ... oder ob ihr denkt, dass das self-made konvertieren scheitern wird, zumal ein pdf-File in txt konvertiert beim ersten mal nicht wirklich sinnhaftig erscheint ^^
--

Your Anime & Manga-Source ->
www.ani-area.de
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
001
07.09.2005, 20:36 Uhr
Pablo
Supertux
(Operator)


-->
--
A! Elbereth Gilthoniel!
silivren penna míriel
o menel aglar elenath,
Gilthoniel, A! Elbereth!
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
002
07.09.2005, 21:54 Uhr
FloSoft
Medialer Over-Flow
(Administrator)


ähm das das ocr software ist ist auch richtig, schliesslich ist jede pdf-seite nichts weiter als ein Bild. (OK, natürlich kommt es darauf an was drin ist, meist wird der text dann inklusive schrift eingebettet)
--
class God : public ChuckNorris { };
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
003
08.09.2005, 02:30 Uhr
Hans
Library Walker
(Operator)



Zitat von Österreini:
Wir müssen pdf-Files ... auslesen und interpretieren können.


Hi,
da wird Euch nichts anderes übrig bleiben, als das Ihr Euch eingehend mit der Spezifikation dieses Dateiformats auseinander setzt. Die Spezifikation findet Ihr hier.


Zitat:
Naja ... wollte wissen ob das mit C# möglich sein wird ...

Natürlich geht das, - die verwendete Programmiersprache ist dabei egal. Viel wichtiger ist, das Ihr wisst, was Ihr tut, d.h. das Ihr wisst, wie der Inhalt einer PDF-Datei zu deuten ist.


Zitat:
oder ob ihr denkt, dass das self-made konvertieren scheitern wird, zumal ein pdf-File in txt konvertiert beim ersten mal nicht wirklich sinnhaftig erscheint ^^


Ich weis ja nicht, wie Ihr das gemacht habt, aber um dabei erfolgreich zu sein, muss man z.B. wissen, das die Texte in PDF-dateien mit dem LZH- oder einem ähnlichen Algo komprimiert sind. Das erfährt man z.B. aus der Spezifikation...
Ansonsten findet Ihr im Wikipedia-Artikel über PDF noch Verweise zu Programmbibliotheken zur Arbeit mit PDF. Oder seht mal bei Source Forge nach...

Hans
--
Man muss nicht alles wissen, aber man sollte wissen, wo es steht. Zum Beispiel hier: Nachdenkseiten oder Infoportal Globalisierung.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
004
08.09.2005, 19:45 Uhr
~f.-th.
Gast


ich hab es nicht getestet: open office soll auch einiges mit PDF anfangen können.
wenn ihr keinen schnellen internet-zuganghabt. vielleicht hat einer der mitschüler
eine entsprechende zeitschriften-cd.

mfg f.-th.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
005
09.09.2005, 00:34 Uhr
Hans
Library Walker
(Operator)


Hi,

Open Office kann Dokumente zwar auch als PDF abspeichern, aber nicht zur weiterbearbeitung öffnen. Und selbst wenn das gehen würde, wäre es wahrscheinlich nicht sehr hilfreich, denn so wie ich ihn verstanden hab, will er ja einzelne Teile aus der Datei heraus suchen, und diese dann weiter verarbeiten. Da führt meiner Ansicht nach kein Weg an die Spezifikation vorbei...

Aber sehr wahrscheinlich brauchen sie gar nicht die ganze Spezifikation, sondern kommen mit den Informationen aus, die sie hier finden.

Hans



--
Man muss nicht alles wissen, aber man sollte wissen, wo es steht. Zum Beispiel hier: Nachdenkseiten oder Infoportal Globalisierung.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
006
10.09.2005, 16:23 Uhr
Österreini



Hm hm ... also ich danke schon mal gaaanz herzlich ...

Sowas hilft weiter ^^ ....

specialThx 2 Hans *
--

Your Anime & Manga-Source ->
www.ani-area.de
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
007
15.09.2005, 16:11 Uhr
Österreini



Noja ... wollte nur sagen, dass uns das mit dem selber auslesen zu steil ist ...

Die Converter funktionieren zwar alle, fallen aber bei einer kleinen Grafik drüber ... dh. sie ignorieren die .... [sind kleine, schwarze Punkte]...

Auf alle Fälle müssen wir in 2 Wochen die Anforderungsanalyse fertig haben ... und uns im Klaren sein, ob wir das schaffen oder nicht ^^ .... zum Glück unterstützt uns der 2. Projektentwicklungs-Lehrer ... der andere läuft eigentlich immer nur mies gelaunt rum, meckert und kritisiert die ganze Zeit ^^ ....
--

Your Anime & Manga-Source ->
www.ani-area.de
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
Seiten: > 1 <     [ Allgemeines (OffTopic) ]  


ThWBoard 2.73 FloSoft-Edition
© by Paul Baecher & Felix Gonschorek (www.thwboard.de)

Anpassungen des Forums
© by Flo-Soft (www.flo-soft.de)

Sie sind Besucher: