Herzlich Willkommen, lieber Gast!
  Sie befinden sich hier:

  Forum » C / C++ (ANSI-Standard) » Projekt: Werte runterladen, parsen

Forum | Hilfe | Team | Links | Impressum | > Suche < | Mitglieder | Registrieren | Einloggen
  Quicklinks: MSDN-Online || STL || clib Reference Grundlagen || Literatur || E-Books || Zubehör || > F.A.Q. < || Downloads   

Autor Thread - Seiten: > 1 <
000
25.06.2009, 10:15 Uhr
~Dr. Planlos
Gast


Hallo Miteinander

Eine Projektarbeit steht bevor und ich möchte vor beginn die Machbarkeit abklären.
Grundsätzlich werden zwei Programme erstellt. Ich erzähl euch mal nur vom ersten:
Ein Deinst (C++ Progrämmchen) welcher in regelmässigen zeitlichen Abständen Werte aus dem Internet abruft und diese in eine File speichert. Die Werte die ich suche finde ich in HTML-Quelltexten.

Wie ist das ganze für einen Anfänger wie mich am einfachsten zu realisieren ohne mich monatelang in Materie einzuarbeiten?...hab mir das etwa so vorgestellt: Step 1: Quelltext runterladen und in .txt speichern was alle X Minuten überschrieben wird. Step 2: jeden aktualisieren Quelltext parsen. Step 3: Gefundenen Wert speichern.

So machbar? oder einfacher? oder anderst?

wenn so machbar: zu Step 1 hab ich keine Ideen wie das gemacht werden soll. Auch mit dem gefunden auf Google werd ich nicht wirklich schlau. Kann mir jemand den Weg in die richtige und möglichst einfache Richtung weisen?
Step 2u.3: scheint machbar. und sonst meld ich mich nochmals.

Freundliche Grüsse
Dr.Planlos
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
001
25.06.2009, 13:15 Uhr
0xdeadbeef
Gott
(Operator)


Schritt 3 ist simpler Kleinkram. Schritt 1 ist unkritisch, wenn es keine ganz fiesen Sonderfälle gibt. Am einfachsten ginge das wohl mit cURLpp.

Schritt 2 dagegen kann abhängig davon, was du eigentlich parsen willst, ausgesprochen haarig werden. Was willst du eigentlich parsen?
--
Einfachheit ist Voraussetzung für Zuverlässigkeit.
-- Edsger Wybe Dijkstra
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
002
26.06.2009, 10:54 Uhr
öni



Wäre es nicht einfacher das ganze in php zu machen? Da hat man für sowas ja schon fertige Funktionen, oder ist C++ zwingend?
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
003
26.06.2009, 14:08 Uhr
0xdeadbeef
Gott
(Operator)


Du willst nen Parser in PHP schreiben?
--
Einfachheit ist Voraussetzung für Zuverlässigkeit.
-- Edsger Wybe Dijkstra
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
004
26.06.2009, 15:36 Uhr
öni



Kommt drauf an was die Seite für einen Aufbau hat. Wenn es stupide Dinge sind, könnte man doch mittels Funktion die tags aussortieren, dann bleibt reiner Text übrig, der man dann verarbeiten kann.

In C++ müsste man den ganzen HTML kram erst mal ignorieren.
Und warum sollte man in php nicht so gut parsen können wie in C++?
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
005
26.06.2009, 16:50 Uhr
0xdeadbeef
Gott
(Operator)


Abgesehen davon, dass HTML als Darstellungssprache sich nicht zur Datenspeicherung eignet und die Auswertung des Syntaxbaums sich deshalb schon schwierig gestalten wird, handelt es sich bei HTML nicht um eine reguläre Sprache, die du mit ein paar Textfunktionen auseinanderklamüsern könntest.

Es mag zwar möglich sein, mit PHP einen recdesc-Parser zu schreiben, aber es klingt für mich nach keiner besonders angenehmen Aufgabe. Unter Umständen würde ich hier auch schon zu einem Lexer greifen, und es graust mir davor, so etwas in PHP modellieren zu müssen.

Perl wäre denkbar, aber das auch nur, weil es im CPAN bereits einen HTML-Parser gibt.
--
Einfachheit ist Voraussetzung für Zuverlässigkeit.
-- Edsger Wybe Dijkstra

Dieser Post wurde am 26.06.2009 um 16:52 Uhr von 0xdeadbeef editiert.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
Seiten: > 1 <     [ C / C++ (ANSI-Standard) ]  


ThWBoard 2.73 FloSoft-Edition
© by Paul Baecher & Felix Gonschorek (www.thwboard.de)

Anpassungen des Forums
© by Flo-Soft (www.flo-soft.de)

Sie sind Besucher: