005
26.06.2009, 16:50 Uhr
0xdeadbeef
Gott (Operator)
|
Abgesehen davon, dass HTML als Darstellungssprache sich nicht zur Datenspeicherung eignet und die Auswertung des Syntaxbaums sich deshalb schon schwierig gestalten wird, handelt es sich bei HTML nicht um eine reguläre Sprache, die du mit ein paar Textfunktionen auseinanderklamüsern könntest.
Es mag zwar möglich sein, mit PHP einen recdesc-Parser zu schreiben, aber es klingt für mich nach keiner besonders angenehmen Aufgabe. Unter Umständen würde ich hier auch schon zu einem Lexer greifen, und es graust mir davor, so etwas in PHP modellieren zu müssen.
Perl wäre denkbar, aber das auch nur, weil es im CPAN bereits einen HTML-Parser gibt. -- Einfachheit ist Voraussetzung für Zuverlässigkeit. -- Edsger Wybe Dijkstra Dieser Post wurde am 26.06.2009 um 16:52 Uhr von 0xdeadbeef editiert. |