wäre das nicht toll, wenn jedes Ladengeschäft seine Öffnungszeiten mit URL (und XPath-Ausdruck) angäbe?

Und durch die URL kommt man jetzt nicht auf eine ausschweifige Seite sondern genau auf die gesuchte Information. Jedenfalls sollte man zusammen mit dem XPath-Ausdruck die gesuchte Information präzise finden können. Der “relative Anteil” der URL (um auf die Öffnungszeiten) könnte auch gerne standardisiert sein  😆 . Müssten an meiner Herangehensweise nicht Unternehmen wie Facebook… Continue reading wäre das nicht toll, wenn jedes Ladengeschäft seine Öffnungszeiten mit URL (und XPath-Ausdruck) angäbe?

Öffnungszeiten des Kofferhaus Witt (Berlin) – mit XPath extrahiert

http://www.kofferhaus-witt.de $ curl –location http://www.kofferhaus-witt.de > kofferhaus-witt.html # tja, leider ist auch dieses HTML kein ordentliches XML, # also müssen wir es erst einmal in Ordnung bringen: $ xml fo –recover –html kofferhaus-witt.html > kofferhaus-witt.html.xml # ein wenig Suche …, # und hier ist der passende XPath: $ xml sel -t -c “html/body/footer/div/div/div[@class=’col-md-3′]/p[3]” –nl kofferhaus-witt.html.xml… Continue reading Öffnungszeiten des Kofferhaus Witt (Berlin) – mit XPath extrahiert