Haus der Kulturen der Welt: warum haben die Web-Seiten des HKW keinen RSS-Feed mehr? egal, dann finde ich die Differenzen eben selbst heraus

Eigentlich würde ich gerne in meinem Feed-Reader herausfinden, dass es z.B. eine neue “kids&teens”-Veranstaltung gibt, aber die passende Seite hat keinen RSS-Feed mehr.

Aber … nach etwas (automatisierter) “HTML-Entschmutzung” (denn die Seite ist nicht valid im Sinne von XHTML) kann man sie mit XPath-Ausdrücken auswerten. Ich habe jetzt einen Jenkins-Job aufgesetzt, der die Veranstaltungsliste stündlich abfragt und gegen den vorigen Stand vergleicht. Und wenn es einen Unterschied gibt, bekomme ich den per XMPP aufs Smartphone.

Jetzt hat das HKW etwas mehr Last auf seinem Web-Server, aber wie sollte ich das sonst in den Griff bekommen?

Dieses Verfahren wende ich übrigens inzwischen mit wachsender Begeisterung auf verschiedene Web-Seiten (und nicht allein beim HKW) an. Faszinierend  😆


Comments

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.