Tja, vor ein paar Monaten (ich denke, es war irgendein Monatswechsel) machte die Postbank ihr Online-Konto-Portal etwas schnieker, etwas mehr JavaScript und was weiß ich, mein Kontoauszugs-Page-Scraper tat jedenfalls ab sofort nicht mehr. Ich versuchte noch mal, meinen Baukasten einzusetzen, um die HTTP- und CGI-Verkehr zu loggen und die einzelnen Seiten zu speichern und einzeln zu betrachten. Aber ich scheiterte an einer Seite, deren JavaScript es quasi unmöglich machte, die Seite offline anzuschauen. Ich war diesbezüglich sehr entmutigt, und fasste den Entschluss, die Pflege dieses Scrapers aufzugeben.
Um weiter online an Kontoauszüge zu kommen, downloade ich inzwischen regelmäßig die CSV-Datei, die einem da angeboten wird. Das Übel: Bis zu diesem Download muss man sich erstmal durchklicken, Kontodetails eingeben etc. Und die CSV-Datei erhält für den Verwendungszweck auch die Mehrzeiligkeit nicht.
Hmm, inzwischen (mit etwas Abstand) kann mir der schlichte Gedanke, dass ich doch einfach mal für das Postbank-Online-Banking im Browser das JavaScript ausschalte. Ich war aber eigentlich total sicher, dass ich die Meldung “ohne Cookies und JavaScript geht hier gar nichts” zurückbekommen würde. Aber siehe da: Man bekommt bei der Postbank seinen Kontoauszug auch ohne JavaScript. Ich werde wohl gelegentlich einen neuen Anlauf nehmen, um quasi einen neuen Kontoauszugs-Page-Scraper für die Postbank zu schreiben. Ja, dieser Gedanke hätte mir schon sehr viel früher kommen können, nur einfach mal so, einfach weil man das im Zusammenhang mit Page-Scraping eben mal ausprobiert – aber irgendwie war dieser Gedanke eben blockiert.
Die Zeit, die ich für die Entwicklung investieren werde, wird vermutlich viel umfangreicher sein, als die Zeit, die ich bis zu meinem Lebensende bräuchte, um immer wieder die Kontodetails einzugeben – aber sei’s drum!
Update 2012-08-28:
Nein, im Firefox für die Postbank das JavaScript deaktivieren, mit LiveHTTPHeaders den HTTP-Verkehr loggen, passendes Perl-Script daraus generieren … – nach ca. 2 Stunden liefs. Ich bin verblüfft. Habe damit eines meiner beiden drängenden Home-Software-Probleme gelöst