Aktuelles Resultat als CSV (vom 23. Oktober 11:00 Uhr)
retrieve-bgbl.pylädt PDF und HTML Version nachdata/bgblund Metadaten nachdata/metadataextract-info.pyextrahiert Metadaten aus PDF (Signatur-Zeitpunkt und Erstellungsdatum) nachdata/extractedretrieve-history.pysucht alle Änderungen des BGBl im konsolidierten Bundesrecht und schreibt sie nachdata/historycreate-csv.pyerstellt den Output aus obigen Daten
- In
retrieve-bgbl.pyist der Zeitraum für 2020 derzeit hard-coded. extract-info.pybenötigtpdfsigfür das Auslesen der Signatur-Daten undpdfinfofür die sonstigen Metadaten.create-csv.pyversucht, aus Inkraft- und Ausserkrafttretedatum in Verbindung mit dem Ausgabedatum sinnvolle Werte zu extrahieren.- Der reguläre Ausdruck in
extract-info.pyfür das Erkennen der Textstellen ist - wie sag' ich's - verbesserungsfähig.
Danke an https://twitter.com/MartinThuer für die willkommene Ablenkung.