/krautkoopf_lieferscraping

Automated import of supplier's articles to Foodsoft

Primary LanguagePythonMIT LicenseMIT

krautkoopf_lieferscraping

Automated import of supplier's articles to Foodsoft

Scripts for specific suppliers read data from the supplier's webshop (screen-scraping) or a spreadsheet etc. and transform it into a CSV which can be imported into Foodsoft. Foodsoft then compares existing articles of this supplier to the new list and shows a summary of changes, deleted articles, and new articles.

base sets the framework for the "scripts" in general and their configurations. It is neither connected to articles nor Foodsoft, so you could also write scripts for entirely different purposes.

web produces a simple web user interface for managing configurations, running script methods, and downloading the generated CSV.

foodsoft provides a connection to a Foodsoft instance via screen-scraping. (reused from task-rotation)

foodsoft_article offers a framework for dealing with articles in Foodsoft's model.

foodsoft_article_import offers a number of functions that may be useful when preparing articles to be imported.

script_generic_test_import is a sample which shows how a script can look like and demonstrates some of the features of the framework.

As a naming convention, scripts should be named: script_foodcoop_supplier_action.py

Requirements

python v3.8+

dill

pyYAML

beautifulsoup4

requests v2.24+

natsort 8.1.0+

bottle v0.12+ (for web interface)

babel (for web interface)

webdriver-manager 3.5.3+ (for Fairfood script)

selenium 4.1.3+ (for Fairfood script)

geopy 2.2.0+ (for supplier map script)

folium 0.12.1.post1+ (for supplier map script)

openpyxl 3.0.10+ (for Apfelland & HolperHof scripts)

tabula-py 2.5.1+ (for Lebenbauer & Renner scripts)

pandas 1.5.0+ (for Lebenbauer & Renner scripts)

Details

Da es in unserer Foodcoop Bedarf gab, den regelmäßigen Aufwand für das Bestellteam zu senken, habe ich ein Python-Skript geschrieben, das sämtliche Artikel einer bestimmten Lieferant_in ausliest (z.B. per Screenscraping aus dem Webshop, aus einer Exceltabelle wäre aber auch denkbar) und daraus eine CSV generiert, die in die Foodsoft importiert werden kann. Das Screenscraping bzw. Tabelle-auslesen muss natürlich je nach Lieferant/Webshop angepasst bzw. neu geschrieben werden, einige Funktionen (wie das Generieren der CSV) sind jedoch ausgelagert in „base“ und von allen Skripten abrufbar. Die CSV kann man daraufhin in der Foodsoft über den Button „Artikel hochladen“ (auf der Artikel-Seite des Lieferanten) importieren - dabei sollte man das Häkchen bei „Artikel löschen, die nicht in der hochgeladenen Datei sind“ setzen - woraufhin man eine Zusammenfassung aller Änderungen sieht und diese bestätigen oder korrigieren kann. Damit dort manuell vorgenommene Korrekturen/Umbenennungen nicht beim nächsten Ausführen des Skriptes wieder rückgängig gemacht werden, hat das Skript auch eine Anbindung an die Foodsoft, über die es sich die bisherige Artikel-CSV herunterlädt und mit der zuletzt erstellten CSV vergleicht. Daten, die seit dem letzten Auslesen gleich geblieben sind, in der Foodsoft aber anders stehen, werden dann aus der Foodsoft übernommen. Weitere Features:

  • Kategorien (z.B. im Webshop) und einzelne Artikel, die nicht importiert werden sollen
  • Gleichnamige Artikel umbenennen nach einem Attribut, in dem sie sich unterscheiden (Einheit, Hersteller, Herkunft) - z.B. 2x „Weizenmehl“ → „Weizenmehl (500g)“ und „Weizenmehl (1kg)“, da die Foodsoft gleichnamige Artikel nicht akzeptiert
  • Überlange Artikel-Daten (die das jeweilige Zeichenlimit der Foodsoft überschreiten) kürzen

Etwas Ähnliches wurde glaub ich schon mit den Shared Suppliers (sharedlists) versucht. Dies ist nun aber dafür gedacht, dass jede Foodcoop individuell Artikel importiert.