Python-basierter Exporter für die Umwandlung von BSVP zu CSV Dateien.
Trello: https://trello.com/b/ug9q2Eif/bsvp
Diese README sieht komisch aus? Dann öffne sie mit einem Editor mit Markdown-Erweiterung (z.B. Notepad++) oder mit einem Online-Viewer (z.B. Github).
Bei Fragen und Problemen mit dem Export meldet euch gerne bei mir unter tamaraslosarek@gmail.com.
Um die Exporter ausführen zu können, werden lediglich der Inhalt des setup
Ordners und Docker benötigt (Windows Installer: https://docs.docker.com/docker-for-windows/install/).
Konfigurationsdateien (config.json
, paths.txt
und configs
) werden automatisch mit Standardwerten erstellt. Um diese zu überschreiben, können die Dateien kopiert, umbenannt und angepasst werden:
config.json
ausconfig.example.json
paths.txt
auspaths.example.txt
configs
ausexample_configs
(siehe auch Export-Konfigurationen)
Der Ordnername von configs
kann in der paths.txt
Datei geändert werden.
Um die Webapp zu starten, muss das start.bat
Skript ausgeführt werden (über die Kommandozeile oder per Doppelklick), das automatisch auf die aktuellste Version updated. Die App ist dann unter https://localhost:5000
(bzw. anstatt localhost
die IP-Adresse des Rechners im Netzwerk) erreicht werden. Zum Neustart oder Stoppen können die restart.bat
und stop.bat
Skripte ausgeführt werden (Achtung: Alle laufenden Docker Container werden gestoppt).
Beim Start lädt das Backend die Informationen aus Dateien, um schneller darauf zugreifen zu können; wenn sich BSVP Dateien oder Export-Konfigurationen ändern sollte der Server über das Web-Interface neu geladen werden. Ein Neustart ist nur nötig, wenn eine neue Version verfügbar ist oder wenn die config.json
angepasst wurde.
Die Kofigurations-Dateien sind im JSON oder YAML Format hinterlegt. Es empfiehlt sich, mit einem Editor mit JSON-Erweiterung zu arbeiten, der auf Fehler aufmerksam machen kann (z.B. Notepad++) oder die JSON-Dateien mit einem Online-Validierer (z.B. JSONLint) zu überprüfen; gleiches gilt für das YAML Format.
In der Komplett.json
können verschiedene Einstellungen für den kompletten Export festgelegt werden:
exclude
: Felder angeben, die nicht im kompletten Export enthalten sein sollen. Es können normale Felder mit Namen (z.B.ARTLISTING
) und TECHDATA Felder mit ID (z.B.0000009
) angegeben werden.
{
"exclude": [
"ARTLISTING",
"CAT0M",
"0000009"
]
}
Der Gambio Export übernimmt die Konfiguration des Shop Exports, sowie die Formatierungen.yaml
, die auch vom Konfigurator Export genutzt wird (siehe weiter unten). Außerdem können die IDs der zu exportieren technischen Daten in der Gambio.json
als Liste festgelegt werden.
Durch die Shop.json
werden Felder angegeben, die in die CSV Datei pro Hersteller geschrieben werden. Als Bezeichner eines Feldes wird der Name angegeben, wie er in der CSV erscheint, als Wert ein Objekt, das den Wert beschreibt:
{
"XTSOL": { "wert": "XTSOL" },
"action": { "prod": "ACTION" },
"p_dics": { "ilugg": "DICOUNT" },
"p_cat.": { "iterierbar": { "praefix": "CAT", "max": { "wert": "5" } } },
"p_image.": {
"iterierbar": {
"praefix": "PIC.",
"max": { "ilugg": "PicCount" },
"start": "1"
}
},
"p_desc.de": {}
}
Für den Wert wird der Typ angegeben und der dazugehörige Wert:
wert
: Es wird ein fester Wert eingetragenprod
: Es wird der Name des Feldes in der.prod
-Datei angegebenilugg
: Es wird der Name des Feldes in der.ilugg
-Datei angegebeniterierbar
: Es müssen der Präfix des Feldes in der.prod
-Datei und der Maximalwert angegeben werden; zusätzlich kann derstart
Index (standardmäßig0
) angegeben werden
Für Werte, die gesondert zusammengebaut werden müssen, wird ein leeres Objekt ({}
) bzw. werden zusätzliche Spezifikationen angegeben:
p_desc.de
: leeres Objektp_movies.de
: leeres Objektproducts_energy_efficiency_text
: Liste von Feldern, die in die Tabelle geschrieben werden ({ "fields": [ "0000015", "0000089" ] }
)
Für den Konfigurator Export gibt es eine JSON Datei pro zu erstellender CSV Datei. Außerdem wird für Formatierungen die Formatierungen.yaml
genutzt (siehe unten). Der Dateiname der jeweiligen JSON Datei bestimmt den Dateinamen der CSV Datei, die erstellt wird (Bsp. Kühlschränke.json
wird zu Kühlschränke.csv
). Es werden der Produkttyp und Felder angegeben, die exportiert werden sollen. Das Format sieht wie folgt aus:
{
"produkttyp": "Kühlschrank",
"hersteller_export": ["Nordcap", "KBS"],
"felder": {
"ARTNR": "artikelnummer",
"0000017": "anzahl_regalboeden",
"0000089": "energieverbrauch"
},
"kombinationen": {
"temperaturbereich": {
"separator": "|",
"felder": ["0000226", "0000225"]
}
}
}
Der Produkttyp muss so angegeben werden, wie er in den BSVP-Produkt-Dateien steht, allerdings ohne HTML kodierte Zeichen (Bsp. PUM::Produkttyp::Kühlschrank
, in der Konfiguration steht "Kühlschrank"
).
Die Felder werden als Key-Value-Paar angegeben, wobei der Key das Feld so wie es in den BSVP-Produkt-Dateien steht ist (Bsp. "ARTNR"
) bzw. als numerische ID für das Attribut-Feld (Bsp. "0000017"
für Anzahl Regalböden). Der Value ist der Name des Feldes wie er in der CSV Datei angegeben werden soll (Bsp. "artikelnummer"
oder "anzahl_regalboeden"
).
Neben der globalen CSV Datei können CSV Dateien pro Lieferant erstellt werden. Dazu kann in dem Feld "hersteller_export"
eine Liste von Lieferantennamen angegeben werden. Die resultierende CSV Datei heißt dann KONFIGURATION_HERSTELLER.csv
, also zum Beispiel Kühlschrank_Nordcap.csv
.
Kombinationen von Werten können angegeben werden, sie müssen es aber nicht. Der Bezeichner einer Kombination entspricht der Bezeichung der Spalte in der CSV Datei. Als Wert werden ein Separator (Bsp. "|"
) und Feldnamen bzw. Attribut-IDs in einer Liste (eckige Klammern) angegeben.
Der Preis Exporter besitzt keine weiteren Einstellungen, er exportiert legiglich Artikelnummer, -name und Preis.
Der Custom Exporter ist eine schnelle Möglichkeit, nur über das Anpassen der Custom.json
bestimmte Felder zu exportieren.
Bitte beachten: Die Exporter müssen über das Web-Interface neu geladen werden, wenn die Custom.json
bei laufendem Server geändert wurde (ein Neustart ist nicht nötig).
Die einfache Konfiguration enthält lediglich den CSV-Header-Namen (z.B. "artikelnummer"
oder "kaeltemittel"
) und das Feld im Produkt (z.B. "ARTNR"
oder "0000139"
).
Zusätzlich kann geprüft werden, ob bestimmte Werte in einem Feld vorhanden sind.
Nur solche Produkte werden exportiert, die den angegebenen Text enthalten.
Das kann wie folgt definiert werden: "kaeltemittel": {"field": "0000139", "contains": "404"}
.
Wenn solche Überprüfungen für mehrere Werte angegeben werden, werden nur solche Produkte exportiert, die alle Bedingungen erfüllen. Wenn zum Beispiel zusätzlich zum Kältemittel noch "artikelnummer": {"field": "ARTNR", "contains": "AHT"}
angegeben wird, werden nur Artikel exportiert deren Artikelnummer sowohl AHT
UND deren Kältemittel 404
beinhaltet.
Formatierungen können in der Datei Formatierungen.yaml
definiert werden. Ein Beispiel sieht wie folgt aus:
# Reihenfolgen
reihenfolgen:
-
felder: ["0000138"]
reihenfolge: ["kaelteleistung-daten-entfernen", "kaelteleistung-daten-sortieren"]
# Punkt zu Komma
punkt_zu_komma:
-
felder: ["0000089"]
# Gruppierungen
gruppierungen:
-
grenzwerte: [4, 8, 12, 16, 20, 30, 40, 50, 60, 70]
einheit: " qbm"
felder: ["0000053"]
-
id: "kaelteleistung-daten-sortieren"
grenzwerte: [500, 750, 1000, 1250, 1500, 1750, 2000, 2250, 2500, 2750, 3000, 3500, 4000, 4500, 5000]
einheit: " Watt"
felder: ["0000138"]
# Ersetzungen
ersetzungen:
-
vorher: ["vorhanden"]
nachher: "integriert"
felder: ["0000327"]
-
vorher: ["keine Angabe", "kein Angabe"]
nachher: "nicht vorhanden"
felder: ["0000177", "0000178", "0000425"]
-
id: "kaelteleistung-daten-entfernen"
vorher:
- " bei Verdampfungstemperatur To = -10°C"
- " bei Verdampfungstemperatur To = -30°C"
- " bei Verdampfungstemperatur To = -30°C"
- " bei Verdampfung To = -30°C und Kondensation Tc = +40°C"
nachher: ""
felder: ["0000138"]
option: "endswith"
Einfache Ersetzungen von Werten (Bsp. die Werte ["CNS 1.4301", "CNS 1.4301 (AISI304)", "CNS 18/10"]
sollen immer zu "CNS"
geändert werden) können im untergeordneten Feld "ersetzungen"
angegeben werden.
Wenn die Ersetzung für einen Teil-String am Anfang oder am Ende erfolgen soll, muss als Option "startswith"
bzw. "endswith"
angegeben werden.
Für Ersetzungen wird nicht auf Groß- und Kleinschreibung geachtet "Ja"
würde genau wie "ja"
zu "yes"
geändert werden. Das gilt nicht für Teil-Ersetzungen.
Außerdem können Gruppierungen numerischer Werte vorgenommen werden. Wichtig dabei ist, dass die Werte im angegebenen Datenfeld tatsächlich numerisch sind, ansonsten funktioniert die Formatierung nicht. Dabei werden Grenzwerte zwischen den Gruppen und die Einheit der Werte angegeben. Der resultierende Wert ist dann zum Beispiel "bis 700mm"
, "bis 1000mm"
, oder "> 1000mm"
Für komliziertere Formatierungen gibt es folgende vordefinierte Regeln:
"punkt_zu_komma"
: der Punkt (in einer Kommazahl) wird zu einem Komma geändert"bereich_von_null"
: zu einem Wert wird "0|" hinzugefügt
Zu einer Ersetzung bzw. Regel kann eine Liste von Attribut-IDs angegeben werden, auf die diese dann angewendet werden.
Zusätzlich können Gruppierungen und Ersetzungen, die voneinander abhängen, geordnet werden.
Dazu muss eine "id"
angegeben werden (diese muss eindeutig sein, aber was darin steht, ist egal).
Dann kann ein Feld mit "reihenfolgen"
angelegt werden, für jede Reihenfolge werden betroffene Feld IDs in "felder"
und die Formatierung IDs in "reihenfolge"
angegeben.
Beispiel (siehe oben): Für Temperaturen ("0000225"
and "0000226"
) soll zuerst das °C
gelöscht werden, bevor nach Temperaturen über und unter 0°C gruppiert wird.
Für die Gruppierung wird die ID temperaturen_gruppieren
vergeben, für die Ersetzung temperatur_numerisch
.
Die Reihenfolge der Bearbeitung für die Felder ["0000225", "0000226"]
ist dann ["temperatur_numerisch", "temperaturen_gruppieren"]
.
Hier sind Lösungen zu häufigen Fehlern aufgeführt, geordnet nach den Fehlerarten, die in der Kommandozeile ausgegeben werden.
PermissionError: [WinError 32] The process cannot access the file because it is being used by another process
Es könnte sein, dass eine CSV Datei, die überschrieben werden soll noch in einem anderen Programm wie Excel geöffnet ist, bitte schließen und den Exporter erneut starten.
Beim JSON Format empfiehlt es sich allgemein, mit einem Editor zu arbeiten, der auf Syntax-Fehler aufmerksam macht. Alternativ können JSON Dateien auch online validiert werden (z.B. unter https://jsonlint.com/).
json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 19 column 5 (char 566)
Eine der JSON Konfigurationen enthält ein Komma in der letzten Zeile, das bitte entfernen.
Für einen Entwicklungs-Setup müssen grundsätzlich die Bedingungen erfüllt sein, die durch das setup/start.bat
Skript hergestellt werden:
- Es wird ein Docker Container gestartet, in dem Python 3, Node und benötigte Pakete installiert sind (siehe
setup/Dockerfile
); solche können natürlich auch manuell installiert werden - Es wird davon ausgegangen, dass bestimmte Dateien vorhanden sind; siehe dazu die Pfade und Dateien in
modules/constants.py
Der Frontend Server kann mit cd client && npm start
gestartet werden, dabei wird auch das Backend gestartet. Der Backend Server kann einzeln mit python server.py
gestartet werden.
Das Frontend ist unter 5
erreichbar, die REST API des Backends unter localhost:5000
.