Die Masterarbeit für die DBUAS widmet sich dem Vergleich unterschiedlicher Deep-Learning-Methoden zur Dokumentenklassifikation anhand eines Open-Source-Datensatzes. Der praktische Teil der Arbeit, welcher dieses Code-Projekt darstellt, vergleicht verschiedene State-of-the-Art Deep Learning Methoden zur Dokumentenklassifikation mithilfe des Open-Source-Datensatzes.
Datensatz: "LINK_EINFÜGEN"
- Python 3.11.7
- Docker
├── data # enthält Daten
│
├── env
│ ├── Dockerfile # Erstellung der Entwicklungsumgebung
│
├── notebooks # Jupyter Notebooks
│
├── references # Data-Dictionaries, Dokumentation
│
├── reports # Berichte im Format HTML, PDF, LATEX usw.
│ ├── figures # erstellte Abbildungen/Grafiken für Berichte
│
├── src # Source-Code
│ ├── utils.py # Hilfsfunktionen für Projekt
│
├── .gitignore # Liste von Dateien/Verzeichnisen, die von Git ignoriert werden sollen
│
├── poetry.lock # Dependency-Verwaltung von Poetry
│
├── .pre-commit-config.yaml # Konfigurationsdatei für Pre-Commit-Hooks
│
├── pyproject.toml # Konfigurationsdatei für Poetry und Pre-Commit-Hooks
│
├── README.md # Projektbeschreibung/Installations- und Nutzungsanweisungen
-
Wechsel zu Projektordner
cd Documents\Projekte
-
Clone das Repository
git https://github.com/herrmannmaML/Masterarbeit_DocClassification.git cd Masterarbeit_DocClassification
-
Erstelle die lokale Projektumgebung
docker build -f env/Dockerfile -t cross_modal_feature_env .
Docker-Container starten für Entwicklung:
docker run -it --name cross_modal_feature_env --ipc host -v $(pwd):/code cross_modal_feature_env
Erstelle das Docker-Compose-Cluster für Modell-Tracking + Entwicklung
docker-compose --env-file secrets/.env up -d --build