Repository für Masterarbeit: Dokumentenklassifikation

Projektbeschreibung

Die Masterarbeit für die DBUAS widmet sich dem Vergleich unterschiedlicher Deep-Learning-Methoden zur Dokumentenklassifikation anhand eines Open-Source-Datensatzes. Der praktische Teil der Arbeit, welcher dieses Code-Projekt darstellt, vergleicht verschiedene State-of-the-Art Deep Learning Methoden zur Dokumentenklassifikation mithilfe des Open-Source-Datensatzes.


Datensatz: "LINK_EINFÜGEN"

✅ Anforderungen

  • Python 3.11.7
  • Docker


📁 Repository Übersicht

├── data		       # enthält Daten
│
├── env
│   ├── Dockerfile                 # Erstellung der Entwicklungsumgebung
│
├── notebooks                  # Jupyter Notebooks
│
├── references                 # Data-Dictionaries, Dokumentation
│
├── reports                    # Berichte im Format HTML, PDF, LATEX usw.
│   ├── figures                     # erstellte Abbildungen/Grafiken für Berichte
│
├── src                        # Source-Code
│   ├── utils.py		    # Hilfsfunktionen für Projekt
│
├── .gitignore                 # Liste von Dateien/Verzeichnisen, die von Git ignoriert werden sollen
│
├── poetry.lock                # Dependency-Verwaltung von Poetry
│
├── .pre-commit-config.yaml    # Konfigurationsdatei für Pre-Commit-Hooks
│
├── pyproject.toml             # Konfigurationsdatei für Poetry und Pre-Commit-Hooks
│
├── README.md                  # Projektbeschreibung/Installations- und Nutzungsanweisungen


🔌 Installation

  1. Wechsel zu Projektordner

    cd Documents\Projekte
  2. Clone das Repository

    git https://github.com/herrmannmaML/Masterarbeit_DocClassification.git
    cd Masterarbeit_DocClassification
  3. Erstelle die lokale Projektumgebung

    docker build -f env/Dockerfile -t cross_modal_feature_env . 


⚡ Nutzung

Docker-Container starten für Entwicklung:

docker run -it --name cross_modal_feature_env --ipc host -v $(pwd):/code cross_modal_feature_env

Erstelle das Docker-Compose-Cluster für Modell-Tracking + Entwicklung

docker-compose --env-file secrets/.env up -d --build