Dieses Projekt wurde realisiert von Niclas Cramer, Niklas Koch, Jasmina Pascanovic und Antoine Fuchs.
Das SynTex Repository beinhaltet verschiedene Komponenten, darunter Modelle zur Klassifizierung und Zusammenfassung von Texten, Trainingsdaten sowie ein Frontend, das all diese Aspekte kombiniert. Wenn Sie mehr über die Funktionen erfahren möchten, lesen Sie die Anwenderdokumentation oder werfen Sie einen Blick auf den Code.
Das Projekt bietet verschiedene Funktionen:
- Textklassifikation: Die Anwendung ist in der Lage, Texte als Nachrichtenartikel, Geschichten, wissenschaftliche Artikel oder Reviews zu klassifizieren.
- Textzusammenfassung: Abhängig von der Textklasse wird ein spezifisches Modell zur Textzusammenfassung angewendet:
- Für wissenschaftliche Artikel wird das Modell 'NICFRU/bart-base-paraphrasing-science' genutzt.
- Für Nachrichtenartikel wird das Modell 'NICFRU/bart-base-paraphrasing-news' genutzt.
- Für Geschichten wird das Modell 'NICFRU/bart-base-paraphrasing-story' genutzt.
- Für Reviews wird das Modell 'NICFRU/bart-base-paraphrasing-review' genutzt.
- Sprache-zu-Text: Die Anwendung ist auch in der Lage, gesprochene Sprache in Text umzuwandeln.
- Datei-Upload: Nutzer können Daten in den Formaten PDF, DOCX und TXT hochladen.
- Barrierefreiheit: Nutzer können Vorlesefunktionen nutzen und für die Vergrößerung des Textes, kann "Strg/Cmd" & "+" genutzt werden
Folgen Sie diesen Schritten, um das Frontend zu verwenden:
- Installieren Sie die erforderliche Umgebung mit Conda, indem Sie folgenden Befehl verwenden (Bitte beachten Sie, dass die Installation der Umgebung momentan nur auf Apple-Geräten unterstützt wird):
conda env create -n projektrealisierung --file environment.yml
- Aktivieren Sie die neu erstellte Umgebung:
conda activate projektrealisierung
- Installieren Sie das 'spacy' Modul und das 'en-core-web-lg' Modell:
python -m spacy download en_core_web_lg
- Wechseln Sie in den 'frontend'-Ordner:
cd frontend
- Führen Sie die Frontend-Applikation aus:
streamlit run frontend.py
To use the application, you have two options for inputting your data:
-
Place your data file(s) in the 'Testfiles' folder, which is located in the 'Frontend' directory of this application.
-
Within the application interface, you'll find a file selection tool. Use this to select your data file from the 'Data' folder.
-
If your data file is hosted elsewhere, you can directly use the absolute link to that file. Enter this link in the provided text field in the application interface.
-
Confirm your input by pressing 'Enter'. Upon confirmation, a new text field will appear.
-
Copy the contents of the new text field and paste them back into the original text field (where you initially entered the link).
Please ensure that you follow these instructions carefully to avoid any issues in data processing.
- Link des Video: Google Drive
- Zusätzliche Daten für das Trainieren der Modelle: Google Drive