Этот репозиторий предназначен для разработки и обучения классификатора интентов, который может определять намерения пользователя на основе текстовых данных.
Структура Репозитория
intent-classifier/
|-- data/
| |-- retsil/
| | |-- test.csv
| | |-- train.csv
|-- notebooks/
| |-- retsil/
| | |-- intent_classifier_different_embeddings.ipynb
| | |-- intent_classifier.ipynb
|-- intent_classifier.py
|-- telegram_bot.py
|-- README.md
Описание Файлов и Папок
-
data/: В этой папке находятся данные, необходимые для обучения и тестирования классификатора. Файлы
train.csv
иtest.csv
содержат обучающие и тестовые данные соответственно. -
notebooks/: Эта папка содержит Jupyter-ноутбуки, в которых проводились исследования разных методов и архитектур для классификации интентов:
intent_classifier_different_embeddings.ipynb
: В этом ноутбуке были исследованы разные методы представления текста (эмбеддинги) для классификации интентов.intent_classifier.ipynb
: Этот ноутбук содержит эксперименты с разными архитектурами и методами обучения классификатора.
-
intent_classifier.py: В этом скриптовом файле находится код, который используется для обучения и создания самой удачной модели классификатора на основе выбранных эмбеддингов и архитектур.
-
telegram_bot.py: Этот скриптовый файл содержит код для создания телеграм-бота, который использует обученную модель классификатора для определения интентов пользователей.
Как использовать репозиторий
Для использования репозитория, вы можете следовать единственному шагу:
- Вы можете использовать файл
telegram_bot.py
, чтобы создать бота в Telegram, который будет отвечать на запросы пользователей, определяя их интенты. При создании бота классификатор из файлаintent_classifier.py
, автоматически обучится на данных из папкиdata/
.
Для дополнительной информации о методах и результатов экспериментов, вы можете обратиться к Jupyter-ноутбукам в папке notebooks/
.