Классификатор Интентов на русском

Этот репозиторий предназначен для разработки и обучения классификатора интентов, который может определять намерения пользователя на основе текстовых данных.

Структура Репозитория

intent-classifier/
|-- data/
|   |-- retsil/
|   |   |-- test.csv
|   |   |-- train.csv
|-- notebooks/
|   |-- retsil/
|   |   |-- intent_classifier_different_embeddings.ipynb
|   |   |-- intent_classifier.ipynb
|-- intent_classifier.py
|-- telegram_bot.py
|-- README.md

Описание Файлов и Папок

  1. data/: В этой папке находятся данные, необходимые для обучения и тестирования классификатора. Файлы train.csv и test.csv содержат обучающие и тестовые данные соответственно.

  2. notebooks/: Эта папка содержит Jupyter-ноутбуки, в которых проводились исследования разных методов и архитектур для классификации интентов:

    • intent_classifier_different_embeddings.ipynb: В этом ноутбуке были исследованы разные методы представления текста (эмбеддинги) для классификации интентов.
    • intent_classifier.ipynb: Этот ноутбук содержит эксперименты с разными архитектурами и методами обучения классификатора.
  3. intent_classifier.py: В этом скриптовом файле находится код, который используется для обучения и создания самой удачной модели классификатора на основе выбранных эмбеддингов и архитектур.

  4. telegram_bot.py: Этот скриптовый файл содержит код для создания телеграм-бота, который использует обученную модель классификатора для определения интентов пользователей.

Как использовать репозиторий

Для использования репозитория, вы можете следовать единственному шагу:

  1. Вы можете использовать файл telegram_bot.py, чтобы создать бота в Telegram, который будет отвечать на запросы пользователей, определяя их интенты. При создании бота классификатор из файла intent_classifier.py, автоматически обучится на данных из папки data/.

Для дополнительной информации о методах и результатов экспериментов, вы можете обратиться к Jupyter-ноутбукам в папке notebooks/.