/telegram_chat_parser_2

Простой пармер чатов в телеграме с контекстом разговора

Primary LanguagePythonMIT LicenseMIT

telegram_chat_parser_2

Простой пармер чатов в телеграме с контекстом разговора

Как использовать:

  1. Скачайте данный репозиторий на ваш пк
  2. Установите зафисимости с помощью
pip install -r requirements.txt
  1. Экспортируйте чат в telegram в формат json (выбирается в меню)
  2. Укажите путь к входному файлу и выходной директории
python parser.py --tg_history_path /path/to/history/file.json --output_path /path/to/output/directory
  1. Ожидайте завершения
  2. В указанной выходной директории будет 3 файла:
1. raw.csv - файл с неочищенными данными
2. train.jsonl и test.jsonl - данные готовые для дальнейшей обработки