Помощник работает в виде веб-приложения по ссылке http://158.160.48.28:8501 Для запуска проекта локально необходимо скачать исходный код проекта и настроить локальную среду разработки. Рекомендуем установить виртуальное окружениие. Это можно сделать следующей командой:
python3 -m venv namedir
После установки виртуального окружения необходимо его активировать
- команда для linux:
source namedir/bin/activate
- команда для windows:
.\scripts\activate.ps1
И далее установить в активированную виртуальную среду список необходимых библиотек для работы приложения. Все необходимые библиотеки перечислены в requirements.txt. Для массовой установки библиотек достаточно использовать команду:
pip install -r requirements.txt
Для запуска приложения используйте команду в директории проекта:
streamlit run src/main.py
Если открылось окно веб-браузера с текстом и полями ввода, значит все получилось! Теперь вы можете дорабатывать приложение по собственному усмотрению.
В проекте используется две предобученные модели:
- IlyaGusev/mbart_ru_sum_gazeta - для генерации саммари-информации по большому объему загруженных в нее данных
- timpal0l/mdeberta-v3-base-squad2 - для получения быстрых ответов на вопросы по загруженному в модель контенту
Приложение помогает с минимальными затратами времени получить необходимую информацию из больших объемов текста. Так, саммари позволяет вместо 10 минут потратить менее 1 минуты на получение основного смысла статьи или абзаца из книги. При появлении конкретных вопросов к тексту, нет необходимости использовать контекстный поиск - вместо этого можно задать интересующий вопрос и если ответ на этот вопрос в том или ином виде представлен в загруженных данных - получить ответ. Получив саммари и ответы, пользователь может узнать, например, имеется ли необходимая ему информация в статье и стоит ли потратить больше времени на ее детальное изучение.
- Игорь Ерошин, менеджер проекта
- Татьяна Меркурьева, аналитик данных
- Евгений Брылин, Инженер по машинному обучению
- Олег Перевиспа, Full Stack-разработчик
- Вадим Монахов, Тестировщик-QA инженер, + экспериментальные функции
- Клим Колчин, Документалист/технический писатель
Приложение распостраняется по лицензии GNU.