Скрипт является консольной программой для автоматизации поиска нецензурных слов, оскорблений, политических высказываний и пр. в комментариях к статьям на одном очень известном интернет ресурсе.
В каталоге dicts данного репозитория находятся текстовые файлы со списками слов, которые нужно распознавать. Слова можно объеденить в одном файле или разбить на несколько файлов по определенным тематикам. При запуске скрипта слова из всех файлов объединяются в единый список. Дальше, текст комментариев проверятся на наличие слов из этого "черного списка". Перед проверкой из комментария удаляются знаки препинание и прочая пунктуация, слова приводятся к нормальному виду.
Пример запуска:
$ python comments_checker.py https://habr.com/ru/articles/785516/
...
→ https://habr.com/ru/articles/785516/comments/#comment_26365166
Главное отличие XP и Win7 от Win8/8/10/11 - они были простыми из коробки и в них не было ничего лишнего. Чего-о-о? Как старпёр, который переползал еще 3.1 на 3.11 (+ почти с десяток дискет!) могу вас заверить, что в момент выхода и ХP была страшным тормозящим пропроитарным неповоротливым прожорливым монстром. Она плохо поддерживала оборудование (как я намучился со звуковухой!), жрала 56 кбитный интернет, как не в себя. Ей не хватало 100 Мб жёсткого диска! Мне пришлось Civilization 2 удалять, чтоб место освободить! Вы представляете? И эта тварь ещё смела привязываться к железу , $#%@ ! Это тогда было просто немыслимое наступление на мои "свободы пользователя"! А от этого детско-мультяшного интерфеса вообще тошнило. И куча всякой ненужной фигни (уж извините - уже и забылось от чего тогда кипелось). Не, XP приобрела "человеческое лицо" только на SP3. Это Vista и семёрка (да-да, семёрка!) сделали эту систему "святой" теми ужасами, что они принесли ...
Detected words: ['тварь', 'старпер']
----------------------------------------
→ https://habr.com/ru/articles/785516/comments/#comment_26365398
И эта тварь ещё смела привязываться к железу Standard IDE controller. Постоянно устанавливал его перед перенесом на другое железо
Detected words: ['тварь']
----------------------------------------
Для запуска скрипта использовался только Python 3.8, на других версиях не проверялся.
Рекомендуется устанавливать зависимости в виртуальном окружении, используя venv или любую другую реализацию, например, virtualenv.
В примере используется модуль venv
который появился в стандартной библиотеке python версии 3.3.
- Скопируйте репозиторий в текущий каталог. Воспользуйтесь командой:
$ git clone https://github.com/igorzakhar/comments-checker.git
После этого программа будет скопирована в каталог comments-checker
.
- Создайте и активируйте виртуальное окружение:
$ cd comments-checker # Переходим в каталог с программой
$ python3 -m venv my_virtual_environment # Создаем виртуальное окружение
$ source my_virtual_environment/bin/activate # Активируем виртуальное окружение
- Установите сторонние библиотеки из файла зависимостей:
$ pip install -r requirements.txt # В качестве альтернативы используйте pip3