/Data-Science-NLP

Machine Learning For Texts -- Study Project for Yandex Practicum

Primary LanguageJupyter Notebook

Data-Science-NLP

Machine Learning for Texts

Instruments used: WordNetLemmatizer CountVectorizer TfidfVectorizer

Models: LogisticRegression DecisionTreeClassifier RandomForestClassifier

Metrics: F1

Интернет-магазин «Викишоп» запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. Обучите модель классифицировать комментарии на позитивные и негативные. В вашем распоряжении набор данных с разметкой о токсичности правок.

Постройте модель со значением метрики качества F1 не меньше 0.75.