/SEVERSTAL_task

Анализ и методы устранения брака на производстве и определение продукции на обжиговой машине

Primary LanguageJupyter Notebook

SEVERSTAL_task

Задание 1

Сотрудник службы оценки качества продукции заметил, что число бракованных листов стали в партии для стали марки A больше, чем для стали марки B. Также он обратил внимание, что при средней скорости прокатки более 4 м/с число бракованных листов больше. В соответствии с этими наблюдениями, предлагается снизить скорость прокатки и ввести дополнительные меры контроля качества для стали марки A.

Обоснуйте, что:

  1. Более 3 бракованных листов на партию выходит значимо чаще для стали марки А, чем для стали марки B.
  2. При скоростях прокатки более 4 м/с свыше 3 бракованных листов стали на партию выходит значимо чаще, чем при меньших скоростях прокатки.

Данные, необходимые для анализа, содержатся в файле «Статистика за 2018 год». Количество листов стали в каждой партии предполагается одинаковым.

Задание 2

Вам необходимо построить модель, которая на основании данных, поступающих каждую минуту, определяют качество продукции, производимое на обжиговой машине.

Обжиговая машина представляет собой агрегат, состоящий из 5 одинаковых по размеру камер, в каждой камере установлено по 3 датчика температур. Кроме этого, для данной задачи Вы собрали данные о высоте слоя сырья и его влажности. Высота слоя и влажность измеряются при входе сырья в машину. Сырье проходит через обжиговую машину за час.

Данные с показателями работы обжиговой машины содержатся в файле X_data.csv:

Название тега Описание тега
T_data_1_1 1-й датчик в 1-й камере
T_data_1_2 2-й датчик в 1-й камере
T_data_1_3 3-й датчик в 1-й камере
T_data_2_1 1-й датчик во 2-й камере
T_data_2_2 2-й датчик во 2-й камере
T_data_2_3 3-й датчик во 2-й камере
T_data_3_1 1-й датчик в 3-й камере
T_data_3_2 2-й датчик в 3-й камере
T_data_3_3 3-й датчик в 3-й камере
T_data_4_1 1-й датчик в 4-й камере
T_data_4_2 2-й датчик в 4-й камере
T_data_4_3 3-й датчик в 4-й камере
T_data_5_1 1-й датчик в 5-й камере
T_data_5_2 2-й датчик в 5-й камере
T_data_5_3 3-й датчик в 5-й камере
H_data Высота слоя
AH_data Влажность сырья

Качество продукции измеряется в лаборатории по пробам, которые забираются каждый час, данные по известным анализам содержатся в файле Y_train.csv. В файле указано время забора пробы, проба забирается на выходе из обжиговой машины.

Вы договорились с заказчиком, что оценкой модели будет являться показатель MAE, для оценки модели необходимо сгенерировать предсказания за период, указанный в файле Y_submit.csv (5808 предиктов).

Все необходимые данные лежат по ссылке:

https://www.dropbox.com/s/lo2w549fv8lo3oc/Test2.7z