Сотрудник службы оценки качества продукции заметил, что число бракованных листов стали в партии для стали марки A больше, чем для стали марки B. Также он обратил внимание, что при средней скорости прокатки более 4 м/с число бракованных листов больше. В соответствии с этими наблюдениями, предлагается снизить скорость прокатки и ввести дополнительные меры контроля качества для стали марки A.
Обоснуйте, что:
- Более 3 бракованных листов на партию выходит значимо чаще для стали марки А, чем для стали марки B.
- При скоростях прокатки более 4 м/с свыше 3 бракованных листов стали на партию выходит значимо чаще, чем при меньших скоростях прокатки.
Данные, необходимые для анализа, содержатся в файле «Статистика за 2018 год». Количество листов стали в каждой партии предполагается одинаковым.
Вам необходимо построить модель, которая на основании данных, поступающих каждую минуту, определяют качество продукции, производимое на обжиговой машине.
Обжиговая машина представляет собой агрегат, состоящий из 5 одинаковых по размеру камер, в каждой камере установлено по 3 датчика температур. Кроме этого, для данной задачи Вы собрали данные о высоте слоя сырья и его влажности. Высота слоя и влажность измеряются при входе сырья в машину. Сырье проходит через обжиговую машину за час.
Данные с показателями работы обжиговой машины содержатся в файле X_data.csv:
Название тега | Описание тега |
---|---|
T_data_1_1 | 1-й датчик в 1-й камере |
T_data_1_2 | 2-й датчик в 1-й камере |
T_data_1_3 | 3-й датчик в 1-й камере |
T_data_2_1 | 1-й датчик во 2-й камере |
T_data_2_2 | 2-й датчик во 2-й камере |
T_data_2_3 | 3-й датчик во 2-й камере |
T_data_3_1 | 1-й датчик в 3-й камере |
T_data_3_2 | 2-й датчик в 3-й камере |
T_data_3_3 | 3-й датчик в 3-й камере |
T_data_4_1 | 1-й датчик в 4-й камере |
T_data_4_2 | 2-й датчик в 4-й камере |
T_data_4_3 | 3-й датчик в 4-й камере |
T_data_5_1 | 1-й датчик в 5-й камере |
T_data_5_2 | 2-й датчик в 5-й камере |
T_data_5_3 | 3-й датчик в 5-й камере |
H_data | Высота слоя |
AH_data | Влажность сырья |
Качество продукции измеряется в лаборатории по пробам, которые забираются каждый час, данные по известным анализам содержатся в файле Y_train.csv. В файле указано время забора пробы, проба забирается на выходе из обжиговой машины.
Вы договорились с заказчиком, что оценкой модели будет являться показатель MAE, для оценки модели необходимо сгенерировать предсказания за период, указанный в файле Y_submit.csv (5808 предиктов).
Все необходимые данные лежат по ссылке: