/Aviahack-2021

Primary LanguageJupyter Notebook

Aviahack-2021


Краткое описание

Разработка ПО способного находить аномалии в треках воздушных судов.

Текущая ситуация

Система организации воздушного движения (ОрВД) – сложная система с множеством участников, среди которых: авиакомпании, диспетчеры управления воздушным движением, аэропорты, провайдеры аэронавигационных услуг, авиационные власти и др. Каждый из участников системы ОрВД имеет свои цели и интересы. Кроме того, функционирование системы ОрВД должно отвечать множеству критериев, таких как безопасность воздушного движения, пропускная способность, пунктуальность, экономическая эффективность, влияние на окружающую среду и многое другое. Исследование и оптимизация системы ОрВД представляет собой очень важную и одновременно сложную задачу. Для многих исследовательских задач необходима большая выборка исторических трековых данных, полученных по радарным наблюдениям воздушных судов. Данные должны быть пригодны для исследований и отвечать требованиям по качеству, однако в них нередко могут встречаться ошибки разного рода. Задача определения треков воздушных судов, содержащих ошибки, является предварительной задачей к проведению исследований, а также разработке интеллектуальных систем поддержки системы ОрВД.

Проблема

Заданы два текстовых файла, содержащих трековые данные воздушных судов, выполняющих полет в воздушном пространстве РФ. Файл Х содержит трековые данные нормального качества, подходящие для дальнейшего использования (Х треков). Файл Y содержит трековые данные с ошибками разного рода (Х треков). Встречаются следующие типы ошибок:

  • «Скачки по высоте»
  • «Скачки по широте и долготе»
  • «Неполный трек»
  • «Пилообразный трек» Файлы с трековыми данными имеют следующий формат: Каждая запись в файле представляет собой трековые данные одного рейса. Трековые данные представлены множеством точек в воздушном пространстве и времени их пролета, то есть представляют собой множество элементов, включающих:
  • Широты точки в формате ХХХ;
  • Долготы точки в формате ХХХ;
  • Высоты точки в ХХХ;
  • Времени пролета точки в формате ХХХ.

Задача

Требуется построить алгоритм и ПО, способное классифицировать множество поступающих в него трековых данных на два множества – трековые данные, пригодные для дальнейшего использования, и трековые данные с ошибками. При формировании алгоритма необходимо использовать набор размеченных (обучающих) треков. Из заданного набора размеченных трековых данных требуется выделить набор тестовых треков (включающих треки с ошибками и без), на которых необходимо выполнить оценку работоспособности сформированного алгоритма.