Первым шагом при проведении исследования является загрузка исходных данных. Для этого в главном меню необходимо выбрать "Загрузить". Главное меню представлено на рисунке ниже:
После этого необходимо выбрать файл с исходными данными:
После того как файл был выбран, необходимо нажать "Кластеризация" в главном меню. После завершения процесса кластеризации можно посмотреть её результаты. Кнопка "Все данные" показывает разделение объектов по кластерам и центры кластеров.
Кнопка "Сводка" показывает данные по каждому из кластеров и таблицу с лингвистическими оценками.
Функция "Граф" позволяет визуально оценить результаты кластеризации. При построении графа есть возможность изменять отображаемые значения по осям.
Для выполнения оценки апартамента необходимо нажать "Оценить". После этого необходимо ввести стоимость в появившемся окне.
После этого необходимо нажать "Найти". В результате будет выведена информация по подобранному кластеру, который оказался ближе всего к заданной цене. В окне содержится информация о центре кластера, а также точечные и интервальные оценки параметров апартамента.
Загрузке подлежат файлы .tsv
Пример входного файла:
Программа требует файл Localization.txt рядом с исполняемым файлом .exe
Файл локализации:
Локализация представляет собой строки типа <ключ>_<значение>. Символ нижнего подчёркивания - разделитель.
Номер параметра объекта должен соответствовать столбцу в загружаемом файле
В приведенном примере локализации введены параметры
- paramname.1_P1 Цена
- paramname.2_P2 Площадь
- paramname.3_P3 Комнаты
- paramname.4_P4 Ванные
Первый параметр в программе используется для поиска ближайшего кластера
Лингвистическая оценка настраивается строками вида (для параметра номер 1)
- param.lingv.1.split.1_0.3
- param.lingv.1.split.2_0.7
- param.lingv.1.word.1_Дёшево
- param.lingv.1.word.2_Нормально
- param.lingv.1.word.3_Дорого
Правила оценки:
- Если значение попало в меньшую треть (< 0.3), выдаётся word.1
- Если в большую (> 0.7) word.3
- Иначе word.2
Параметр param.kmeans.elemsPerCluster отвечает за ориентировочное число элеменов в 1 кластере. На его основе выбирается число кластеров.