fintech-fab/fintech-fab.ru

Анализ объявлений (риэлторов, продавцов)

Closed this issue · 2 comments

Вообще проблема современного интернета не в поиске данных, и не подгрузки ежедневно используемых данных, а проблема, в истинности этих данных и мусоре, и фейках.

Например, человек снимает квартиру, заходит на то же самое авито и видит - тут риэлтор, там риелтор. А где реальные продавцы? Куда все делись?
А ведь првоерить средствами программного анализа возможно.
Если у человека есть 2 объявление о продаже квартиры и там указано 2 одинаковых телефона - он риэлтер, и он не собственник.

Т.е. задача сводится к поиску контактов и квартир, которые употребляются на одном ресурсе единожды.
Собственник будет продавать одну и ту же квартиру , а риэлтер несколько.

Данную систему можно применять и к барыгам автомобилей.

Сразу скажу, идея не моя, только что подсказали мне. :)

Люди сами обращаются к риелторам и это правильно.
Нам эту прослойку не пробить.
На сайте krisha.kz есть фильтры предложения от собственников квартир.

Задача условно разбивается на 3 подзадачи

  • агрегация данных и занесение их в табличный вид, хранение в базе данных (задача #21)
  • пользовательский интерфейс для фильтрации этих данных
  • серверная функция на сбор этих данных.

По первой подзадаче - копируем решение #21 используем данные работаем

по второй подзадаче, необходим веб интерфейс в которую засунуть соответствующие инпуты:
что ищем, за какой перид, какая цена, какие-то другие параметры. И самая важная опция "только от владельца" и только првоеренные продавцы

В третьей подзадаче
получив параметры с веб формы нужно обработать соответствующим образом.
Реализовать 3 функции:

  • получения данных по параметрам GetList(options)
  • фильтрация полученных данных DoFiler и кеширование (создание индекса Sphinx)
  • Присвоение индекса "надежности" SetSortIndex

По первым двум функциям все стандартно.
По третьей необходимо реализовать систему весов и рейтингов.

  1. если человек регулярно что-то продает, значит его товар покупают, значит он надежный. И он должен иметь максимальный рейтинг барыги. Тут стоит оговорится, что это применимо только к уникальным товарам, например автомобиль или квартира, товары которые держаться на складе пачками не годятся, т.к. невозможно будет отследить дату продажи и покупки.

За каждый товар даем Х кол-во баллов, сверяем дату появления товара, с датой продажи (деактивации) Хбаллов/[кол-во дней], чем больше дней висит товар без продажи тем меньше баллов получает человек. Задача в лоб, даем за 1 товар 10 баллов, если человек продает в течении 10 дней он хороший продавец (итоговый бал 1.1>1) , если позже 10 дней плохой (0.9<1)
Точно так же умножаем этот рейтинг, если человек продает один товар несколько раз (не может продать), в результате его рейтинг мерчанта будет в геометрической прогрессии уменьшатся.

  1. Если человек продает много однотипного товара (5 квартир, например) занчит он должен иметь рейтинг владельца минимальный, так же по системе везов множим индексы со значением ниже единицы за каждый активный однотипный товар
    0,9х0,9,х0,9 = 0,729

Далее выводим пользователю продавцов отсортированных по рейтингу, либо владельцев сначала, либо хороших продавцов