bibaev/news-on-the-map

Геокодинг

Opened this issue · 0 comments

Научиться определять координаты события по тексту новости. Попробовать применить несколько эвристик и их комбинаций:

  • Запросы к геокодеру пар/троек смежных слов
  • Фильтрация стоп-слов новости
  • Обращать внимание на слова с большой буквы
  • Искать геопозиции только в начале/конце новости
  • Обращать внимание на слова в кавычках

Наверное, есть смысл по-прежнему использвать список геообъектов спб, но из них нужно удалить слова, которые часто используются не как гео-объекты.

Так же нужно составить список слов-маркеров геолокаций:
улица, проспект, на, возле, пересечении, и.т.д
И отправлять геокодеру слова, которые их окружают

Ещё есть геокодер у 2гис http://api.2gis.ru/doc/maps/1.0/manual/geocoding/
вероятно, он лучше умеет кодировать не улицы, а другие объекты, например, организации. На сколько я помню, они умеют работать с опечатками и синонимами, ещё "народными названиями" а-ля "васька" -> "васильевский остров".

Про лимиты на запросы я ничего не нашел
5ce3a54