Геокодинг
Opened this issue · 0 comments
Научиться определять координаты события по тексту новости. Попробовать применить несколько эвристик и их комбинаций:
- Запросы к геокодеру пар/троек смежных слов
- Фильтрация стоп-слов новости
- Обращать внимание на слова с большой буквы
- Искать геопозиции только в начале/конце новости
- Обращать внимание на слова в кавычках
Наверное, есть смысл по-прежнему использвать список геообъектов спб, но из них нужно удалить слова, которые часто используются не как гео-объекты.
Так же нужно составить список слов-маркеров геолокаций:
улица, проспект, на, возле, пересечении
, и.т.д
И отправлять геокодеру слова, которые их окружают
Ещё есть геокодер у 2гис http://api.2gis.ru/doc/maps/1.0/manual/geocoding/
вероятно, он лучше умеет кодировать не улицы, а другие объекты, например, организации. На сколько я помню, они умеют работать с опечатками и синонимами, ещё "народными названиями" а-ля "васька" -> "васильевский остров".
Про лимиты на запросы я ничего не нашел
5ce3a54