cnarea20181031数据改动说明
kakuilan opened this issue · 3 comments
kakuilan commented
cnarea20181031数据改动说明
- 数据表结构更改
之前几个版本的数据更新后,经常有基友反馈,因为国内某些区域的新增或裁撤,可能造成同一个地址的id变化,导致出现与cnarea相关表的历史数据不匹配的情况。
观察了近几年国内的官方数据,大陆地区的area_code(统计用区划代码)很少有改动,除非该地址在行政上做出了调整。因此决定将area_code作为唯一键使用,id只是一个辅助的排序字段。对应的,将parent_id改为parent_code,作为上下级查询字段。 - 港澳台area_code编码规则
国家统计局目前尚未公布港澳台地区的数据,而且距离官方为它们进行统一编码应该还有一段时间。因此只能暂由个人对这些数据进行唯一编码。
编码规则为:使用murmurhash3对完整地址(如**省云林县元长乡庄内路)进行编码,取一个11位整数值,再加上港澳台前缀码。
前缀码:香港为70,澳门为71,**为72。 - 2018**数据比2017多7千多
因为数据源中存在将大量同一道路但不同门牌号的地址,作为不同的单独地址,而且它们的邮编也可能不相同。例如,“福来路(双130巷以上)”、“福来路(单131号以上)”、“中山路(双160号以上)”、“中山路(单183号以上)”等。本次数据更新也遵循数据源的做法(因为没时间人工一个个去对这些地址做甄别和去重)。所以,比2017多了7千记录。 - 大陆地区村/社区数据变化
- 2013年 694666
- 2014年 670479
- 2015年 667519
- 2016年 666655
- 2017年 672584
- 2018年 665040
估计2017年的数据有误差。整体上看,很多村庄在消失。感慨一下。
以上信息,请各位了解。
houseme commented
村消失了是因为好多村级组织合并导致的吧!
shizhimin123 commented
我想问下 数据里面的经纬度的坐标系是高德还是84的呀
kakuilan commented
@shizhimin123
省市县是高德的,区县以下是腾讯的.
#38