本项目提供2个爬虫用于爬取国家统计局及民政部公布的数据,相对而言民政部公布的数据更加符合
GB/T 2260
的标准。
截至2018年2月底,中华人民共和国各级行政区划统计数量如下:
具体可以参考《民政统计代码编制规则》
《中华人民共和国行政区划代码》国家标准中定义县及县以上使用6位数字标识,代码从左至右的含义是:
- 第一、二位表示省级行政单位(省、自治区、直辖市、特别行政区),其中第一位代表大区;
- 第三、四位表示地级行政单位(地级市、地区、自治州、盟及省级单位直属县级单位的汇总码);
- 第五、六位表示县级行政单位(县、自治县、市辖区、县级市、旗、自治旗、林区、特区);
另外,《民政统计代码编制规则》中定义了12位的编码,分为3段,用于统计到最基层的居委会,具体规则如下:
□□□□□□ ----- □□□ ----- □□□
↑ ↑ ↑
第一段 第二段 第三段
- 第一段为 6位数字,表示县及县以上的行政区划,使用《中华人民共和国行政区划代码》国家标准;
- 第二段为 3位数字,按照国家标准《县以下行政区划代码编制规则》编制,其规则如下:
- 第二段的第一位数字为类别标识,以“0”表示街道,“1”表示镇,“2和3”表示乡,“4和5”表示政企合一的单位;
- 第二段的第二位、第三位数字为该代码段中各行政区划的顺序号;
- 第三段 3位数字,标识居民委员会和村民委员会的代码
- Linux/MAC
- Node.js >
v6.*
- npm >
v5.*
或者 yarn
# 推荐使用yarn
yarn install
yarn run crawler
由于
GB/T 2260
未包含香港、澳门、**的行政区划数据,所以分别借鉴ISO3166-2:HK
、ISO3166-2:MO
、ISO3166-2:TW
进行数据补全,但是请注意:这些数据中的行政区划代码并非官方标准,请谨慎使用。
数据以数据源作为分类,按照发布的年份作为单独文件,分别以一维数组的方式存储在data
的二级目录下。
data
├── GB2260
│ ├── 1980.json
│ ├── 1981.json
│ ├── 1982.json
│ ├── 1983.json
│ ├── 1984.json
│ ├── 1985.json
│ ├── 1986.json
│ ├── 1987.json
│ ├── 1988.json
│ ├── 1989.json
│ ├── 1990.json
│ ├── 1991.json
│ ├── 1992.json
│ ├── 1993.json
│ ├── 1994.json
│ ├── 1995.json
│ ├── 1996.json
│ ├── 1997.json
│ ├── 1998.json
│ ├── 1999.json
│ ├── 2000.json
│ ├── 2001.json
│ ├── 2002.json
│ ├── 2003.json
│ ├── 2004.json
│ ├── 2005.json
│ ├── 2006.json
│ ├── 2007.json
│ ├── 2008.json
│ ├── 2009.json
│ ├── 2010.json
│ ├── 2011.json
│ ├── 2012.json
│ ├── 2013.json
│ ├── 2014.json
│ ├── 2015.json
│ ├── 2016.json
│ ├── 2017.json
│ └── 2018.json
├── ISO3166-2
│ ├── HK.json
│ ├── MO.json
│ └── TW.json
└── stats.gov.cn
├── 2003.json
├── 2004.json
├── 2005.json
├── 2006.json
├── 2007.json
├── 2008.json
├── 2009.json
├── 2010.json
├── 2011.json
├── 2012.json
├── 2013.json
├── 2014.json
├── 2015.json
└── 2016.json
- 国家统计局 - 行政区划代码
- 民政部 - 中华人民共和国行政区划代码
- 维基百科 - 中华人民共和国行政区划
- 维基百科 - 中华人民共和国行政区划代码
- 统计上使用的县以下行政区划代码编制规则
- 民政统计代码编制规则
- 网友资源 - ISO3166-2
Copyright © 2017-present. This source code is licensed under the MIT license found in the LICENSE file.
Made by Tony (blog)