uribo/jpndistrict

市町村役場のデータが文字化けする

Closed this issue · 6 comments

お世話になります。シェープファイルをダウンロードする手間が省けてとても楽になりました。

ただ、上記の通り、市町村役場のデータ(jpn_admins)では文字化けしてしまいます。一方で、市町村境界のデータは文字化けしませんでした(jpn_pref)。おそらくエンコードの問題だと思うのですが、何とか改善できますでしょうか。

【市町村役場のデータ jpn_admins(01)】
jis_code type
1 01100 1
2 01101 1
3 01102 1

name
1 <U+008E>D<U+0096>y<U+008E>s<U+0096><U+008F><U+008A>
2 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0096><U+008F><U+008A>
3 <U+008E>D<U+0096>y<U+008E>s<U+0096>k<U+008B><U+0096><U+008F><U+008A>

address
1 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0096>k1<U+008F><U+0090><U+00BC>2
2 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0093>3<U+008F><U+0090><U+00BC>11
3 <U+008E>D<U+0096>y<U+008E>s<U+0096>k<U+008B><U+0096>k24<U+008F><U+0090><U+00BC>6-1-1

geometry
1 POINT (141.3544 43.06197)
2 POINT (141.341 43.05536)
3 POINT (141.3409 43.09069)

【市町村区域のデータ jpn_pref(01)実行】
Simple feature collection with 194 features and 4 fields
geometry type: GEOMETRY
dimension: XY
bbox: xmin: 139.3339 ymin: 41.35158 xmax: 148.8945 ymax: 45.55692
epsg (SRID): 4326
proj4string: +proj=longlat +datum=WGS84 +no_defs

A tibble: 194 x 5

pref_code prefecture city_code city geometry
<POLYGON [arc_degree]>
1 01 北海道 01101 札幌市 **区~ ((141.3423 43.06692, 141.3897 43.06861, 141.369 43.06137, 141.3628 43.053~
2 01 北海道 01102 札幌市 北区 ((141.4085 43.1839, 141.3987 43.17592, 141.4 43.17119, 141.4192 43.17194,~
3 01 北海道 01103 札幌市 東区 ((141.4472 43.15615, 141.4555 43.12895, 141.4538 43.11992, 141.4445 43.10~

uribo commented

ありがとうございます。
ご使用中のOS環境等をお教えいただけますでしょうか。

sessionInfo() の実行結果でもOKです。

uribo commented

手元の環境での再現です。

library(jpndistrict)
#> This package provide map data is based on the Digital Map 25000
#> (Map Image) published by Geospatial Information Authority of Japan
#> (Approval No.603FY2017 information usage <http://www.gsi.go.jp>)
jpn_admins(01)
#> options:        ENCODING=cp932 
#> Reading layer `P34-14_01' from data source `/private/var/folders/12/s9y70flx4z3b67cp237s70xm0000gn/T/RtmpRui6Zl/P34-14_01_GML/P34-14_01.shp' using driver `ESRI Shapefile'
#> Simple feature collection with 373 features and 4 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706
#> epsg (SRID):    4612
#> proj4string:    +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs
#> Simple feature collection with 373 features and 4 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706
#> epsg (SRID):    4612
#> proj4string:    +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs
#> First 10 features:
#>    jis_code type             name                       address
#> 1     01100    1       札幌市役所          札幌市**区北1条西2
#> 2     01101    1 札幌市**区役所         札幌市**区南3条西11
#> 3     01102    1   札幌市北区役所       札幌市北区北24条西6-1-1
#> 4     01102    2       篠路出張所       札幌市北区篠路4条7-2-40
#> 5     01103    1   札幌市東区役所       札幌市東区北11条東7-1-1
#> 6     01104    1 札幌市白石区役所      札幌市白石区本郷通3北1-1
#> 7     01105    1 札幌市豊平区役所     札幌市豊平区平岸6条10-1-1
#> 8     01106    1   札幌市南区役所     札幌市南区真駒内幸町2-2-1
#> 9     01106    2     定山渓出張所 札幌市南区定山渓温泉東4-315-4
#> 10    01107    1   札幌市西区役所        札幌市西区琴似2条7-1-1
#>                     geometry
#> 1  POINT (141.3544 43.06197)
#> 2   POINT (141.341 43.05536)
#> 3  POINT (141.3409 43.09069)
#> 4  POINT (141.3656 43.14572)
#> 5  POINT (141.3637 43.07624)
#> 6  POINT (141.4051 43.04751)
#> 7    POINT (141.38 43.03137)
#> 8     POINT (141.3535 42.99)
#> 9   POINT (141.1631 42.9639)
#> 10 POINT (141.3009 43.07435)

Created on 2019-06-14 by the reprex package (v0.3.0)

Session info
devtools::session_info()
#> ─ Session info ──────────────────────────────────────────────────────────
#>  setting  value                       
#>  version  R version 3.6.0 (2019-04-26)
#>  os       macOS Mojave 10.14.5        
#>  system   x86_64, darwin18.5.0        
#>  ui       unknown                     
#>  language En                          
#>  collate  ja_JP.UTF-8                 
#>  ctype    ja_JP.UTF-8                 
#>  tz       Asia/Tokyo                  
#>  date     2019-06-14                  
#> 
#> ─ Packages ──────────────────────────────────────────────────────────────
#>  package     * version     date       lib source                          
#>  assertthat    0.2.1       2019-03-21 [1] CRAN (R 3.6.0)                  
#>  backports     1.1.4       2019-04-10 [1] CRAN (R 3.6.0)                  
#>  callr         3.2.0       2019-03-15 [1] CRAN (R 3.6.0)                  
#>  class         7.3-15      2019-01-01 [2] CRAN (R 3.6.0)                  
#>  classInt      0.3-3       2019-04-26 [1] CRAN (R 3.6.0)                  
#>  cli           1.1.0       2019-03-19 [1] CRAN (R 3.6.0)                  
#>  crayon        1.3.4       2017-09-16 [1] CRAN (R 3.6.0)                  
#>  crosstalk     1.0.0       2016-12-21 [1] CRAN (R 3.6.0)                  
#>  DBI           1.0.0       2018-05-02 [1] CRAN (R 3.6.0)                  
#>  desc          1.2.0       2018-05-01 [1] CRAN (R 3.6.0)                  
#>  devtools      2.0.2       2019-04-08 [1] CRAN (R 3.6.0)                  
#>  digest        0.6.19      2019-05-20 [1] CRAN (R 3.6.0)                  
#>  dplyr         0.8.1       2019-05-14 [1] CRAN (R 3.6.0)                  
#>  e1071         1.7-2       2019-06-05 [1] CRAN (R 3.6.0)                  
#>  evaluate      0.14        2019-05-28 [1] CRAN (R 3.6.0)                  
#>  fs            1.3.1       2019-05-06 [1] CRAN (R 3.6.0)                  
#>  glue          1.3.1       2019-03-12 [1] CRAN (R 3.6.0)                  
#>  highr         0.8         2019-03-20 [1] CRAN (R 3.6.0)                  
#>  htmltools     0.3.6       2017-04-28 [1] CRAN (R 3.6.0)                  
#>  htmlwidgets   1.3         2018-09-30 [1] CRAN (R 3.6.0)                  
#>  httpuv        1.5.1       2019-04-05 [1] CRAN (R 3.6.0)                  
#>  jpmesh        1.1.3       2019-05-09 [1] CRAN (R 3.6.0)                  
#>  jpndistrict * 0.3.4       2019-05-23 [1] CRAN (R 3.6.0)                  
#>  KernSmooth    2.23-15     2015-06-29 [2] CRAN (R 3.6.0)                  
#>  knitr         1.23        2019-05-18 [1] CRAN (R 3.6.0)                  
#>  later         0.8.0       2019-02-11 [1] CRAN (R 3.6.0)                  
#>  leaflet       2.0.2       2018-08-27 [1] CRAN (R 3.6.0)                  
#>  magrittr      1.5         2014-11-22 [1] CRAN (R 3.6.0)                  
#>  memoise       1.1.0       2017-04-21 [1] CRAN (R 3.6.0)                  
#>  mime          0.7         2019-06-11 [1] CRAN (R 3.6.0)                  
#>  miniUI        0.1.1.1     2018-05-18 [1] CRAN (R 3.6.0)                  
#>  pillar        1.4.1       2019-05-28 [1] CRAN (R 3.6.0)                  
#>  pkgbuild      1.0.3       2019-03-20 [1] CRAN (R 3.6.0)                  
#>  pkgconfig     2.0.2       2018-08-16 [1] CRAN (R 3.6.0)                  
#>  pkgload       1.0.2       2018-10-29 [1] CRAN (R 3.6.0)                  
#>  prettyunits   1.0.2       2015-07-13 [1] CRAN (R 3.6.0)                  
#>  processx      3.3.1       2019-05-08 [1] CRAN (R 3.6.0)                  
#>  promises      1.0.1       2018-04-13 [1] CRAN (R 3.6.0)                  
#>  ps            1.3.0       2018-12-21 [1] CRAN (R 3.6.0)                  
#>  purrr         0.3.2       2019-03-15 [1] CRAN (R 3.6.0)                  
#>  R6            2.4.0       2019-02-14 [1] CRAN (R 3.6.0)                  
#>  Rcpp          1.0.1       2019-03-17 [1] CRAN (R 3.6.0)                  
#>  remotes       2.0.4       2019-04-10 [1] CRAN (R 3.6.0)                  
#>  rlang         0.3.99.9003 2019-06-13 [1] Github (r-lib/rlang@35b11ca)    
#>  rmarkdown     1.13        2019-05-22 [1] CRAN (R 3.6.0)                  
#>  rprojroot     1.3-2       2018-01-03 [1] CRAN (R 3.6.0)                  
#>  sessioninfo   1.1.1       2018-11-05 [1] CRAN (R 3.6.0)                  
#>  sf            0.7-4       2019-04-25 [1] CRAN (R 3.6.0)                  
#>  shiny         1.3.2       2019-04-22 [1] CRAN (R 3.6.0)                  
#>  stringi       1.4.3       2019-03-12 [1] CRAN (R 3.6.0)                  
#>  stringr       1.4.0       2019-02-10 [1] CRAN (R 3.6.0)                  
#>  testthat      2.1.1       2019-04-23 [1] CRAN (R 3.6.0)                  
#>  tibble        2.1.3       2019-06-06 [1] CRAN (R 3.6.0)                  
#>  tidyr         0.8.3.9000  2019-06-08 [1] Github (tidyverse/tidyr@7a2b843)
#>  tidyselect    0.2.5       2018-10-11 [1] CRAN (R 3.6.0)                  
#>  units         0.6-3       2019-05-03 [1] CRAN (R 3.6.0)                  
#>  usethis       1.5.0       2019-04-07 [1] CRAN (R 3.6.0)                  
#>  vctrs         0.1.0.9004  2019-06-13 [1] Github (r-lib/vctrs@ee5ed26)    
#>  withr         2.1.2       2018-03-15 [1] CRAN (R 3.6.0)                  
#>  xfun          0.7         2019-05-14 [1] CRAN (R 3.6.0)                  
#>  xtable        1.8-4       2019-04-21 [1] CRAN (R 3.6.0)                  
#>  yaml          2.2.0       2018-07-25 [1] CRAN (R 3.6.0)                  
#>  zeallot       0.1.0       2018-01-28 [1] CRAN (R 3.6.0)                  
#> 
#> [1] /usr/local/lib/R/3.6/site-library
#> [2] /usr/local/Cellar/r/3.6.0_2/lib/R/library
uribo commented

1cd6007 こちらのコミットで対応してみましたがご確認いただけますでしょうか。

デフォルトのエンコードが市町村役場のデータ、行政区域データで異なっているようでした。
市町村役場のデータの方ではエンコードがcp932、行政区域データではUTF8になっているようで、その部分を修正しました。

uribo commented

ご確認いただき、ありがとうございました。
お手数おかけしました。