Corrigir erros de atribuição Wikidata
Closed this issue · 3 comments
ppKrauss commented
Conforme #23 temos
novo wdId | ref idIBGE | nota |
---|---|---|
Q22062859 | 2931400 | Teodoro Sampaio/BA |
Q13109202 | 3554300 | Teodoro Sampaio/SP |
e também foram detectados na Wikidata erros de atribuição:
qid | P1585 | nome | qid_correto |
---|---|---|---|
Q818261 | 2900702 | Alagoinhas/BA | Q22050101 |
Q975677 | 4201208 | Antônio Carlos/SC | Q22063985 |
Q608983 | 5201504 | Aporé/GO | Q22067258 |
Q624997 | 5201702 | Aragarças/GO | Q22067256 |
ppKrauss commented
Mais correções:
name | wdId_corrigido | idIBGE |
---|---|---|
Almas/TO | Q22060165 | 1700400 |
Anapu/PA | Q22060315 | 1500859 |
Anastácio/MS | Q22067433 | 5000708 |
Anhumas/SP | Q22066885 | 3502408 |
Anicuns/GO | Q22067260 | 5201306 |
Antônio João/MS | Q22067430 | 5000906 |
Aral Moreira/MS | Q22067428 | 5001243 |
Datas/MG | Q1791966 | 3121001 |
Ladainha/MG | Q3200990 | 3137007 |
Alto Paraíso de Goiás/GO | Q22060523 | 5200605 |
Cotriguaçu/MT | Q2013031 | 5103379 |
Cutias/AP | Q1754422 | 1600212 |
Duque de Caxias/RJ | Q193021 | 3301702 |
Fronteiras/PI | Q2064409 | 2204303 |
(14 registros)
A planilha devolve updates e os mesmos podem ser confirmados com o relatorio acima, gerado pela consulta:
SELECT name||'/'||state,"wdId","idIBGE"
FROM io.citybr
WHERE "idIBGE" in (
'1700400', '5200605', '1500859', '5000708', '3502408', '5201306', '5000906',
'5001243', '5103379', '1600212', '3121001', '3301702', '2204303', '3137007'
);
ppKrauss commented
Permanecem ainda 38, sendo os mais graves (nem sequer é entidade contida no Brasil), os seguintes:
name | wdId | idIBGE |
---|---|---|
Ladainha/MG | Q3200990 | 3137007 |
Monções/SP | Q42967 | 3531001 |
Montanhas/RN | Q8502 | 2407708 |
Morros/MA | Q54050 | 2107100 |
Nossa Senhora das Graças/PR | Q656895 | 4116406 |
Periquito/MG | Q8329 | 3149952 |
Salinas/MG | Q244326 | 3157005 |
São João da Mata/MG | Q470597 | 3162302 |
São Miguel/RN | Q45581 | 2412500 |
São Rafael/RN | Q56951 | 2412807 |
Umbuzeiro/PB | Q1552284 | 2517001 |
Vicência/PE | Q29551446 | 2616308 |
Portanto listando com a query definida em #26,
COPY (
SELECT "idIBGE",name||'/'||state as cidade_nome, '' as "WIKIDATA_correctConfirmed",
concat('https://www.google.com.br/search?q=',replace("lexLabel",'.','+'),'+',upper(state),'+wikipedia+município') as "click_and_check"
FROM io.citybr
WHERE "idIBGE" IN (
'3137007','3531001','2407708','2107100','4116406','3149952','3157005',
'3162302','2412500','2412807','2517001','2616308'
)
) to '/tmp/buscarWikidataCorreto.csv' HEADER CSV;
ppKrauss commented
Ultima versão da planilha de correção COLABORATIVA...
Com ela o problema foi resolvido, 38 itens revisados.