Erro ao tentar processar dados
rodrigo7797 opened this issue · 4 comments
Utilizei o comando run.sh --use-mirror e o mesmo me apresenta o seguinte erro:
File "extract_dump.py", line 166
f"Opção pelo Simples inválida: {row['opcao_pelo_simples']} (CNPJ: {row['cnpj']})"
+1
Verifiquem, por favor, se os arquivos que vocês baixaram do mirror não estão corrompidos. Para fazer isso, vá até a pasta data/download
, baixe o SHA1SUMS do mirror e rode a verificação:
cd data/download
wget https://data.brasil.io/mirror/socios-brasil/SHA1SUMS
sha1sum -c SHA1SUMS
Notas:
- No dia 15 de agosto disponibilizei os dados atualizados após a Receita Federal liberar a atualização.
- Você pode usar os dados já convertidos (veja na thread acima como baixar os arquivos
.csv.gz
, veja o sexto tweet).
Caso não seja isso eu precisaria de mais detalhes, como em que linha ocorreu o problema (colar o comando com a saída do programa e o traceback completo), em qual arquivo e o conteúdo dele.
Acabei de testar aqui e continua com erro no import.
socios-brasil/data/download on master [!]
➜
wget https://data.brasil.io/mirror/socios-brasil/SHA1SUMS
--2019-08-26 10:05:53-- https://data.brasil.io/mirror/socios-brasil/SHA1SUMS
Resolving data.brasil.io (data.brasil.io)... 192.99.5.40, 2607:5300:60:3628::1
Connecting to data.brasil.io (data.brasil.io)|192.99.5.40|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1360 (1,3K) [text/plain]
Saving to: ‘SHA1SUMS’
SHA1SUMS 100%[=================================================================================================>] 1,33K --.-KB/s in 0s
2019-08-26 10:05:54 (162 MB/s) - ‘SHA1SUMS’ saved [1360/1360]
socios-brasil/data/download on master [!]
➜ sha1sum -c SHA1SUMS
DADOS_ABERTOS_CNPJ_01.zip: OK
DADOS_ABERTOS_CNPJ_02.zip: OK
DADOS_ABERTOS_CNPJ_03.zip: OK
DADOS_ABERTOS_CNPJ_04.zip: OK
DADOS_ABERTOS_CNPJ_05.zip: OK
DADOS_ABERTOS_CNPJ_06.zip: OK
DADOS_ABERTOS_CNPJ_07.zip: OK
DADOS_ABERTOS_CNPJ_08.zip: OK
DADOS_ABERTOS_CNPJ_09.zip: OK
DADOS_ABERTOS_CNPJ_10.zip: OK
DADOS_ABERTOS_CNPJ_11.zip: OK
DADOS_ABERTOS_CNPJ_12.zip: OK
DADOS_ABERTOS_CNPJ_13.zip: OK
DADOS_ABERTOS_CNPJ_14.zip: OK
DADOS_ABERTOS_CNPJ_15.zip: OK
DADOS_ABERTOS_CNPJ_16.zip: OK
DADOS_ABERTOS_CNPJ_17.zip: OK
DADOS_ABERTOS_CNPJ_18.zip: OK
DADOS_ABERTOS_CNPJ_19.zip: OK
DADOS_ABERTOS_CNPJ_20.zip: OK
socios-brasil/data/download on master [!]
➜ cd ..
socios-brasil/data on master [!]
➜ cd ..
socios-brasil on master [!]
➜ time python extract_dump.py data/output/ data/download/DADOS_ABERTOS_CNPJ*.zip
File "extract_dump.py", line 166
f"Opção pelo Simples inválida: {row['opcao_pelo_simples']} (CNPJ: {row['cnpj']})"
^
SyntaxError: invalid syntax
python extract_dump.py data/output/ data/download/DADOS_ABERTOS_CNPJ*.zip 0,01s user 0,01s system 39% cpu 0,032 total
@thiagozs, é um erro de sintaxe, você está utilizando a versão incorreta do Python. Requer 3.7+ (veja mais detalhes no README).