/pnad

Extraindo informações da PNAD2013

Primary LanguagePython

Intro

O projeto pnad2013 tem o propósito de facilitar o acesso aos dados sobre a população Brasileira publicados pelo IBGE. +Ao invés de requerer programas como SAS ou as linguagens +como R, utiliza a linguagem Python e a biblioteca Pandas.

Instalação

É necessário ter o Python instalado, além disso, é sugerido o virtualenvwrapper para isolamento de ambientes.

Abra o terminal e digite:

$ pip install -r requirements.txt

Execução

Conversão do arquivo de entrada (Input)

Como citado, o IBGE disponibiliza esses dados para o software GNU R e outros programas proprietários. Porém, o script que gera o output final precisa da descrição da estrutura do arquivo Dados/PES2013.txt no pacote disponibilizado pelo IBGE.

O arquivo de input Input/input PES2013.txt compatível com o programa proprietário SAS foi manualmente convertido pra um formato menos complexo e está disponível nesse mesmo repositório, chamado input.txt.

Para converter o arquivo de dados, execute:

$ python convert.py input.txt <pacote-do-IBGE>/Dados/PES2013.txt > PES2013.csv

Output

Para obter um CSV com os campos Região, Faixa etária, Renda, N, Peso e N * P, execute no terminal:

$ python pnad2013.py PES2013.csv > output.csv