/pandas-bad-data

Material used in my Artificial Inteligence presentation on Python On Rio XXII.

Primary LanguageJavaScript

Apresentação que fiz na PythonOn Rio XXII, sobre Pndas Para Data Science

A apresentação foi focada no uso de Pandas para tratamento de Bad Data, ou seja, limpeza de dados ruins.

Os notebooks utilizados na apresentação estão englobados num virtualenv, o arquivo de dependências é requiriments.lst, está em formato [pip](https://pt.wikipedia.org/wiki/Pip_(gerenciador_de_pacotes). Tudo em Python 3.

Algumas observações

* A maioria das imagens da apresentação de slides não está disponível, mas pode-se observar os resultados pelos notebooks Jupyter
* Os dados obtidos foram modificados de públicos obtidos em [dados.gov.br](dados.gov.br), vale a pena dar uma olahda, ótima fonte de material para Data Science
* A planilha original foi obtida [deste link](http://dados.gov.br/dataset/ocorrencias-livro-vermelho-2013), e tem licença [Creative Commons](http://opendefinition.org/od/2.0/pt-br/)
* Os notebooks estão disponibilizados para uso gratuito para fins lucrativos ou não, porém, solicito encarecidamente que cite a fonte:

André Claudino (@andreclaudino)
Pandas Para Bad Data
https://github.com/andreclaudino/pandas-bad-data