PythonOn Rio XXII, sobre Pndas Para Data Science
Apresentação que fiz naA apresentação foi focada no uso de Pandas para tratamento de Bad Data, ou seja, limpeza de dados ruins.
Os notebooks utilizados na apresentação estão englobados num virtualenv, o arquivo de dependências é requiriments.lst, está em formato [pip](https://pt.wikipedia.org/wiki/Pip_(gerenciador_de_pacotes). Tudo em Python 3.
Algumas observações
* A maioria das imagens da apresentação de slides não está disponível, mas pode-se observar os resultados pelos notebooks Jupyter
* Os dados obtidos foram modificados de públicos obtidos em [dados.gov.br](dados.gov.br), vale a pena dar uma olahda, ótima fonte de material para Data Science
* A planilha original foi obtida [deste link](http://dados.gov.br/dataset/ocorrencias-livro-vermelho-2013), e tem licença [Creative Commons](http://opendefinition.org/od/2.0/pt-br/)
* Os notebooks estão disponibilizados para uso gratuito para fins lucrativos ou não, porém, solicito encarecidamente que cite a fonte:
André Claudino (@andreclaudino)
Pandas Para Bad Data
https://github.com/andreclaudino/pandas-bad-data