Sou um Cientista de Dados graduado em Ciência da Computação pela Universidade Federal do Ceará, e tenho experiência em projetos pessoais envolvendo a coleta, preparação e análise de dados estruturados e não estruturados. Além disso, possuo conhecimentos em análise estatística, análise descritiva, modelagem preditiva e Machine Learning. Utilizo frequentemente a linguagem Python e suas principais bibliotecas, como Pandas, Scikit-learn e Numpy, para manipulação, processamento e limpeza de dados em análises complexas. Também possuo habilidades em SQL e visualização de dados.
Background in: Python | SQL | Machine Learning
Links:
Aqui você encontra os notebooks dos meus projetos na área de Data Science, Machine Learning e Data Analysis.
-
Estudo sobre a OList: Atidade completa, começando por um ETL, em que baixo os dados do kaggle, para em seguida transformo eles torná-los mais adequados aos estudos e por fim crio modelos pra testar qual o mais adequado. (Ainda em andamento).
-
Linkedin: Nesta atividade utilizando o Selenium realizo um Web Scraping no Linkedin para em um segundo momento utilizar o NLTk para descobrir quais as skills mais pedidas pelos recrutadores.
-
Identificação de inclinação de imagens: Aprendizagem de imagem supervisionado, utilizando um conjunto de 50.000 imagens já rotuladas com o valor de rotação. Identificação da inclinação e realinhamento, em outro dataframe, contendo 5.000 novas imagens.
-
Projeto de consumo de api do governo: Um MOC onde consumo uma api do governo com a biblioteca request e uso merge para unir várias tabelas, tornando mais inteligível para o usuário.
-
Estudo de Segurança Pública: Realização de um estudo de caso para fins de verificação de quais ruas e bairros onde mais ocorrem roubos, utilizando dados disponibilizados pela Secretaria de Segurança de São Paulo. Utilização do modelo Arima para prever a quantidade de novos casos.
-
Projeto de Webscraping:: Um MOC simples para aprender web scraping e usar a biblioteca request.
-
Desafios propostos pelo curso de aceleração da Codenation: Desafios práticos com foco em funções estatísticas, tais como PDF, CDF, PCA e RFE. Utilização de dados reais provenientes do Enem, dos Atletas Olímpicos e dos jogadores da FIFA.
- Curso Imersão em ciência de Dados (40h):
- Curso Introdução ao Docker (8h):
- Curso Introdução ao Kubernetes (4h):
- I Hackathon de Ciência de Dados:
- Python para Finanças: Investimentos & Análise de Dados (7h):
- Fundamentos de Linguagem Python Para Análise de Dados e Data Science (72):
- Curso como Vencer uma Competição de Ciência de dados (54h):
- Data Science: analise e visualização de dados (6h):
- Python Pandas: tratando e analisando dados (12h):
- Pandas: conhecendo a biblioteca (8h):
- Pandas: seleção e agrupamento de dados (8h):
- Pandas: transformação e manipulação de dados (6h):
- Estatística com Python: frequências e medidas (10h):
- Estatística com Python: probabilidade e amostragem (10h):
- Data Science: análise de series temporais (6h):
- Regressão linear: testando relações e prevendo resultados (12h):
- Regressão Linear: técnicas avançadas de modelagem (5h):
- Data Visualization: criação de gráficos com o Matplotlib (6h):
- Data Visualization: técnicas de visualização com Google Sheets (8h):
- Data Visualization: explorando com Seaborn (8h):
- Data Science: testes estatísticos com Python (6h):
- Análise de experimentos: testes, mapas de cores e análises dos dados (6h):
- Corretor Ortográfico em Python: aplicando técnicas de NLP (10h):