/Mars_Curiosity

MSL Curiosity - Exploração dos dados e implementação do modelo de regressão linear.

Primary LanguageJupyter Notebook

Curiosity Marte 🟠

Por Victor Augusto Souza Resende

23 de Maio de 2021

O rover Curiosity, parte da missão Mars Science Laboratory, pode ser considerada uma dos feitos mais bem sucedidas da raça humana em outro planeta, nesse caso, em Marte. O rover está no planeta vermelho desde 12 de Agosto de 2012 até então, entretanto, para a confecção desse projeto foram utilizados os dados coletados até o dia 07 de Abril de 2021. Dessa forma, com a coleta dos dados por parte do robô, foi possível acessá-los em uma API por meio da linguagem de programação Python. Então, foi possível executar um projeto de ciência de dados e machine learning de ponta à ponta, com aplicações e validações estatísticas sobre os dados coletados pelo rover.

Esse projeto foi executado utilizando a metodologia de mineração de dados denominada CRISP-DM. De maneira rápida, o CRISP é considerado um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para resolver problemas, desde a criação de perguntas norteadoras às abordagens que serão utilizadas para responder tais perguntas. Dessa forma, nesse projeto, foi solicitado a resposta de duas perguntas norteadoras:

  • Quais características climáticas e ambientais Marte apresentou nos anos de exploração?
  • Dada as variáveis, é possível fazer uma previsão em relação à temperatura média máxima do solo de Marte?

Então, ao fim da etapa de implementação do CRISP-DM, dedicou-se a criação de uma hospedagem web via streamlit, da qual é uma biblioteca da linguagem Python, para a implementação da conclusão deste projeto. Portanto, no canto superior esquerdo, no menu, é possível acessar as duas conclusões, a primeira em relação ao relatório climático de Marte e a segunda sobre o modelo de regressão linear múltiplo criado, do qual possui interação com o usuário.

Nesse repositório há todos os arquivos utilizados para a confecção desse projeto. A pasta documentação possui o arquivo PDF da qual contêm toda a documentação da criação desse projeto com a abordagem CRISP-DM. Na pasta Notebook está o arquivo Jupyter Notebook da qual foi utilizado para a confecção dos códigos nas análises. E então, o restante é referente à implementação streamlit para a resposta das duas perguntas norteadoras.