/data-science-challenge

Repository designed to hold the Analytics Data Science challenge for candidates

The UnlicenseUnlicense

Objetivo do desafio

A partir das informações disponíveis no diretório ./src/datasets/ gere uma estimativa de custo para o "projeto 4" e informe o nível de acuracidade da sua estimativa. Documente a solução com clareza, além das etapas ou ferramentas usadas no processo.

Como começar o desafio

Dar um fork no projeto, clonar o repositório em sua máquina local, e caso veja a necessidade de usar código, criar um branch novo, identificando com o seu nome. Não é obrigatório o uso de código para entregar o objetivo do desafio, mas caso use, esse código deve ser carregado na nova branch criada para a entrega do desafio.

Histórias

• Como orçamentista, eu gostaria de um previsão do orçamento da casa denominada "Projeto 4" em reais.

• Como engenheiro responsável pelo projeto, eu gostaria de ter a documentação completa do método usado para chegar ao valor previsto para o "Projeto 4", incluindo cálculos.

• Como gerente comercial da conta do cliente do "Projeto 4", eu gostaria de ter uma base estatística para indicar o quão aproximado o valor estipulado está da realidade, e no caso de variação, quanto esse valor pode variar.

• Como responsável pela gestão de risco de projetos, eu gostaria de entender o risco implícito nessa previsão, indicando o que pode impactar em outliers ou variações acima do previsto.

Referências

• Os datasets necessários para o teste se encontram no diretório /src/datasets/ dentro do projeto.

• Os datasets trazidos nesse projeto são amostras proprietárias da Makasí e devem ser usados única e exclusivamente para a finalidade desse desafio.

Requisitos Técnicos para a entrega do teste

• Sugerimos a utilização de Python para o desenvolvimento do código.

• Utilize seus padrões de organização de projeto, documentação e código.

• Pode ser utilizada qualquer lib adicional que julgar importante para o bom funcionamento da exploração dos datasets, mas não se esqueça de dar as orientações de instalação delas (caso seja necessário).

• Caso haja uma aplicação em código, está será rodada em localhost.

• Ainda na documentação, explicar a sua motivação de escolha das libs e frameworks (ou o motivo de ter feito na mão). Uma explicação sobre a estrutura do projeto também será bem vinda.

• É imprescindível que caso use código para executar o teste, este funcione corretamente em qualquer máquina.

• Documentos adicionais (PDF, PowerPoint, Planilhas e etc) ao teste devem ser compartilhados e enviados para fabiane+dados@makasi.com.br

Observações importantes

A ideia deste desafio é entender como você domina os conceitos de exploração de dados, modelos de previsão, análise de risco e documentação.

Fique à vontade para optar pelos caminhos que desejar sobre qualquer ponto que esteja ausente na instrução. Nossa intenção também é entender como você toma decisões. De qualquer forma, você pode fazer perguntas por e-mail.

Além do que foi pedido nos requisitos técnicos acima, não existe “certo ou errado”, da mesma forma que não vamos levar tudo ao pé da letra nos mínimos detalhes.

Considerações finais

Buscamos entender seu perfil de desenvolvimento, resolução de problemas, raciocinio lógico e boas práticas de análise e ciência de dados.

Esperamos que você vá além do mínimo proposto e demostre o conhecimento que tem. O teste tem gaps propositais para você sugerir soluções, desenvolver ideias e provar na prática o porquê a sua decisão pode ter um impacto positivo nessa tarefa.

No mais, o diálogo é sempre bem-vindo e incentivado, principalmente sugestões e discussões. Caso surjam dúvidas no processo, sintam-se à vontade para nos perguntar.

Boa sorte no teste!

Abraço!