Platform chat on Discord

Desafio 04 | Algar

Para te ajudar

1. Sobre a Algar

1.1. Introdução

Há 21 anos repensamos a experiência dos seus clientes e a gestão do ambiente de tecnologia, com um único propósito: conectar pessoas e organizações de um jeito único para ser o melhor parceiro para os seus melhores resultados.

Atuamos em toda a América Latina, e o nosso maior diferencial é a Nossa Gente! Aqui todo mundo se sente em casa. Nosso ambiente é COOL, nossa diversidade é o nosso tempero e o nosso conhecimento é a nossa força.

Nossa missão é conectar pessoas e organizações de um jeito único. Somos feitos para quem busca resultados, e por isso nos comprometemos a transformar o relacionamento entre clientes e empresas por meio de soluções inteligentes.

video

2. Desafio de negócio

O turnover alto gera uma série de custos adicionais, indo muito além do impacto na lucratividade, rentabilidade e o próprio crescimento da organização. A saída em excesso cria um clima inadequado, no qual conflitos interpessoais podem ocorrer com maior frequência, e gerando também a perda de conhecimento. A comunicação interna e externa é afetada, impactando inclusive na atração de novos talentos.

3. Objetivo

Este desafio tem como objetivo criar um modelo no Modeler Flow (SPSS) capaz de encontrar o melhor candidato de acordo com as variáveis do dataset fornecido. Sua terefa é modelar os dados de tal forma que o modelo que recebe como entrada todas as colunas do dataset e forneça como saída se o candidato deve ser contratado ou não.

thumb

4. Desenvolvendo a solução

4.1. Pré-requisitos

Para realizar esse desafio você deverá cumprir os seguintes pré-requisitos:

  • Registrar-se na Maratona Behind the Code e confirmar seu e-mail de cadastro.
  • Possuir uma conta na IBM Cloud, podendo ser a conta FREE ou pay-as-you-go (não é necessário registrar-se no evento com o mesmo e-mail utilizado para criar sua conta na IBM Cloud).

4.2. Resumo das tarefas

  1. Instanciar o Watson Studio (Cloud Pak for Data as a Service) na IBM Cloud - ATENÇÃO: Se você já fez o desafio 2 não precisa instanciar um novo, pode usar a mesma;
  2. Instanciar o Cloud Object Storage na IBM Cloud - ATENÇÃO: Se você já fez o desafio 2 não precisa instânciar um novo, pode usar a mesma;
  3. Criar um projeto em branco no Watson Studio;
  4. Clique em 'Add to project' em seguida insira o Modeler Flow no projeto;
  5. Escolha a opção 'from file' e faça o upload do arquivo modeler_flow.str
  6. Adicione os dois arquivos .csv fornecidos neste repositório (pasta data)
  7. A saída do seu modelo deve ser uma tabela, você encontra ela no lado esquerdo na aba 'Output'
  8. Exporte seu Modeler Flow e compacte ele numa pasta zip junto com o arquivo results.csv, conforme mostrado no vídeo abaixo. Você deve submeter ele também
  9. Acessar a página https://algartech.maratona.dev e faça upload do arquivo zip com a solução.

4.3. Desenvolvimento

A ideia essencial é criar um modelo baseado em machine learning, capaz de contratar o melhor candidato baseado em algumas variáveis permitindo assim a contratação do profissional mais adequado a vaga. Trata-se de um problema de classificação binária, onde a partir da entrada o modelo só existem dois valores possíveis de saída.

Para simplificar o desafio e mostrar ao usuários outras opções de modelagem dentro do Watson Studio (Cloud Pak for Data as a Service) é pedido que seja usado o Modeler Flow(SPSS). Sua simplicidade e interface amigável torna acessível o uso, aprendizado e pesquisa na área de ciência de dados por pessoas que não possuem um grande conhecimento em python ou R.

Em linhas gerais, o Modeler Flow tem a mesma função de um jupyter notebook, a diferença reside no fato de que a ferramante abstraí a parte do código para focar somente nos dados.

5. Submissão

ATENÇÃO! UPDATE NO PROCESSO DE SUBMISSÃO

Veja o vídeo https://youtu.be/h0RyVM1K0i4 com as novas instruções (apenas para submissões realizadas após o dia 3/SET)

Para realizar a submissão, primeiramente você deverá acessar a seguinte aplicação: https://algartech.maratona.dev/ e preencher o formulário com seu e-mail (usado no registro no https://maratona.dev/) e fazer upload do arquivo .zip com seu "modeler_flow.str" e "results.csv".

6. Sobre a avaliação

Nosso sistema de avaliação automática irá calcular métricas de acurácia e pontuar sua solução de acordo com a qualidade do modelo submetido.

O tempo de entrega não entra no cálculo da pontuação do desafio. Entretanto, para todos os participantes que entregarem esse desafio na primeira semana após o lançamento receberão um bônus na pontuação final.

Material de apoio

Em caso de dúvidas

Caso o vídeo publicado acima não seja suficiente, você pode analisar a documentação oficial dos serviços envolvidos no desafio:

Você também pode acessar o discord oficial da Maratona 2020 para realizar perguntas e/ou interagir com outros participantes: Discord.

License

Copyright 2020 Maratona Behind the Code

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at

   http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.