Este é um exemplo de análise de dados de cogumelos comestíveis usando Python e bibliotecas como pandas e scikit-learn.
Este projeto analisa um conjunto de dados de cogumelos para determinar se são comestíveis ou venenosos com base em várias características. O código a seguir realiza a análise e a construção de um modelo de classificação.
-
Certifique-se de ter as bibliotecas necessárias instaladas:
-
Execute o código Python em seu ambiente de desenvolvimento. Certifique-se de que o arquivo de dados 'mushroom_dataset.csv' esteja no mesmo diretório.
-
O código realiza as seguintes etapas:
- Carrega o conjunto de dados.
- Aplica a codificação one-hot nas colunas categóricas.
- Divide os dados em recursos (X) e rótulos (y).
- Treina um modelo de classificação ExtraTreesClassifier.
- Exibe a importância das características.
- Plota um gráfico de barras mostrando a contagem de cogumelos comestíveis e venenosos.
- O resultado da validação cruzada é impresso no console.
O modelo ExtraTreesClassifier é treinado e validado com uma taxa de acurácia média impressa no console.
Também são mostradas as características mais importantes e um gráfico de barras que exibe a contagem de cogumelos comestíveis e venenosos.
Contribuições são bem-vindas! Se você deseja melhorar ou adicionar algo a este projeto, sinta-se à vontade para criar um fork e enviar um pull request.
Este projeto é distribuído sob a licença MIT. Consulte o arquivo LICENSE para obter detalhes.