/imersao-dados-desafio-final

Este projeto foi desenvolvido durante a Imersão Dados 3 - 2021. Nesta imersão aprendemos sobre o ramo de drug discovery e Machine Learning. Trabalhamos com bases de dados disponibilizados pelo Laboratory innovation science at Harvard em um desafio no kaggle.

Primary LanguageJupyter Notebook

capa_readme

Banco de dados: O banco de dados manipulado no projeto foi obtido a partir do desafio Mechanisms of Action (MoA) Prediction proposto pelo Laboratory innovation science at Harvard e depositado no Kaggle.

Problema

Desenvoler e testar um modelo de Machine Learning com a finalidade de colaborar com o avanço do desenvolvimento de fármacos, medicamentos.

Objetivo:

Verificar se um modelo de Machine Learning é capaz de prever se dado mecanismo de ação (MoA), atividade biológica de determinada molécula, é ativado ou não.

Variável de interesse

  • Mecanismo de ação ativado(1)|não ativado(0)

Bancos de dados

dados_experimentos: dados sobre os experimentos

Essa base de dados contém:

  • id: identificador anonimizado
  • tratamento: com_droga e com_controle
  • tempo: 24, 48 e 72 horas
  • dose: D1 e D2
  • droga: drogas testadas codificadas, anonimizadas
  • g-_: expressão gênica
  • c-_: tipos celulares dados_resultados: dados sobre os resultados experimentais

Essa base de dados contém:

  • id: identificador anonimizado
  • MoAs: demais colunas com o mecanismo de ação analisado

Machine Learning

Foi aplicado o modelo paramétrico de regressão logística. Este modelo é apropriado para a modelagem de resposta bonária, no caso queremos analisar duas respostas MoA ativo ou MoA inativo. *>SANTOS, Alcione Miranda dos et al. Usando redes neurais artificiais e regressão logística na predição da hepatite A. Revista Brasileira de Epidemiologia, v. 8, p. 117-126, 2005.