/app

Framework de Mixture of Experts para Explicabilidade de Estados de Ansiedade

Primary LanguageJupyter NotebookMIT LicenseMIT

Este notebook implementa um framework de Mixture of Experts (MoE) para melhorar a explicabilidade dos estados de ansiedade antes e após intervenções em diferentes grupos experimentais. O framework combina Modelos de Linguagem Grandes (LLMs) com inferência causal e um agente DDQN (Deep Q-Network Duplo) simplificado para potenciais recomendações de ação.

Estrutura do Fluxo de Trabalho

O notebook segue um fluxo de trabalho estruturado para análise de dados de intervenção de ansiedade:

  1. Carregamento e Validação de Dados: Carrega dados sintéticos de intervenção de ansiedade, valida sua estrutura, conteúdo e tipos de dados, tratando potenciais erros com elegância.

  2. Pré-processamento de Dados: Realiza codificação one-hot de características categóricas e escala características numéricas.

  3. Descoberta de Estrutura Causal (Baseada em Regressão): Utiliza regressão para inferir potenciais relações causais entre variáveis.

  4. Cálculo de Valores SHAP: Computa valores SHAP para avaliar a importância das características na previsão dos níveis de ansiedade pós-intervenção.

  5. Visualização de Dados: Gera gráficos KDE, Violin, Coordenadas Paralelas, Hipergrafo e Matriz de Correlação para facilitar a compreensão dos padrões nos dados.

  6. Resumo Estatístico: Realiza análise bootstrap e gera estatísticas resumidas para quantificar os efeitos da intervenção.

  7. Agente DDQN (Simplificado): Inclui um agente DDQN simplificado como um espaço reservado para potenciais recomendações de ação baseadas na análise.

  8. Relatório de Insights via LLM: Sintetiza descobertas usando Grok, Claude e Grok-Enhanced, enfatizando explicabilidade e a combinação de diferentes técnicas de análise.

Componentes Técnicos

Modelos de Linguagem

O framework integra três modelos de linguagem para análise e interpretação:

  • Grok-base: Fornece análise estatística robusta e relacionamentos causais potenciais
  • Claude 3.7 Sonnet: Foca em padrões visuais e importância de características
  • Grok-Enhanced: Adiciona interpretação nuançada de relacionamentos complexos

Métodos de Visualização

O notebook implementa várias técnicas de visualização:

  • Gráficos KDE: Comparam distribuições de ansiedade pré e pós-intervenção
  • Gráficos Violin: Detalham as formas das distribuições de ansiedade entre grupos
  • Coordenadas Paralelas: Mostram trajetórias individuais de estados de ansiedade pré e pós-intervenção
  • Hipergrafo: Identifica comunidades emergentes de participantes com padrões similares
  • Matriz de Correlação: Revela relações potencialmente causais entre variáveis

Métodos Analíticos

  • Descoberta de Estrutura Causal por Regressão: Uma abordagem baseada em regressão linear para inferência causal
  • Análise SHAP: Explica a contribuição de cada variável para os níveis de ansiedade pós-intervenção
  • Bootstrap Estatístico: Proporciona intervalos de confiança para estimativas robustas
  • DDQN Simplificado: Um agente de aprendizado por reforço demonstrativo para recomendações potenciais

Instalação e Dependências

O notebook requer as seguintes bibliotecas Python:

  • pandas
  • matplotlib
  • seaborn
  • networkx
  • shap
  • scikit-learn
  • numpy
  • plotly
  • scipy

Segurança e Utilização de API

O código inclui espaços reservados para chaves de API (não-funcionais) para Grok e Claude. Em um ambiente de produção, estas chaves deveriam ser gerenciadas com segurança através de variáveis de ambiente ou serviços de gerenciamento de segredos.

Saídas

O framework gera:

  1. Visualizações - armazenadas no diretório de saída especificado
  2. Estatísticas resumidas - salvas como arquivo de texto
  3. Relatório de insights combinado - integrando análises dos três modelos LLM

Limitações e Considerações

  • O agente DDQN é um espaço reservado simplificado e necessitaria adaptação significativa para aplicações do mundo real
  • Os dados utilizados são sintéticos; adaptações seriam necessárias para conjuntos de dados reais
  • As funções de análise de texto LLM são simuladas; em um ambiente de produção, seriam substituídas por chamadas de API reais

Autor

Hélio Craveiro Pessoa Júnior