Este repositório contém um script em R para análise de dados de metagenômica 16S utilizando pacotes como Phyloseq, ggplot2 e dplyr. O script realiza a leitura de arquivos gerados pelo QIIME2 e faz a agregação e visualização de dados taxonômicos em diferentes níveis, como Filo, Gênero e Família.
- Carregamento de arquivos QIIME2: O script aceita arquivos
.qza
gerados pelo QIIME2, como sequências, taxonomia e árvore filogenética. - Análise de Abundância Relativa: Calcula a abundância relativa em níveis taxonômicos diferentes (Phylum, Genus, Family) e gera gráficos de barras empilhadas.
- Flexibilidade com parâmetros: O script é modular e pode ser reutilizado para diferentes datasets, bastando fornecer os nomes dos arquivos.
- Visualizações customizadas: Utiliza
ggplot2
para visualização dos resultados em gráficos com cores definidas para diferentes grupos taxonômicos.
phylo_analysis.R
: O script principal que realiza a análise de abundância relativa e gera os gráficos.data/
: Diretório para armazenar os arquivos de dados utilizados (não incluído no repositório).figures/
: Diretório para armazenar as figuras geradas pelos gráficos (não incluído no repositório).
O script requer os seguintes pacotes R:
phyloseq
biomformat
dplyr
ggplot2
ggsci
gridExtra
qiime2R
stringr
openxlsx
Para instalar todos os pacotes, execute o seguinte código no R:
install.packages(c("phyloseq", "biomformat", "dplyr", "ggplot2", "ggsci", "gridExtra", "qiime2R", "stringr", "openxlsx"))
Certifique-se de que todos os arquivos de dados estejam localizados no diretório correto. No início do script, você pode definir o diretório de trabalho e os arquivos de entrada: diretorio <- "/caminho/para/seus/dados" metadata_file <- "manifesto.qza" features_file <- "sequencias.qza" taxonomy_file <- "taxonomia.qza" tree_file <- "arvore.qza"
- O script é dividido em funções modulares que permitem carregar dados, processá-los e gerar gráficos de abundância relativa em diferentes níveis taxonômicos (Filo, Gênero e Família). Para rodar o script, basta: source("phylo_analysis.R")
Os gráficos são gerados automaticamente e salvos no diretório especificado. Eles incluem:
- Abundância relativa por Filo (phylo_avg_abundance_relative_deep_sea.png)
- Abundância relativa por Gênero (genus_avg_abundance_relative_deep_sea.png)
- Abundância relativa por Família (family_avg_abundance_relative_deep_sea.png)
source("phylo_analysis.R")
diretorio <- "/home/user/metagenomics" metadata_file <- "metadata.qza" features_file <- "features.qza" taxonomy_file <- "taxonomy.qza" tree_file <- "tree.qza"
dados <- carregar_dados_qiime2(diretorio, metadata_file, features_file, taxonomy_file, tree_file)
ps <- criar_phyloseq(dados, features_file, taxonomy_file, metadata_file, tree_file)
gerar_grafico_abundancia(df2, "Host", "avg_abundance", "Phylum", "Env_feature", "Mean of Relative Abundance (% Phyla)", "phylo_abund.png")
- Coral Microbiome Manipulation Elicits metabolic and genetic restructuring to mitigate heat stress and evade Mortality. Santoro, E. P.; Borges, R. M.; Espinoza, J. L.; Freire., M.; Messias, C. S. M. A.; Villela, H. M. D.; Mattos, L. P.; Vilela, C. L. S.; Rosado, J. G.; Cardoso, P. M.; Rosado, P. M.; Assis, J. M.; Duarte, G. A. S.; Perna, G.; Rosado, A. S.; Macrae, A.; Dupont, C. L.; Nelson, K.E.; Sweet, M. J.; Voolstra, C. R.; Peixoto, R. S. Novembro de 2020. Science Advance. v. 7, p. eabg3088, 2021. Link to the Paper