Bruno Gómez-Gil
Instrucciones para los diferentes ejercicios en el curso de Bioinformática microbiana del CIAD Mazatlán.
Estas instrucciones están dirigidos a realizarse con la imagen virtual MGlinux18.2 pues allí se tienen ya los sets de datos, programas y scripts para ello.
Los análisis que tenemos descritos aquí son y próximamente se agregarán nuevos:
- Análisis metagenómico con Anvio
- Análisis de amplicones 16-V4
- Clasificación taxonómica de metagenomas
- Análisis transcriptómico de Vibrio parahaemolyticus
- Estimación de genes diferencialmente expresados con DESeq2
Los set de datos comprimidos también se pueden descargar de los siguientes repositorios:
Dataset | Tamaño (MB) | Repositorios | Descripción |
---|---|---|---|
dietas.v2.tar.gz | 148.6 | Figshare GDrive | Cinco metagenomas de heces de camarón recortados a 100,000 secuencias pareadas y diversos análisis ya pre hechos. |
MiSeqSOP.tar.gz | 33.3 | Figshare GDrive | Muestras de heces de rata a diferentes tiempos, región V4 del gen ribosomal 16S, secuencias pareadas 2x150. |
SARSCoV2.tar.gz | 96.9 | Figshare GDrive | Tres muestras de secuencias de SARS-CoV2 (alfa, delta y omicrón) para ensamble. |
ecoli-K12_Illumina.tar.gz | 81.5 | GDrive | Secuencias pareadas de E. coli K12. |
Francisella_pan.tar.gz | 3.1 | Figshare GDrive | Seis genomas de Francisella tularensis para realizar un análisis de pangenoma de la especie. |
ecoli.tar.gz | 149.5 | GDrive | Tres genomas de E. coli análisis pangenómicos y secuencias Illumina y Ion Torrent para ensamble. |
transcritos.tar.gz | 176.3 | GDrive | Seis secuencias de transcritos de Vibrio parahaemolyticus crecido en dos medios de cultivo. |
GDrive = Google Drive
Los set de datos también se pueden descargar desde el servidor bioinformático Biobacter del CIAD; se encuentran en la siguiente ruta:
/raid1/datasets/