assembly_and_annotation/
scripts para automatizar o processo de montagem e anotação de genomas paired
- FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)
- Trimmomatic (http://www.usadellab.org/cms/?page=trimmomatic)
- VelvetOptimiser (https://github.com/tseemann/VelvetOptimiser)
- Prokka (https://github.com/tseemann/prokka)
- Assembly-stats (https://github.com/sanger-pathogens/assembly-stats)
neste modo um unico comando é necessário, onde será realizado a análise da qualidade do sequenciamento, a trimagem, a análise da trimagem, a montagem, a contagem de contigs e a anotação
$ AssemblyAnnot.pl files.tab dir_dos_scripts dir_dos_fastq
- files.tab arquivo tabular onde a primeira coluna contém a read1 e a segunda coluna contém a read2
- dir_dos_scripts caminho completo para os scrits disponíveis aqui
- dir_dos_fastq caminho completo para diretório onde consta todos os dastq
O primeiro passo necessário é o de análise do sequenciamento com fastaqc dessa forma é necessário rodar inicialmente:
$ first_fastqc.pl files.tab dir_dos_fastq
- first_fastqc.pl cria os diretórios necessários para todos os scripts e roda o fastqc para todas as sequencias
- files.tab é um arquivo tabular onde a primeira coluna contém a read1 e a segunda coluna contém a read2
- dir_dos_fastq caminho completo para diretório onde consta todos os dastq
Após rodar o first_fastqc.pl, qualquer um dos demais outros scripts podem ser utilizados junto com o arquivo files.tab
$ qualquer_um_dos_demais_scripts.pl files.tab dir_dos_fastq
- trimmo_automatic.pl (trima as sequencias por qualidade)
- fastq_direc.pl (roda o fastqc para sequencias trimadas)
- velvetOp_automatic.pl (roda a montagem com o velvetOptimiser)
- count_contig.pl (realiza a contagem dos contigs e roda o assembly-stats para verificar a montagem)
- prokka_automatic.pl (realiza a anotação com o prokka)