alvesrco/pipecov

Erro no Rscript

moreiradaniel opened this issue · 6 comments

Olá Ronnie, tudo bem?

O pipeline de montagem está funcionando normalmente?
Porque eu implementei ele na Fiocruz e estava dando um erro, que ao "debugar" o script percebi que era na linha 175 do script com as funções para gerar o consenso (https://github.com/alvesrco/covid19_itvds/blob/master/dockerfiles/R/wgs_functions.R). A linha está escrita assim:
"poor_cov<-which(colSums(cm)<0);"

Olhando o script original (https://github.com/proychou/ViralWGS/blob/master/wgs_functions.R), percebi que ao invés do '0', seria '10'.
"poor_cov<-which(colSums(cm)<10);"

Foi intencional essa modificação? E não gerou um erro para vocês?

Um abraço,
Daniel Moreira

Oi, Daniel! Tudo bem?

Sim, a mudança foi intencional.
O que acontece é que originalmente o script em R não permitia que escolhêssemos uma cobertura mínima para os contigs. Já tava definido como cobertura mínima de 10X.

Pra que a gente pudesse escolher a cobertura que quiséssemos, tive que fazer tal alteração.
Qual foi a cobertura mínima que você especificou para o pipeline? Já adianto que o pipeline deu erro muito provavelmente porque o resultado da montagem do SPAdes não obteve contigs com a cobertura mínima especificada. Você pode verificar isso abrindo o arquivo fasta gerado na etapa do SPAdes.

Se não chegou na etapa do SPAdes, pode enviar pra gente o log de output e de erros gerados? Aí poderemos ver mais a fundo o que pode ter acontecido.

Abcs,

Oi, Ronnie,
Trabalho na Plataforma de Bioinformática da Fiocruz Rio.

Oi, @reinator, eu usei a cobertura de 10 (default). Não sei se o erro veio da montagem do Spades, porque o script hcov_make_seq.R onde usei a informação de cobertura mínima passou sem problemas. O erro veio no script wgs_functions.R.
Para você escolher a cobertura desejada, essa linha do Rscript não precisaria entrar como variável?

Abraços,

Oi, Daniel.

Quando trocamos o valor para zero, basicamente estamos dizendo para o script wgs_functions.R que nenhum contig deve ser considerado "poor", uma vez que o que é passado pra ele já é o arquivo Isso já é feio ao se gerar o arquivo "scaffolds_filtered.fasta", que é o que ele usa.

Novamente, se puder mandar o log de erros e o também o scaffolds_filtered.fasta, poderemos ver melhor o que pode ter acontecido ou se é como eu falei: muito provavelmente sua amostra não teve reads o suficiente mapeadas contra o genoma de referência, para o pipeline continuar.

Uma sugestão para teste: diminua o valor da cobertura e inclua mais sequências de sars-cov-2 no seu arquivo fasta de referência.

Se continuar dando erro, nos envie os logs e o arquivo scaffolds_filtered.
Abcs,

How can I translate your comments?? Is there a feature in github ?

I am sorry @Rohit-Satyam. I guess you will have to use some translator tool.
But if you have any doubts, just create a new issue with your problem and we will help you.

Cheers,