Как скачать себе пайплайн и заставить его работать:
-
На вашем компьютере должны быть установлены: git, snakemake, docker.
-
Скачайте snakefile (в нем описано какие программы и когда запускать) и основные папки:
git clone https://github.com/FedotovaEvgenia/biopipeline.git
cd biopipeline -
Скачайте и распакуйте в папку reference/ референсы и библиотеки (для hg38). Без них пайплайн ничего не знает. Придется скачать 12,3 GB.
-
Задайте пайплайну входные данные - прямые и обратные риды в формате fastq.
-
Если у вас нет своих данных, вы можете скачать наши (и ничего больше не менять).
-
Если у вас есть свои данные, поместите их в папку input, например: my_reads_R1.fastq, my_reads_R2.fastq и создайте конфиг файл config.json. В config.json запишите:
{
"input_folder": "input/",
"read_name": "my_reads_R",
"output_folder": "output/"
}Наконец, убедитесь, что в Snakefile в первой строчке правильно указан путь до вашего config.json.
-
Все! Теперь можно запускать пайплайн:
user@user-Desktop:/biopipeline$ snakemake
Результаты работы пайплайна будут в папке output. Конечный результат будет в подпапке freq_parser.
Используемые в пайплайне Dockerfile и некоторые дистрибутивы доступны тут.
Е-мейл для связи: nukkduko@gmail.com