/biopipeline

Pipeline for variations calling.

Primary LanguagePython

Как скачать себе пайплайн и заставить его работать:

  1. На вашем компьютере должны быть установлены: git, snakemake, docker.

  2. Скачайте snakefile (в нем описано какие программы и когда запускать) и основные папки:

    git clone https://github.com/FedotovaEvgenia/biopipeline.git
    cd biopipeline

  3. Скачайте и распакуйте в папку reference/ референсы и библиотеки (для hg38). Без них пайплайн ничего не знает. Придется скачать 12,3 GB.

  4. Задайте пайплайну входные данные - прямые и обратные риды в формате fastq.

  • Если у вас нет своих данных, вы можете скачать наши (и ничего больше не менять).

  • Если у вас есть свои данные, поместите их в папку input, например: my_reads_R1.fastq, my_reads_R2.fastq и создайте конфиг файл config.json. В config.json запишите:

    {
    "input_folder": "input/",
    "read_name": "my_reads_R",
    "output_folder": "output/"
    }

    Наконец, убедитесь, что в Snakefile в первой строчке правильно указан путь до вашего config.json.

  1. Все! Теперь можно запускать пайплайн:

    user@user-Desktop:/biopipeline$ snakemake

    Результаты работы пайплайна будут в папке output. Конечный результат будет в подпапке freq_parser.


Используемые в пайплайне Dockerfile и некоторые дистрибутивы доступны тут.

Е-мейл для связи: nukkduko@gmail.com