Mutation-Analysis

说明

该步骤将已有的bam文件链接到新建的../Data/mapped文件夹中，后缀由传入的第二个参数指定
本次新加入的样本中，一部分跑过商检pipeline的流程，直接链接realign以后的bam文件；另一部分无realign bam的，链接的是sorted.filtered.mkdup.bam
input: NAME and FILEPATH
run: bash link.sh $input $suffix

除input以外，调用的脚本与文件包括mutect/mutect2.sh, mutect/mutect2_script.template, /lustre/rdi/user/hantc/Pilot-Work/180116-Zhuang/Data/bed/panel8_{1..20}.bed
脚本中默认将panel8按大小分为20个bed，对于其他panel暂时没有现成的分割文件，需要自行分割并修改调用的mutect.sh脚本中的panel路径
同样用到了parallel.pl，需自行调整parallel.pl中设置的并行数量，HPC上建议为15个，不要过多
该步骤会生成../Results/mutect/${GROUP}_chr_raw文件夹，该文件夹中有按照${TUMOR_NAME}命名的多个文件夹，包含了chr1-chr20共计20个vcf文件（按照bed1-bed20分割）
input: GROUP, NORMAL_NAME and TUMOR_NAME
run: bash run_mutect2.sh $input

除input以外，调用的脚本与文件包括mutect/mutect_merge.R与mutect/Overlap_mutect.R
前者合并多个chr*vcf，生成文件在../Results/mutect/${GROUP}_bedonly中
后者进行过滤与一致性统计，生成结果在../Analysis/Overlap_snp/indel_mutect.txt，另有一些过滤后的vcf文件在../Results/mutect的各个文件夹中
all过滤标准为：FILTER=PASS；NORMAL_VAF<0.4；ExAC_ALL<0.005；thousands<0.005；黑名单人群频率<0.1,；正常人人群频率<0.2；
f1过滤标准为：all+TUMOR_VAF >= 0.03
f2过滤标准为：all+TUMOR_VAF >= 0.05
input: 完整的bed文件
notes: 如果有旧样本，在运行脚本中的annovar注释前将合并后的mutect vcf文件拷贝至同一文件夹
run: bash raw2bedonly2somatic.sh $input

调用的脚本包括clone文件夹中的全部与parallel.pl，调用文件包括panel8的正常人baseline reference与配对列表../Summary/paired.info
配对列表需要header: blood, tumor and lymp
注意本次的分组为配对分组，如果分组情况/组名不同，需要调整代码
run: bash cnvkit.sh

调用/lustre/rdi/user/hantc/tools/GISTIC下的脚本，GISTIC安装在/lustre/rdi/user/hantc/app/GISTIC下，参数设置中amp cutoff为0.7（CN=4），del cutoff为0.7（CN=1）
input: cnvkit的结果文件夹
output: GISTIC的输出文件夹
run: bash run_GISTIC.sh $input $output