基因组学工具合集

整理了一些我所知道的和基因组学相关的工具,可能不全面,欢迎补充

PS: 有中文评论才是我用过的

基因组Survey

  • GenomeScop2.0 : Reference-free profiling of polyploid genomes
  • smudgeplot: Inference of ploidy and heterozygosity structure using whole genome sequencing data

一代组装

二代组装

  • Minia
  • SPAdes: 细菌基因组常用
  • ALLPaths-LG
  • SOAPdenovo: 华大出品

三代contig组装

GFA相关

GFA是目前组装比较认可的格式

三代组装polish

  • Pilon: 利用二代进行polish
  • Racon: 利用三代进行polish
  • NextPolish: 利用二代进行polish
  • Medaka: 利用三代对nanpore进行polish(建议先用Racon Polish至少一次)

去除冗余序列

辅助组装

使用遗传图谱,光学图谱,Hi-C和物种间共线性对contig进行scaffold, 或者是基于已有参考基因组进行辅助组装。

HiC

  • SALSA: 高效率,能纠错使用GFA信息
  • HiCAssembler: 借鉴了3D-DNA
  • 3D-DNA: 搭配JuicerBox效果极佳(但是速度有点慢)
  • ALLHiC: 多倍体HiC组装
  • LACHESIS: 古老的工具,已不再维护

光学图谱

  • Bionano Solve: BioNano提供的一系列分析脚本工具
  • BIONANO ACCESS: BioNano提供的网页工具
  • OMSV: 基于光学图谱鉴定SV
  • OMTools: 光学图谱数据处理,分析和可视化

基于已有基因组

遗传图谱

整合工具

  • ALLMAPS: 可以整合多张图谱做一套比较好的染色体组装

组装质量评估

重复序列注释

基因注释

  • 从头预测

    • AUGUSTUS
    • SNAP
    • GeneMark
  • 三代注释工具

    • FLAIR: 用于nanopore cDNA, native RNA, PacBio的纠错,鉴定isoform,可变剪切分析
    • SQANTI: 新转录本的结构和质量注释
    • PINISH: 构建注释信息
  • 注释流程

WGD分析

  • wgdi: 比较基因组学分析的瑞士军刀
  • wgd

全基因组比对软件

  • LAST
  • LASTZ
  • MUMMER
  • minimap2

共线性可视化

群体结构