整理了一些我所知道的和基因组学相关的工具,可能不全面,欢迎补充
PS: 有中文评论才是我用过的
- GenomeScop2.0 : Reference-free profiling of polyploid genomes
- smudgeplot: Inference of ploidy and heterozygosity structure using whole genome sequencing data
- Celera Assembler: 最具代表性的工具
- Minia
- SPAdes: 细菌基因组常用
- ALLPaths-LG
- SOAPdenovo: 华大出品
- falcon: PacBio专用组装工具
- Canu: 老牌工具,资源消耗大
- HINGE
- MECAT: 高效的三代组装工具
- MECAT2: PacBio专用组装工具
- NECAT: Nanopore专用组装工具
- NextDenovo: 可用于Nanopore的组装工具
- FLYE
- SMARTdenovo
- WTDBG2: 不对原始数据纠错,快速的组装工具
- Shasta: Nanopore组装工具
GFA是目前组装比较认可的格式
- Pilon: 利用二代进行polish
- Racon: 利用三代进行polish
- NextPolish: 利用二代进行polish
- Medaka: 利用三代对nanpore进行polish(建议先用Racon Polish至少一次)
- HaploMerger2
- Redundans
- purge_haplotigs
- purge_dups: 借鉴了purge_haplotigs,但是更快更自动化,智能确定阈值
使用遗传图谱,光学图谱,Hi-C和物种间共线性对contig进行scaffold, 或者是基于已有参考基因组进行辅助组装。
- SALSA: 高效率,能纠错使用GFA信息
- HiCAssembler: 借鉴了3D-DNA
- 3D-DNA: 搭配JuicerBox效果极佳(但是速度有点慢)
- ALLHiC: 多倍体HiC组装
- LACHESIS: 古老的工具,已不再维护
- Bionano Solve: BioNano提供的一系列分析脚本工具
- BIONANO ACCESS: BioNano提供的网页工具
- OMSV: 基于光学图谱鉴定SV
- OMTools: 光学图谱数据处理,分析和可视化
- ALLMAPS: 可以整合多张图谱做一套比较好的染色体组装
-
从头预测
- AUGUSTUS
- SNAP
- GeneMark
-
三代注释工具
- FLAIR: 用于nanopore cDNA, native RNA, PacBio的纠错,鉴定isoform,可变剪切分析
- SQANTI: 新转录本的结构和质量注释
PINISH: 构建注释信息- pipeline-nanopore-ref-isoforms: 利用Nanopore数据进行基因注释,是PINISH的替代者
-
注释流程
- LAST
- LASTZ
- MUMMER
- minimap2