基因组挂载工具HapHiC:系列教程与方法解读

(更新时间:2023-11-24)

写在前面

近期,我们新开发的基因组挂载工具HapHiC在GitHub上公开了代码,相关论文的预印本也发布在了bioRxiv上,并有幸收到了大家热烈的反馈。然而,在这个过程中我发现虽然GitHub上已经有一份使用说明,许多朋友仍然对HapHiC的使用和原理不太了解。这可能是因为GitHub上的说明过于简单,而HapHiC的设计和参数又较为复杂的缘故。同时,越来越多的中国人加入到了基因组学研究的队伍中,并发表了大量高水平的研究成果。因此,我写下中文版的HapHiC系列教程与方法解读,供大家查阅和参考,希望能对HapHiC的用户有所帮助!

HapHiC的目标是成为一款通用、全能的染色体Hi-C scaffolding工具,以适用于各类动植物同源多倍体、异源多倍体、二倍体分型或不分型组装的染色体挂载,并在这个过程不依赖参考基因组的指导。尽管HapHiC已经在超过30个不同的基因组得到了验证,但是不同物种间基因组特征的差异、Hi-C技术的局限性、基因组组装的质量等因素都可能成为染色体挂载的阻碍。为此,我们在HapHiC设计了大量可以调整的参数。在很多时候,选择合适的方法和参数可大幅改善染色体挂载的效果。详细了解参数的原理可以使得您在调参的过程中游刃有余。抱着这个目标,我们一起开始阅读HapHiC的系列教程和方法解读吧!

我暂时将自己的个人博客(https://byteofbio.com/tag/HapHiC)作为持续更新HapHiC系列教程与方法解读的地方,本页面(https://byteofbio.com/archives/22.html)会随着相关文章的陆续上线随时更新。如果您查看的内容来自其他网站的转载将可能无法及时获取更新。待所有内容完成,我将会一起打包成PDF格式,并转移到更专业的网站。

HapHiC使用教程

  • HapHiC的适用范围
  • HapHiC的前置步骤(1):基因组组装
  • HapHiC的前置步骤(2):Hi-C数据比对与过滤
  • HapHiC一行命令搞定全流程
  • HapHiC分步运行(1):contig初步聚类
  • HapHiC分步运行(2):contig重新分配
  • HapHiC分步运行(3):contig排序
  • HapHiC分步运行(4):构建最终scaffolds
  • HapHiC挂载结果的可视化

HapHiC方法解读

  • HapHiC的总体流程和挂载单倍体分型基因组的策略
  • HapHiC聚类前的预处理(1):misjoin纠错算法
  • HapHiC聚类前的预处理(2):collapsed contig的过滤
  • HapHiC聚类前的预处理(3):chimeric contig的过滤
  • HapHiC聚类前的预处理(4):等位Hi-C links的过滤
  • HapHiC对于长contig的处理
  • HapHiC中contig的初步聚类和自动调参
  • HapHiC中contig的重新分配和进一步聚类
  • HapHiC中contig的排序:算法的整合与优化

标签: 基因组组装, 基因组, HapHiC

知识共享许可协议 作者: 链接:https://byteofbio.com/archives/22.html
本文采用“署名-非商业性使用-相同方式分享 4.0 国际许可协议”进行许可

已有 2 条评论

  1. Song Song

    期待更新

  2. CT Yang CT Yang

    从看了HapHic的文章再一路网上冲浪看到了这个博客,本以为是某个使用工具的“热心肠”写的文档,原来是作者亲自写的博客,值得点赞! 非常期待完整的使用教程,也希望之后线下能有机会交流~

添加新评论