基因组de novo测序即从头测序,是不依赖于任何参考序列对某物种进行测序,通过生物信息学分析手段进行拼接、组装,从而获得该物种全基因序列图谱。随着测序技术的发展、测序成本的降低,完成各物种的全基因组序列图谱已成为必然趋势。一个物种基因组序列图谱的完成,将带动该物种一系列后续研究的开展。

 

 

应用领域

1. 基因组survey评估;
2. 全基因组组装及注释;
3. 物种进化分析。

 

 

技术路线

 

 

分析内容

标准信息分析 高级信息分析

1.数据处理:去除接头序列、污染序列等;

2.基因组组装(三代数据):原始数据统计、测序深度分析、覆盖度统计、GC含量分析等;

3.基因组校正(二代数据):基因组比对与校正;

4.序列完整性评估:CEGMA评估、BUSCO评估、EST/转录本序列评估;

5.基因组注释:基因预测、基因功能注释、重复序列分析、非编码RNA注释等;

6.比较基因组学及进化分析:物种系统发育树构建、基因家族鉴定、基因共线性分析等。

1.K-mer 分析以及基因组大小估计;

2.杂合率估计;

3.初步组装;

4.GC-Depth 分布分析。

 

 

 

样品要求/项目周期

 

 

请咨询当地销售或拨打电话:020-84889324(医学)、020-84889314(农学)了解详情。

 

 

参考文献

[1] Ryan E. Mills, Klaudia Walter, Chip Stewart, Robert E. Handsaker, et al. Mapping copy number variation by population-scale genome sequencing. Nature February 2011 470.59–65
[2] Srikanth Gottipati, Leonardo Arbiza, Adam Siepel, Adam Siepel, Andrew G Clark, Alon Keinan. Analyses of X-linked and autosomal genetic variation in population-scale whole genome sequencing. Nature Genetics 43 741–743 (2011)
[3] Can Alkan , Bradley P. Coe & Evan E. Eichler Genome structural variation discovery and genotyping Nat. Rev. Genet., 12, 363–376 (2011).
[4] Derek M. Bickhart, Yali Hou, Steven G. Schroeder, et al. Copy number variation of individual cattle genomes using next-generation sequencing February 2, 2012, doi: 10.1101/gr.133967.111
[5] Kerstin Lindblad-Toh, Manuel Garber, Or Zuk,Michael F. Lin, et al. A high-resolution map of human evolutionary constraint using 29 mammals. Nature 478, 476–482(2011)
[6] Michael F. Berger, Eran Hodis, Timothy P. Heffernan, Yonathan Lissanu Deribe, et al. Melanoma genome sequencing reveals frequent PREX2 mutations. Nature 11071 (2012)
[7] Tobias Rausch, David T.W. Jones, Marc Zapatka, Adrian M. Stütz, Thomas Zichner, Joachim et al. Genome Sequencing of Pediatric Medulloblastoma Links Catastrophic DNA Rearrangements with TP53 Mutations. Cell, Volume 148, Issue 1, 59-71, 20 January 2012
[8] Zamin Iqbal, Mario Caccamo,Isaac Turner, Paul Flicek, Gil McVean De novo assembly and genotyping of variants using colored de Bruijn graphs. Nature Genetics 44, 226–232 (2012)

 

 

Q1: 基因组de novo测序是什么?

A: 基因组de novo测序也叫基因组从头测序,主要是对未知物种的基因组序列及需要更新的基因组,通过构建基因组DNA文库,并进行测序。通过生物信息学分析手段进行拼接、组装,从而获得该物种全基因序列图谱。

 

Q2: 三代基因组对比二代基因组有什么优势?

A:三代测序具有长度长的优势,平均为10-15kb,而二代测序读长为PE125-250bp,对于一些重复序列、杂合问题时,三代优势明显,因此三代基因组具有组装指标更高,组装错误率更低,组装完整性更好等特点。

 

 

基因组精细图谱揭示澳洲棉抗病及腺体形成新机制

合作单位:河南大学

发表期刊:Plant Biotechnology Journal

影响因子:6.84

 

研究材料:

取连续自交15代的纯合子澳洲棉新鲜叶片,用于DNA提取。以及其它8种种子无腺体和有腺体性状的澳大利亚野生二倍体棉用于研究。

 

 

研究结果:

作者结合Pacbio SMRT,Illumina short read,BioNano(DLS)和Hi-C,对澳洲棉进行基因组测序和组装。最终组装结果:contig N50为1.83Mb,scaffold N50 为143.60Mb,序列总长1.75 Gb,650个scaffolds覆盖了13条单倍染色体(图1)。

使用Nr, Swiss-prot, KOG和 KEGG 数据库进行基因注释,发现澳洲棉73.5%是由各种重复序列组成的,澳洲棉与G. arboreum的亲缘关系更加密切,在大约6.6百万年前分化为两个不同的种。通过多组学、Ks分析和基因功能验证发现了响应独脚金内酯(GR24),水杨酸(SA)和茉莉酸甲酯(MeJA)的黄萎病抗性相关基因GauCCD7和GauCBP1及腺体发育相关新基因GauGRAS1。

图1 澳洲棉基因组的鉴定。(a)每个染色体的基因密度;(b)每个染色体中的转座因子(TE)密度;

(c)每个染色体中的非编码RNA(ncRNA)密度;(d)每个染色体中的GC含量。

 

 

 

综上所述,研究为四倍体驯化棉花的一个显著不同的二倍体野生亲缘提供了高质量的参考基因组组装,以帮助棉花提高抗病性,开发具有新的无腺种子和无腺植物性状组合的品种。

 

    

参考文献

Cai Y, Cai X, Wang Q, et al. Genome sequencing of the Australian wild diploid species Gossypium australe highlights disease resistance and delayed gland morphogenesis[J]. Plant biotechnology journal, 2020, 18(3): 814-828.