完整的转录本包括了从5’端到3’polyA尾的序列,长度集中分布在1-6kb。二代测序技术由于读长较短,得到的测序片段需要拼接,得到的转录本可能会产生拼接错误和较多的嵌合体,从而不能得到完整的转录本。第三代测序技术Pacbio利用单分子实时测序技术(SMRT),由于其超长的读长(平均15kb),无需拼接即可直接获取完整的全长转录本,因此可得到更高质量的转录本,有利于mRNA结构的研究,如可变剪切、融合基因、等位基因表达等。因此,全长转录本的研究越来越热门,发表的文章影响因子也比简单用二代测序RNA-seq要高。

 

目前第三代测序仪器最主要是美国太平洋生物技术公司(Pacific BiosciencesSequelⅡSequelⅡ是基于单分子实时测序技术的最新测序平台,通量更高,准确度可达99.9%,测序成本更低,项目周期更短。

 

 

应用领域

1. 完善物种基因组注释;
2. 不同实验处理后引起的可变剪切事件变化;
3. 转录后调控机制研究,如可变多聚腺苷酸化;
4. 癌症发生中的融合基因研究;
6. 更准确的定量分析。
 
 
 
技术路线

 

 

分析内容

1. 标准信息分析

a) 原始测序数据统计及质控

b) Reads分类

c) Reads聚类和校正

d) 全长isoform数据统计

e) 比对参考基因组

f) 新转录本预测

g) 新转录本功能注释

   1) Nr注释

   2) GO功能注释

   3) KEGG代谢通路注释

   4) SwissProt蛋白注释

h) 基因结构分析
   1) lncRNA分析
   2) 可变剪切分析
   3) 可变多聚腺苷酸化分析
   4) 融合基因分析
   5) SNP/InDel分析
   6) 开放阅读框分析
   7) 转录因子分析
   8) 基因结构优化
 

2. 定制化信息分析

a) 二代数据校正三代数据(需有Illumina数据)

b) 基因定量及差异表达分析(需有Illumina数据)

c) 多组学关联分析(如甲基化、蛋白组、miRNA)

 
 
 
 
 
 
样品要求/项目周期

 

 

请咨询当地销售或拨打电话:020-84889324、020-84889314了解详情。

 
 
 
 
 
 
参考文献
 
[1] Wang B , Tseng E , Regulski M , et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communications, 2016, 7:11708.
[2] Li Y , Dai C , Hu C , et al. Global identification of alternative splicing via comparative analysis of SMRT- and Illumina-based RNA-seq in strawberry[J]. The Plant Journal, 2017, 90(1):164-176.
[3] Identification of a novel fusion transcript between human relaxin-1 (RLN1) and human relaxin-2 (RLN2) in prostate cancer[J]. Molecular and Cellular Endocrinology, 2016, 420:159-168.

[4] Wenger, A. M., et al. Accurate Circular Consensus Long-read Sequencing Improves Variant Detection and Assembly of a Human Genome. Nature Biotechnology, 2019, 37, 1155–1162.

 

 

Q1相比于二代转录组,三代转录组有哪些优势?

A:(1)超长读长,可一次将真核生物的全长转录本信息读取完整;

(2)无需进行片段打断和拼接,避免出现组装错误;

(3)基于全长转录组测序得到的完整准确的转录本信息,结合二代数据,方便识别特异性表达且做更加精确的基因和转录本表达定量;

(4)针对有参考基因组的物种,全长转录组信息可以纠正基因组的错误组装、更准确地发现新的转录本和基因、分析基因融合事件等;

(5)无需链特异性建库,全长转录组测序可直接获取正义链、反义链及部分LncRNA信息。

 

Q2三代全长转录组RNA样本要求?

A:三代全长转录组不同于二代转录组,转录本没有打断的过程,对于转录本的完整性要求更高(全长),目前三代全长转录组(真核生物),对RNA样本的要求:浓度≥300ng/μl,总量≥5μg,RIN值≥7.5。

 

Q3全长转录本的应用方向?

A:(1)基因结构的研究:可变剪接、APA、融合基因、基因家族、lncRNA及其靶基因预测;

(2)完善基因组注释:对于做基因组组装研究的,可以做三代转录组测序辅助基因组注释,对于基因组注释结果不好的,同样也可以利用三代结果来完善注释;

(3)基因功能研究:要获得整个转录本全长,获得CDS区域以及这个转录本所能够编码的蛋白,则需要做RACE实验的,而RACE成功率低且价格贵,这时候可以通过三代测序获得全长,无需RACE实验;

(4)与蛋白组联合分析:构建完善的蛋白搜索库;可变剪接事件的相互验证。

 

 

 

 

全长转录组研究Saccharum spontanum亚基因组参与甘蔗的糖积累

 

合作单位:广西大学

发表期刊:Journal of Advanced Research

 

 

目的:现代甘蔗品种(Saccharum spp.杂种)是由S. officinarum和S. spontanum杂交而成,分别遗传了高糖性状和优异的抗逆性。然而,自发性葡萄树亚基因组对蔗糖积累的贡献尚不清楚。为弥补高质量参考基因组的缺失,需要利用转录组分析方法分析甘蔗杂交品种差异蔗糖积累的分子基础,并寻找自发甘蔗亚基因组对蔗糖积累的贡献线索。 

 

取材:利用PacBio和Illumina测序平台对6个甘蔗杂交种的叶片和茎组织进行转录组学研究。采用PacBio全长测序技术进行基因组补注,采用差异选择性剪接分析和差异表达分析鉴定高、低糖组差异基因。在亚基因组水平上,从转录和转录后调控的角度研究了导致蔗糖差异积累的因素。 

 

结果:1)提供了一个全长转录组,在亚基因组水平上进行了注释,补充了263,378个等位基因定义的转录异构体和139,405个选择性剪接(AS)事件。

2)差异选择性剪接(DA)分析和差异表达(DE)分析确定了高、低糖组之间的差异基因,并通过KEGG途径解释了差异蔗糖积累因子。

3)在一些基因模型中,观察到来自同一基因的等位基因的不同甚至相反的表达模式,反映了这些等位基因在多倍体甘蔗中向新功能的潜在进化。

4)在蔗糖源库复合体通路中的DA和DE基因中,我们发现一些编码蔗糖积累相关酶的等位基因在两个对照甘蔗杂交种之间存在差异表达或发生DA事件。

5)在亚基因组水平上标注的全长转录组能更好地表征甘蔗杂交种的特征,并且发现S. spontanum亚基因组与蔗糖积累有关。

图1. 甘蔗源库中蔗糖积累的动态变化

 

 

 

 

参考文献

Zhao J, Li S, Xu Y, et al. The subgenome Saccharum spontaneum contributes to sugar accumulation in sugarcane as revealed by full-length transcriptomic analysis[J]. Journal of Advanced Research, 2023, 54: 1-13.