完整的转录本包括了从5’端到3’polyA尾的序列,长度集中分布在1-6kb。二代测序技术由于读长较短,得到的测序片段需要拼接,得到的转录本可能会产生拼接错误和较多的嵌合体,从而不能得到完整的转录本。第三代测序技术Pacbio利用单分子实时测序技术(SMRT),由于其超长的读长(平均15kb),无需拼接即可直接获取完整的全长转录本,因此可得到更高质量的转录本,有利于mRNA结构的研究,如可变剪切、融合基因、等位基因表达等。因此,全长转录本的研究越来越热门,发表的文章影响因子也比简单用二代测序RNA-seq要高。

 

目前第三代测序仪器最主要是美国太平洋生物技术公司(Pacific BiosciencesSequelⅡSequelⅡ是基于单分子实时测序技术的最新测序平台,通量更高,准确度可达99.9%,测序成本更低,项目周期更短。

 

 

应用领域

1. 完善物种基因组注释;
2. 不同实验处理后引起的可变剪切事件变化;
3. 转录后调控机制研究,如可变多聚腺苷酸化;
4. 癌症发生中的融合基因研究;
6. 更准确的定量分析。
 
 
 
技术路线

 

 

分析内容

1. 标准信息分析

a) 原始测序数据统计及质控

b) Reads分类

c) Reads聚类和校正

d) 全长isoform数据统计

e) 比对参考基因组

f) 新转录本预测

g) 新转录本功能注释

   1) Nr注释

   2) GO功能注释

   3) KEGG代谢通路注释

   4) SwissProt蛋白注释

h) 基因结构分析
   1) lncRNA分析
   2) 可变剪切分析
   3) 可变多聚腺苷酸化分析
   4) 融合基因分析
   5) SNP/InDel分析
   6) 开放阅读框分析
   7) 转录因子分析
   8) 基因结构优化
 

2. 定制化信息分析

a) 二代数据校正三代数据(需有Illumina数据)

b) 基因定量及差异表达分析(需有Illumina数据)

c) 多组学关联分析(如甲基化、蛋白组、miRNA)

 
 
 
 
 
 
样品要求/项目周期

 

 

请咨询当地销售或拨打电话:020-84889324(医学)、020-84889314(农学)了解详情。

 
 
 
 
 
 
参考文献
 
[1] Wang B , Tseng E , Regulski M , et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communications, 2016, 7:11708.
[2] Li Y , Dai C , Hu C , et al. Global identification of alternative splicing via comparative analysis of SMRT- and Illumina-based RNA-seq in strawberry[J]. The Plant Journal, 2017, 90(1):164-176.
[3] Identification of a novel fusion transcript between human relaxin-1 (RLN1) and human relaxin-2 (RLN2) in prostate cancer[J]. Molecular and Cellular Endocrinology, 2016, 420:159-168.

[4] Wenger, A. M., et al. Accurate Circular Consensus Long-read Sequencing Improves Variant Detection and Assembly of a Human Genome. Nature Biotechnology, 2019, 37, 1155–1162.

 

 

Q1相比于二代转录组,三代转录组有哪些优势?

A:(1)超长读长,可一次将真核生物的全长转录本信息读取完整;

(2)无需进行片段打断和拼接,避免出现组装错误;

(3)基于全长转录组测序得到的完整准确的转录本信息,结合二代数据,方便识别特异性表达且做更加精确的基因和转录本表达定量;

(4)针对有参考基因组的物种,全长转录组信息可以纠正基因组的错误组装、更准确地发现新的转录本和基因、分析基因融合事件等;

(5)无需链特异性建库,全长转录组测序可直接获取正义链、反义链及部分LncRNA信息。

 

Q2三代全长转录组RNA样本要求?

A:三代全长转录组不同于二代转录组,转录本没有打断的过程,对于转录本的完整性要求更高(全长),目前三代全长转录组(真核生物),对RNA样本的要求:浓度≥300ng/μl,总量≥5μg,RIN值≥7.5。

 

Q3全长转录本的应用方向?

A:(1)基因结构的研究:可变剪接、APA、融合基因、基因家族、lncRNA及其靶基因预测;

(2)完善基因组注释:对于做基因组组装研究的,可以做三代转录组测序辅助基因组注释,对于基因组注释结果不好的,同样也可以利用三代结果来完善注释;

(3)基因功能研究:要获得整个转录本全长,获得CDS区域以及这个转录本所能够编码的蛋白,则需要做RACE实验的,而RACE成功率低且价格贵,这时候可以通过三代测序获得全长,无需RACE实验;

(4)与蛋白组联合分析:构建完善的蛋白搜索库;可变剪接事件的相互验证。

 

 

 

可变剪切(alternative splicing,AS)是指mRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体,从而使一个基因产生多个不同的mRNA转录本,进而能够翻译成多种不同的蛋白。AS是调节基因表达和产生蛋白质多样性的重要原因,在人和动植物中都起着重要的转录调控作用,与生长发育、细胞分化、细胞功能等方面密切相关。

 

 

通过对野生草莓(F. vescaYW5AF7)5个发育阶段(small green, big green, turning, pink, red)的花托进行混样,分别进行SMRT测序和Illumina测序。SMRT测序结果显示,89.2%的ROI比对到了草莓基因组的13284个注释基因上(基因组共有33673个基因),校正后96.4%的一致性序列比对到参考基因组上,然后去冗余后最后得到33236条转录本。其中5501条为新转录本(novel),26737条为已知转录本(known)。比较两个平台鉴定到的AS事件发现,两者剪接位点的分布(图1b)和类型相似(图1c),SMRT鉴定到 57.67%的多外显子基因发生了可变剪切,拥有多条可变剪切异构体(spliced isoforms),其中10%的基因拥有多于5条的spliced isoforms。二代测序数据中,只有33.48%的多外显子基因发生了可变剪切(图1d)。

 

 

 图1 SMRT和Illumina测序结果比较

 

 

 

 

图2 生长素和脱落酸信号通路相关基因AS事件鉴定

 

 

AS导致了基因功能结构域的丢失或获得,或者导致转录本的提前终止,从而影响了基因编码蛋白的功能。进一步分析可变剪切功能发现,在草莓的发育过程中,AS影响了与草莓发育过程相关的基因与转录因子的功能,如果实变软基因FaExp1、β半乳糖苷酶基因FaβGal1、生长素信号通路转录因子FvARF17等。

 

 

 

参考文献

Li Y, Dai C, Hu C, et al. Global identification of alternative splicing via comparative analysis of SMRT-and Illumina-based RNA-seq instrawberry[J]. The Plant Journal, 2017, 90(1): 164-176.