三代全长转录组测序

完整的转录本包括了从5’端到3’端polyA尾的序列,长度集中分布在1-6kb。二代测序技术由于读长较短,得到的测序片段需要拼接,得到的转录本可能会产生拼接错误和较多的嵌合体,从而不能得到完整的转录本。第三代测序技术Pacbio利用单分子实时测序技术(SMRT),由于其超长的读长(平均15kb),无需拼接即可直接获取完整的全长转录本,因此可得到更高质量的转录本,有利于mRNA结构的研究,如可变剪切、融合基因、等位基因表达等。因此,全长转录本的研究越来越热门,发表的文章影响因子也比简单用二代测序RNA-seq要高。

目前第三代测序仪器最主要是美国太平洋生物技术公司( Pacific Biosciences)的RS II和Sequel。Sequel也是基于单分子实时技术(Single Molecular, Real-Time, (SMRT))的最新测序平台,其数据产出比RS II提高了约7倍,测序成本更低、项目周期更短。
利用Pacbio三代测序仪进行全长转录组的测序有以下优势:
1.超长读长:读长最长可达到约80kb,平均8~15kb,轻松解决二代测序所不能解决的重复序列问题;
2.通量高:RS II平台一个SMRT cell可产生约0.5~1Gb数据,而Sequel平台一个SMRT cell可产生5~10Gb数据;
3.无GC偏好性:
4.直接检测碱基修饰:可直接检测各种类型的DNA甲基化。

应用领域
不同实验处理后引起的可变剪切事件变化;
发育转录后调控机制;
生物体基因可变剪切形式;
研究癌症发生中的融合基因。

技术路线

                                          

分析内容
无参

1.全长转录本分析:数据统计、CCS分析、reads分类、reads聚类与校正、序列去冗余
2.注释:基因注释结果、物种分布统计、Nr/KEGG/SwissProt/GO注释
3.高级注释:CDS预测、Pfam蛋白结构域分析、SMART蛋白结构域分析、转录因子分析、R-Gene分析、TMHMM跨膜螺旋结构预测等
4.结构分析:SSR、lncRNA分析、可变剪切分析

有参
1.全长转录本分析:数据统计、CCS分析、reads分类、reads聚类与校正
2.比对参考基因组
3.基因统计:基因表达结果、基因注释结果、Nr/KEGG/SwissProt/GO注释
4.基因结构分析:可变剪切分析、可变polyA分析、融合基因分析、lncRNA鉴定、SNP/InDel分析、转录因子分析、开放阅读框分析

样品要求
1.胶图检测:条带清晰,无明显降解,无DNA污染;
2.2100检测:RIN值≥7.5,基线平整,200-1200bp 无峰带;
3.总量≥10ug(两次建库);浓度≥300ng/ul;
4.OD260/280:1.6~2.2;OD260/230:1.4~2.5。

项目周期
标准流程完成时间为60个工作日

参考文献
1.Gordon, S. P. et al. Widespread Polycistronic Transcripts in Fungi Revealed by Single-Molecule mRNA Sequencing.PLoS ONE 10, e0132628 (2015).
2.Sun L, Luo H, Bu D, et al. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts[J]. Nucleic acids research, 2013, 41(17): e166-e166.
3.Li J, Haratalee Y, Denton M D, et al. Long read reference genome-free reconstruction of a full-length transcriptome fromAstragalus membranaceusreveals transcript variants involved in bioactive compound biosynthesis[J]. Cell Discovery, 2017, 3:17031.
4.Alamancos G P, Pagès A, Trincado J L, et al. Leveraging transcript quantification for fast computation of alternative splicing profiles[J]. Rna, 2015, 21(9): 1521-1531.
5.Li J, Haratalee Y, Denton M D, et al. Long read reference genome-free reconstruction of a full-length transcriptome from Astragalus membranaceusreveals transcript variants involved in bioactive compound biosynthesis[J]. Cell Discovery, 2017, 3:17031.