转录组是指某个物种特定细胞或组织在某一状态下所转录出来产生的所有转录本的集合。对真核无参生物进行转录组测序,获得参考序列后,可定量测定每个转录本在生长过程中和不同的条件下的表达水平的变化。通过新一代高通量测序,能够全面快速地获得某一物种特定组织或者器官在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发等领域。

 
 
 
 
应用领域
 
1. 样本全转录本信息获取;
2. 基因注释及筛选;
3. 基因差异表达研究。
 
 
 
 
技术路线

 

 

 

分析内容

标准信息分析

1. 原始数据过滤,去除接头序列及低质量reads

2. 数据产出统计及测序质量评估(测序饱和度分析、测序随机性分析)

3. 转录组denovo组装

4. 组装质量统计与分析(Contig N50、Unigene*长度分布、reads覆盖统计)

5. Unigene表达统计(基因覆盖度,表达量、表达量丰度分布)

6. Unigene基本功能注释

6.1 Unigene Nr蛋白数据库注释

6.2 Unigene SwissProt蛋白数据库注释

6.3 Unigene COG/KOG注释及分类

6.4 Unigene GO功能注释及分类

6.5 Unigene Pathway代谢通路注释

7. Unigene高级功能注释

7.1 预测编码蛋白框(CDS)及Unigene序列方向预测

*此处Unigene 等同于“转录本”或“Transcript”

7.2 近缘模式生物同源基因CDS比较

7.3 Pfam蛋白结构域分析

 

8. SSR开发及引物设计

9. 样本关系分析(主成分分析(PCA)、相关性系数热图、样本聚类图)

10. 差异表达基因分析(两个或两个以上样品)

10.1 差异表达基因筛选
10.2 差异基因火山图
10.3 差异基因表达模式聚类分析(热图)
10.4 差异基因GO功能显著性富集分析
10.5 差异基因Pathway显著性富集分析

11 互作网络分析

12 GSEA分析

13 突变分析(SNP/InDel分析)

14 omicmart 在线报告

 

 

 

高级信息分析

1.SMART蛋白结构域数据库分析
2. PlantTFDB植物转录因子数据库分析(样本为植物时提供该注释)
3. AnimalTFDB动物转录因子数据库分析(样本为动物时提供该注释)
4. PRGDB植物抗病基因数据库分析(样本为植物时提供该注释)

 

 

 

样品要求/项目周期

 

 

请咨询当地销售或拨打电话:020-84889324(医学)、020-84889314(农学)了解详情。

 

 

 

参考文献

[1] Xie L, Zhang Y, Li X, et al. Exposure to nitrate alters the histopathology and gene expression in the liver of Bufo gargarizans tadpoles[J]. Chemosphere, 2019, 217: 308-319.
 
[2] Xu B, Yu G, Li H, et al. Knockdown of STAYGREEN in perennial ryegrass (Lolium perenne L.) leads to transcriptomic alterations related to suppressed leaf senescence and improved forage quality[J]. Plant and Cell Physiology, 2018.
 
[3] Wang X, Chen Y, Gong C, et al. Molecular identification of four novel cytochrome P450 genes related to the development of resistance of Spodoptera exigua (Lepidoptera: Noctuidae) to chlorantraniliprole[J]. Pest management science, 2018.
 
[4] Tang Q Y, Chen G, Song W L, et al. Transcriptome analysis of Panax zingiberensis identifies genes encoding oleanolic acid glucuronosyltransferase involved in the biosynthesis of oleanane-type ginsenosides[J]. Planta, 2018: 1-14.
 
 

 

 

 

 

Q1:转录组测序需要多少数据量?

A:这个因研究的物种和研究需求而异。常规的动植物物种推荐6G数据量,基因组比较小的原核生物或真菌推荐可以3G。而对于部分基因数目较多的物种、关注的基因表达丰度较低的项目、病原宿主互作项目,可根据情况适当增加数据量。

 

Q2为什么高通量测序会有很多没有比对上的序列?

A:有两种可能,第一种:转录组结果里面是有一些非编码基因的,非编码基因比对不上蛋白库;第二种,测序的物种是一些比较偏的物种,它毕竟有一些基因是比较特异的,所以在找不到近缘种的情况下,很多基因可能就会注释不出来。

 

Q3无参转录组测序不同倍性的同一物种,一起进行建库还是单独建库吗?

A:不同倍性的样本需要单独建库的;分析时是否要放在一起,需要依据实际情况而定。

 

Q4组装后的unigene和转录本是一样吗?

A:本质上区别不大。triniy组装出来的视为转录本(mRNA),之后去除冗余后(比如挑最长的转录本),统一命名为unigene。Unigene视为转录本的子集。

 

Q5无参转录组,unigene的编码方向是怎么确定的?

A:将所有unigene与蛋白数据库包括Nr、Swiss-Prot、KEGG 和 COG/KOG做blastx比对,取比对结果最好的蛋白确定unigene的序列方向。

 

Q6无参也有可变剪切吗?可靠吗?

A:目前trinity结果会做聚类,所以在同一聚类簇下面不同的Unigene认为是可变剪切。但无参RNA-seq 可变剪切是不可靠的。如果是无参物种,就没有必要关心可变剪切, 关心基因层面的表达量比较现实。

 

 

 

 

 

 

 

 

 

转录组和蛋白组学研究蜡梅在低温诱导下打破休眠的过程

 

合作单位:西南大学

发表期刊:Horticulture Research

影响因子:5.404

 

 

 

 

研究背景

芽休眠是多年生植物在逆境环境下的一种自我保护策略,而低温是打破休眠的重要因素,不同物种低温要求(chilling requirementCR)又有所差别。作者把蜡梅当作模式物种研究自然和人工条件下,打破休眠的CR,分析低温诱导开花的分子机制以及适宜的人工培育蜡梅开花的条件。

 

 

 

测序策略

1.自然条件样本:4月、5月和11月花芽(FB),

 

2.人工诱导条件样本:采集FB150、FB300FB45012℃300h600h900h)、IB57012℃1140h,开始开花)、nF1616℃-300CU)条件下的花芽共8组,每组3个重复,对24个样本分别进行转录组测序;提取FB. AprFB. MayFB. NovnF16IB570花芽中的蛋白进行TMT定量

 

 

研究思路

 

 

 

 

研究结果

 

表型观察确定CR

作者监测了在不同CU下开花率的情况,结合自然和人工条件发现在短日照(SDs8/16h12℃)低温(LT)自然条件下,CR达到570CU,蜡梅花芽会打破冬眠开花。

 

 

转录组测序结果

 

罗列转录组测序结果,包括contigs数量、N50的值、转录本平均长度、利用NRSwissprotKOGKEGG数据库注释到的unigenes数量。

 

差异分析
差异分析包括找比较组内差异的mRNA和差异的蛋白(DEPs),文中分别列举了和作为CKFB.Nov相比的DEGs数量,开花的IB570FB. Nov以及nF16相比的DEPs数量。

 

②WGCNA
先做PCA、相关性热图、树状图看一下样本重复性的情况,有没有离群的样本,没有就可以做后面的分析了。文中总共用了70,458个基因去做了WGCNA,再用获得的每个模块的模块特征值(ME)分析和表型的相关性,发现17个模块与表型存在相关性,包含共30,038个基因,其中7个模块与表型高度相关。

自然和人工条件下的测定CR和表型图片,OF570IB570开花后的状态

 

 

2 PCAPearson相关性分析、WGCNA分析结果

Hub genes是模块中连通其他基因数量最多的基因,kME是每个基因在每个模块中的表示连通性大小的值,P值是对应的显著性。作者用kME > 0.95P < 10e8作为核心基因(hub gene)的筛选条件,共筛选出7.042hub genes。对其中76DEGsCytoscape构建网络图。

 

 

 

 

 

韦恩图分析、趋势分析、热图分析
2397个基因和显著富集模块中的DEGs与剩余两个比较组做了Venn分析,共得到1,628个基因(图3d)。

 

 

韦恩图分析、趋势分析、热图分析结果

 

 

 

 

转录与蛋白组学关联分析

 

九象限图相关分析,TMT定量蛋白功能分析,RNA和蛋白热图分析

为进一步找到和打破休眠相关的关键基因,联合蛋白质组学数据进行分析。

 

结果发现在IB570/FB.Nov中大部分都是蛋白发生表达,而mRNA没有变化,说明IB570大部分蛋白的增加与转录或翻译过程无关,IB570/nF16中大部分蛋白发生下调,对其中2414unigenes和蛋白绘制了组合热图。

 

 

 

DEGs验证和进化树分析


挑选其中12DEGs进行qRT-PCR验证,说明转录组数据和PCR得到的基因趋势相同。之后,根据文献得知MADS-box家族基因在其他物种当中与打破休眠相关,所以对CpSVP基因结合其他物种信息构建了进化树。

 

5 文章推测的低温诱导的蜡梅休眠打破通路




 

小结


基因在体内先发生转录,再翻译出蛋白进而在生物体内发挥功能。文章在转录组部分中整合了差异分析、韦恩图分析、趋势分析、WGCNA分析,深度挖掘并探讨了数据中的信息,再结合蛋白组学数据探讨了实际翻译出在体内发挥功能的蛋白有哪些。还利用靶向代谢组学,对植物激素含量进行测定,最终推测出了参与到休眠打破过程中涉及到的通路及参与其中的关键基因。

 

 

参考文献

Li Z, Liu N, Zhang W, et al. Integrated transcriptome and proteome analysis provides insight into chilling-induced dormancy breaking in Chimonanthus praecox[J]. Horticulture research, 2020, 7(1): 1-19.