可以比仅采用NCBInr全库的鉴定数据增加100%以上。下图为利用转录组数据建库和不利用转录组数据建库对比图。
2.3.2 差异蛋白与差异基因表达水平比较关联分析
对于上述两组学水平研究所获得的数据,首先将鉴定到的所有可靠性蛋白和与之相对应的基因的转录本进行综合关联比较分析。在此基础上,根据各自的表达变化的定量信息,对关联上的差异表达蛋白和与之相对应的差异基因的转录本进行比较分析。
2.3.3 蛋白质组与转录组表达模式聚类分析
为了更加直观地展示两组学水平上不同基因或蛋白表达水平的变化情况利用Cluster聚类分析软件对所获得的组学数据进行表达量聚类分析,包括l)对所有可定量蛋白质及其关联转录本作表达量关联聚类分析;2)对差异蛋白质及其关联转录本作表达量关联聚类分析。最终分别以不同颜色来表示表达水平的变化情况(一般情况下,红色-上调,绿色-下调,灰色或黑色-表达量无变化)。
2.3.4 mRNA可变剪接在转录组与蛋白质组两水平的相互验证(个性化分析)
可变剪接使一个基因产生多个mRNA转录本,不同mRNA可能翻译成不同蛋白质。因此,通过可变剪接一个基因可能产生多个蛋白,极大地增加了蛋白多样性(Black, 2003; Stamm, 2005; Lareau, 2004)。虽然己知可变剪接在直核生物中普遍存在,但我们可能仍低估了可变剪接的比例,基于高通量测序的可变剪接研
究在小鼠(Tang, 2009; Mortazavi, 2008)、拟南芥(Filichkin)中发现了很多新的可变剪接事件。
在生物体内,主要存在7种可变剪接类型:A)Exon skjpping;B)Intron retention;C)Alternative 5’ splice cite;D)Alternative 3’ splice cite;F)Alternative first exon;F)Alternative last exon;G)Mutually exclusive exon。
图3-7是我们利用高通量测序数据鉴别出来的4种可变剪接类型,图中每个位置的Exp level等于log2(Reads数)。
转录组Reference分析里有对mRNA可变剪接结果的预测,通过mRNA的可变剪接可能会产生新的蛋白质(蛋白序列我们可以根据核酸序列推断出来),而我们在蛋白层面对这些新蛋白进行鉴定,从而来验证转录组中可变剪切的分析。
2.3.5转录组和蛋白组GO功能、Pathway的关联比较分析
无论是转录组测序还是蛋白质组分析的结果中,都会给出差异基因或差异蛋白的Pathway代谢通路富集分析结果,比较关联分析两组学水平上的不同的Pathway代谢通路,之后对能关联上的代谢通路中的蛋白/基因的相互对应及表达情况进行一致性分析,从而挖掘出通路中几个代表性的关键基因/蛋白,此项分析内容需要结合老师的研究背景,具体情况具体分析。 四小结
1 拟解决科学问题
(1) 利用这两种不同的表达谱研究手段的不完整性和互补性,通过综合分析而获得一个表达谱的“全景图”,系统而全方位地研究动植物重要生物过程的调控机制。
(2) 通过合理的实验设计,从RNA和蛋白水平同时去研究及验证一些重要功能基因响应某种生物或非生物压力后的表达调控模式及代谢调控网络,实现其间的互补与整合。
2.运转周期
整个项目的运转周期为转录组与iTRAQ定量蛋白质组标准分析时间(二者可同时进行),加上两组学数据比较关联分析时间(信息分析时间大约需要5天)。