的特殊蛋白(转录因子)能特异识别基因附近的非编码DNA,通过与它们相互作用参与基因的抑制与激活。科学家还发现,大多数基因的开启和关闭是由附近的非编码DNA控制的。它们就像是基因的“分子”开关,调节基因的活动。
(2)在非编码DNA家族中,还有一类特殊的群体,称为假基因,这种假基因编码的“假RNA”有保护真基因免受破坏的功能。 (3)非编码DNA还能通过合成调节性RNA发挥功能,迄今为止,细胞中的rRNA、tRNA、snRNA、asRNA、snoRNA、miRNA、piRNA都是非编码“垃圾”DNA合成的。它们参与到基因活化、基因沉默、基因印记、剂量补偿、蛋白合成与功能调节、代谢调控等众多生物学过程中
(4)此外,“垃圾”DNA中还存在大量的重复DNA序列,这些DNA看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性
(5)植物和植物相似的单细胞基因组存在隐秘的剪切机制,以致于他们的内含子大小时有变化,动物和动物相似的基因组有完全的剪切机制,因此,他们的内含子是可延长的
(6)非编码 DNA 还可能具有稳定核骨架的作用。
(7)相当一部分非编码DNA并不是完全中立的,是适应性进化的结果。因此,额外的非编码DNA 得以保留在物种基因组中,导致物种基因组大小的进化。 补充:
(1)反义RNA是具有重要调控功能的RNA分子,它们的基因(即转录它们的DNA序列)至少部分与其作用的基因重叠,只不过所使用的模板链不同
(2)但近年来有人在不同物种发现了具有保守内含子基因。推测内含子的存在可能提供了一个为真核生物特别是多细胞真核生物所特有的基因表达调控系统
(3)已发现从线虫到脊椎动物的许多基因3′UTR区突变导致该基因翻译受阻或加速mRNA降解,从而抑制该基因活性
(4)基因的顺式元件与反式因子相互作用共同调控基因的表达活性,这是真核生物基因表达调控的基本逻辑,按照顺式元件与转录起始点的远近,可以分为近端顺式元件和远端顺式元件。启动子(Promotor)是近端顺式元件,每个基因都有自己的启动子,其他顺式元件也通过影响启动子的活性而实现调控功能,远端顺式元件位于启动子的上游,通过影响启动子的活性而调控基因的转录
(5)真核生物基因组非编码序列决不是毫无功能的废物(Junk),它必然蕴涵基因表达的重要调控信息,它的存在与基因四维时空有序表达密切相关
4、三代测序的特点及功能
特点:第三代测序技术是基于纳米孔(nanopore)的单分子读取技术,有着更快的数据读取速度,应用潜能也势必超越测序。
1、它实现了DNA聚合酶内在自身的反应速度,一秒可以测10个碱基,测序速度是化学法测序的2万倍。
2、它实现了DNA聚合酶内在自身的延续性,一个反应就可以测非常长的序列。二代测序现在可以测到上百个碱基,但是三代测序现在就可以测几千个碱基。
3、它的精度非常高,达到99.9999%。
4、直接测RNA的序列。既然DNA聚合酶能够实时观测,那么以RNA为模板复制DNA的逆转录酶也同样可以。RNA的直接测序,将大大降低体外逆转录产生的系统误差。
5、直接测甲基化的DNA序列。实际上DNA聚合酶复制A、T、C、G的速度是不一样的。正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。根据这个不同的时间,可以判断模板的C是否甲基化。
第三代测序技术原理主要分为两大技术阵营:
第一大阵营是单分子荧光测序,代表性的技术为美国螺旋生物(Helicos)的SMS技术和美国太平洋生物(Pacific Bioscience)的SMART技术。
第二大阵营为纳米孔测序,代表性的公司为英国牛津纳米孔公司。 关键技术:
第一:荧光标记的脱氧核苷酸。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样。
第二:纳米微孔。A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。
而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,使单分子的荧光探测成为不可能。 第三:共聚焦显微镜实时地快速地对集成在板上的无数的纳米小孔同时进行记录。 第三代测序技术的应用 1.基因组测序
由于具有读长长的特点,SMRT测序平台在基因组测序中能降低测序后的Contig数量,明显减少后续的基因组拼接和注释的工作量,节省大量的时间[25]。Christophern等[26]仅仅用0.5*的Pacbio RS系统长度的数据与38*的二代测序(NGS)的测序数据,对马达加斯加的一种指猴基因组进行拼装,大幅度提高了数据的质量和完整度,同时借助Pacbio RS的帮助将原有的Contig数量减少了10倍。DavidA.等利用Pachio RS平台C2试剂通过全球合作几天内就完成了从德国大肠杆菌疫情中获得的大肠杆菌样品以及近似菌株的测序和数据分析,最终获得了2900bp的平均读长以及99.998%的一致性准确度。在对霍乱病菌的研究中,第三代测序技术已初现锋芒。研究人员对5株霍乱菌株的基因组进行了测序研究,并与其他23株霍乱弧菌的基因组进行对比。结果发现海地霍乱菌株与2002年和2008年在孟加拉国分离得到的变异霍乱弧菌ElTorO1菌株之间关系密切,而与1991年拉丁美洲霍乱分离株的关系较远。相对NGS的优势就是能更快获得结果,因此该系统在鉴定新的病原体和细菌的基因组测序方面得到很广泛的应用[1] 。
2.甲基化研究
SMRT技术采用的是对DNA聚合酶的工作状态进行实时监测的方法,聚合酶合成每一个碱基,都有一个时间段,而当模板碱基带有修饰时,聚合酶会慢下来,使带有修饰的碱基两个相邻的脉冲峰之间的距离和参考序列的距离之间的比值如果大于1,由此就可以推断这个位置有修饰。甲基化研究中关于5
mC和5
hmC(5
mC的羟基化形
mC和
式)是甲基化研究中的热点。但现有的测序方法无法区分55
hmC。美国芝加哥大学利用SMRT测序技术和5
hmC的选择性
化学标记方法来高通量检测5hmC。通过聚合酶动力学提供的信息,
甲基腺嘌呤、5
mC和5
可直接检测到DNA甲基化,包括N6
hmC,为表观遗传学研究打开了一条通路。 3.突变鉴定(SNP检测)
单分子测序的分辨率具有不可比拟的优势,而且没有PCR扩增步骤,就没有扩增引入的碱基错误,该优势使其在特定序列的SNP检测,稀有突变及其频率测定中大显身手。例如在医学研究中,对于FLT3基因是否是急性髓细胞白血病(AML)的有效治疗靶标一直存在质疑。研究人员用单分子测序分析耐药性患者基因,意外发现耐药性与FLT3基因下游出现的稀有新突变有关,重新证明了FLT3基因是这种最常见白血病—急性髓细胞白血病(AML)的有效治疗靶标,打破了一直以来对于这一基因靶标的疑惑。凭借PacBio平均3000bp的读长,获得了更多基因下游的宝贵信息,而基于单核酸分子的测序能够检测到低频率(低至1%)罕见突变,正是这项成果的关键所在。