。。,?。j
i
j。二j一.j。一|。ReviewsandMonographs
PIll,:豢蕊嚣乞…记s
WWW.pibb.ac.cn
DNA甲基化的生物信息学研究进展
凡时财1,2)张学工1)”
(1)生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084;
≈电子科技大学自动化工程学院,成都610054)
摘要作为重要的表观遗传学现象之一,DNA甲基化对基因的表达发挥重要的调控功能.随着高通量检测技术的不断发展,对DNA甲基化的生物信息学研究也成为DNA甲基化研究中的一个非常活跃的热点.对生物信息学在DNA甲基化状态的预测、CpG岛不易被甲基化的机制研究、探索DNA甲基化同其他表观遗传学现象之间的关系以及DNA异常甲基化同癌症的发生和发展之间的关系等方面的研究进展进行综述.
关键词DNA甲基化,生物信息学研究,CpG岛,预测,机制,表观遗传学学科分类号Q3,Q6,Q7
IN)I:10.3724/SP.J.1206.2008.00426
在多细胞生物的发育过程中,细胞如何分化很大程度上取决于其内部的基因表达模式,而基因的表达模式不仅仅依赖于细胞内转录因子的作用,还同表观遗传学因素密切相关.表观遗传学是指在不改变DNA序列的条件下所发生的可遗传基因表达的变化【l】.表观遗传学主要包括DNA甲基化、组蛋白修饰和染色质结构.脊椎动物中,DNA甲基化表现为在DNA甲基化转移酶(DNAmethyltransferase,DNMT)作用下,甲基基团合成到5,.CpG一3’中胞嘧啶的第五位碳原子上【21.DNA甲基化参与了细胞的多种生理活动,比如基因的时空特异性表达、X染色体失活、衰老以及癌症的发生【3一.甲基化的CpG双核苷酸通过募集转录抑制因子嘲或者阻碍转录激活因子的结合抑制基因的表达[61.由于DNA甲基化在基因调控中的重要功能,以Sanger研究所为代表的人类表观基因组联盟,于2000年10月发起了人类表观基因组计划(human
epigenome
根据Gardiner—Garden等【lo】的定义,CpG岛是一段长度不小于200bp、GC含量不小于50%、CpG含量与期望含量之比不小于0.6的区域.由于该定义将一些重复片段也包含其中,Takai和Jonestlq将CpG岛重新定义为长度不小于500bp、GC含量不小于55%、CpG含量与期望含量之比不小于0.65的区域.据统计,多于50%的基因的启动子区含有CpG岛【1213】.在早期的认识中,CpG岛都是非甲基化的[41,但是随着研究的不断深入,人们发现在印迹基因[31、失活的X染色体【t41甚至是正常的体细胞中都存在甲基化的CpG岛【151.部分CpG岛的异常甲基化常常伴随着癌症等疾病的发生【阍.
近年来,随着高通量的DNA甲基化检测技术的出现,DNA甲基化的生物信息学研究得到了很大的发展.一系列具有较好精度的DNA甲基化预测工具不仅成为实验检测技术的补充,也反映了DNA甲基化本身是有规律可寻的,这启发了研究者们对于DNA甲基化内在机制的探索.DNA甲基化具有序列偏好性的观点得到进一步证实,CpG
国家自然科学基金资助项目(30625012,60721003),国家重点基础研究发展计划项日(973)(2004CB518605)和国家高技术研究发展计划项目(863X2006AA022325).¨通讯联系人.
Tel:010—62794919.E mail:zhangxg@tsingh峪.edu.Gn收稿日期:2008-06.13,接受日期:2008-08.18
project,imP),试图获得人类多个组织
中的DNA甲基化模式[71.目前该计划已经完成了来自12个组织的第6号、20号和22号染色体的检测工作嘲.
人类基因组中,70%"-'80%的CpG双核苷酸处于DNA甲基化状态嗍.非甲基化的CpG不是均匀分布,f面是呈现局部聚集倾向,形成一些GC含量较高、CpG双核苷酸相对聚集的区域,即CpG岛[41.