第02章 基因组的结构

2019-01-10 12:47

第二章 基因的结构

第二章 基因组的结构

第一节 基因的基本结构和命名

一、基因的功能类别

按有无蛋白产物可将基因分为两类:

? 翻译基因:经转录并翻译成多肽链的基因。

? 非翻译基因:只转录而不翻译的基因,如rRNA,tRNA基因。

二、基因的基本结构

基因的基本结构包括DNA上与基因的复制、转录、翻译功能对应的结构。如复制起始区、复制终点、转录启动子、终止子、翻译起始密码、终止密码、增强子、沉默子等。

三、基因的命名

(一)1906年M.Demerec等提出的基因命名规则

1. 每个基因用斜体小写的三个字母表示,这三个字母取自表示该基因特性的一个或一组英文单词的前三个字母。

例如: 与核糖体大亚基有关的基因表示为rpl (ribosomal protein large);与核糖体装配、成熟有关的基因表示为为rim (ribosomal modification)

2. 表型相同基因的不同突变型,在三个字母后用一个不同的大写英文字母表示。 例如: trp表示色氨酸合成酶基因,各个不同色氨酸合成酶基因分别用 trpA、 trpB 来表示。

3. 同一基因的不同突变位点用基因符号后面所加的阿拉伯数字表示,如果突变位点所属的基因还不确定,那么基因符号用一短线代替。

例如: trp各个突变型分别用 trpA23、 trpB 46来表示。

4. 基因符号在不引起误会的情况下也可以作为突变型的符号,如果容易致误解,就应

- 13 -

第二章 基因的结构

该在基因符号上加“+”或“-”表示。

例如: his-表示组氨酸合成酶缺陷型, his+表示相应的野生型。

5. 抗药性突变型基因符号可以在右上角加r表示抗 性。加s表示野生型基因。 例如:strr表示链霉素抗性基因。 strs表示链霉素敏感的野生型基因。 (二)基因命名的现状

随着基因组研究在全世界的广泛展开,基因片段命名中的混乱状况越来越明显。有些基因片段明明在结构或者功能上相差甚远,但却有着完全相同的名称,而一些结构或者功能相似的基因片段却有着根本不能让人把它们联系起来的名字。

挪威科学家艾温德·霍维格领导的研究小组利用计算机来统计分析学术期刊上发表的论文中的基因片段的命名情况。截止2001年5月1日的时候,他们分析了Medline数据库(隶属于美国国家医学图书馆,全世界最著名的医学文献数据库)中的近1000万条文献摘要,确定了22008个人类基因片段,结果发现10352个基因片段有不止一个名字。

霍维格等分析的还仅仅是目前科学家们已经发现的人类的基因片段。在跨种属的生物之间,基因片段命名就更混乱了。

很多科学家都想将基因片段的命名标准化。为此,相关领域的科学家曾举行了两次有关基因片段命名的研讨会,但科学家们研究领域的不同以及命名习惯的巨大差异使得要制定一个“放之四海而皆准”的命名标准实在不容易。

一些知名的生物学家共同创立了一个名为“基因命名协会”的团体。基因命名协会的工作目标就是希望未来能够利用计算机将基因组数据库中功能相近而名称不同的基因片段链接起来,以使查阅数据库的科学家能尽量准确全面地获取所需要的数据。

目前,基因命名协会已经得到了果蝇基因组数据库、酵母菌基因组数据库、鼠基因组数据库、蠕虫基因组数据库等多个数据库的支持。他们都按照基因命名协会的方法归类命名自

- 14 -

第二章 基因的结构

己的数据库中的基因片段,并且将相关信息反馈到设于美国斯坦福大学的基因命名协会的中央服务器上。此外,各个数据库还根据相应领域的研究进展动态修订自己对基因片段的命名。基因命名协会希望,未来能有更多的基因组数据库加入到他们的团体当中来。 (三)人类基因命名

人类基因命名委员会 (Human Gene Nomenclature Committee ,HGNC) 网址(http://www.gene. ucl. ac. uk/ nomenclature ) 人类基因符号命名规则

(1) 基因符号应为大写的拉丁字母或大写的拉丁字母和阿拉伯数字的组合。基因符号为了有使用的价值应尽可能地简洁, 不要试图它包含一个基因所有的已知信息。理想的符号应不超过6个字符。基因符号在书 写时应用斜体或加下划线, 但在目录中例外。新的基因符号不能与已存在的基因符号重复。

(2) 基因符号的第一个字符必须是字母, 随后的字符可以是字母或字母与数字的组合。 (3) 基因符号在书写时应在同一行, 不允许在基因符号中使用上标或下标。

(4) 不能使用罗马数字。在以前使用的基因符号中的罗马数 字应改成相应的阿拉伯数字。

(5) 不能使用希腊字母, 所有的希腊字符应改成相应的拉丁 字母。希腊字母与拉丁字母互换表请查阅网页 http://www. gene. ucl. ac. uk/nomenclature / guidelines.html

(6) 除HLA、免疫球蛋白和T细胞受体基因外,其他基因符号均不使用标点符号。 (7) 基因符号一般不用于基因的不同剪接产物的命名。

(8) 基因符号中避免使用组织专一性、相对分子质量和染色体区段等字符,也不能包含任何生物的种属名。 (四) 基因命名的发展趋势

- 15 -

第二章 基因的结构

人类基因的命名不仅仅只与人类基因相关。基因通过同源性分析而来的同源基因往往借用其它物种中同源基因的名字。一些基因家族和超家族有自己专门的命名体系。因此不同物种命名委员会之间及命名委员会与家族或超家族命名体系间的相互协调对于提高命名有用性, 减少命名的管理费用及方便用户查询是必不可少的。

第二节 基因组概述

一、基因组概念

生物个体或细胞中信息不重复的遗传物质总和称为基因组。 例如人: 22常+ X, Y,+ 线粒体基因组

二、DNA的C值

生物单倍体基因组的DNA含量总是恒定的,它称为该物种DNA的C值。 C值是每一物种的一个特征。

三、C值矛盾

1. 人们无法用已知功能来解释基因组如此之大的DNA含量。 2. 生物基因组大小同生物在进化上所处地位的高低没有关系。

一般地,随着生物体复杂性的增加,每个物种所需的最小基因数目也必然增加。但生物体实际DNA含量远远大于该生物体所需最小基因数。 把每一类生物中的最小基因组作比较,由其结果可以看出:

显花植物 鸟类 哺乳类 - 16 - 爬行类 两栖类 骨鱼类 软骨鱼类 第二章 基因的结构

1. 从原核生物到哺乳动物其最小基因组的大小是递增的。

2. 每类生物的最小基因组的大小基本上对应于生物在进化上所处地位的高低。 3. 进化地位高、形态结构复杂程度高的一类生物其最小基因组也较大。

4. 基因组的DNA含量(C值)与低等真核生物的形态复杂性有很大的相关性。但在高

- 17 -


第02章 基因组的结构.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:三年级上册数学解决问题分类

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: