子中任何记录的记录号都是独立的。
对Rasmol程序来说最重要的记录类型是描述每个原子位置ATOM和HETATM记录,ATOM/HETATM记录包含了标准的原子名称和残基的缩写,并伴有相应的序列标识符、以埃为单位的坐标、空间位置和热运动因子。Format列描述了所有PDB格式中字段的使用情况,如下:
列号 1-6 7-11 13-16 17 18-20 23-26 27 31-38 39-46 47-54 55-60 61-66 68-70 73-76 77-78 79-80 目录
ATOM或HETATM
原子序列号(可以有空格) 按IUPAC标准格式的原子名称 构象标识符,用A,B,C表示 按IUPAC标准格式的残基名称 残基序列号
插入残基的编码(如:66A&66B) X坐标轴 Y坐标轴 Z坐标轴 位置 温度因子 脚注编号
片段指示符(左对齐) 元素符号(右对齐) 原子带的电荷 fmt all all all all all all all all all all all all 92 96 96 96
残基位置的编码从蛋白质N-末端开始或核酸5’端开始,假如残基序列已知,它可以省略某一原子序列号以便以后插入丢失原子。每个残基中的原子编码都是统一标准样式,从主链(蛋白质为N-C-C-O)开始,沿着α-碳增加而增加,相应侧链伴着主链显示。HETATM记录用于定义翻译后修饰,以及与主链相连的辅因子,TER用来记录主链分子中的间隙。
如果存在HEADER、COMPND、HELIX、SHEET、TURN、CONECT、CRYSTL、SCALE、MODEL、ENDMDL、EXPDTA和END记录,Rasmol还应做相关校对。分子名称、数据库编码、修订日期、分子的分类等相关信息可以从HEADER和COMPND记录中提取,最初二级结构的排列信息取自HELIX、SHEET、TURN记录,文件的结尾用END记录指明。
我们以human amylase为例来说明Format列。在word中选择文件?打开,找到文件所在目录并将文件类型选成“所有文件”,即可显示非word文档的pdb文件。如下图:
打开之后我们在最顶端可以看见如下文字:
其中HEADER项中1所标注的是分子类别--水解酶类(氧连接糖基化),2所标注的是该文件的公布日期,3所标注的是该物质的pdb代码。接下来,COMPND项中4所标注的是该化合物名称人类唾液淀粉酶。SOURCE项中5所标注的是该化合物的来源。6所标注的是结构测定者名字。下面的REMARK是此pdb文件的参考书目、最大分辨率、注解等,如下图中1处指出蛋白质原子数为3946,2处指出核酸原子数为0,3处指出异型原子数为2,4处指出溶剂原子数为169:
下面的SEQRES部分表示了该分子包含496个氨基酸残基,并将每个残基符号依次列出:
下面的HELIX部分显示的是分子中α螺旋的组成和信息,如下图:
然后下面就是β折叠的组成和信息了,如下图:
下面就是该分子的原子信息了,我们根据上面介绍过的Format列的格式列表进行一下详细的说明,如下图:
图中1框中位于1-6列的表示所指为原子,2框中位于7-11列的即为该原子序列号,3框中位于14-16列的是按IUPAC标准格式的原子名称,4框中的位于18-20列的是残基名称,5框中位于23-26列的是残基序列号,6框中位于31-38列的是原子的X坐标轴,7框中位于39-46列的是Y坐标轴,8框中位于47-54列的是Z坐标轴,9框中位于55-60列的是位置,10框中位于61-66列的是温度因子,11框中位于73-76列的是片段指示符。1-80列中没有显示的部分用空格代替了。
再向下翻页我们会遇到一个TER记录,它记录主链分子中的链末端,在TER后面的HETATM就是记录异型原子的信息了。如下图:
在HETATM记录的后面还有一些CONECT记录。CONECT详细的描述了已给出坐标的原子间的连通性。而这种连通性是以该记录的原子序列号的形式表现的。CONECT记录是用来描述那些非标准残基(包括水)和那些在标准连通性表中没有被详细列出的键。如下图:
最后,在整个文件的结尾还有一个END记录表示文件的结束。