? 配置文件(configuration file)配置文件的目的是告知NAMD分子动力学模拟的
各种参数,比如PDB文件和PSF文件的储存位置,结果应当储存在哪里,体系的温度等等
上述四种文件中,PDB文件通常是从蛋白质结构数据库(Protein Data Bank)中获得。力场参数文件也可以从网上下载, 而PSF文件和用户配置文件是用户根据具体要求自己生成的。下面我们将首先制作蛋白质结构文件(PSF)。 2.2 生成蛋白质结构文件(PSF)
1、单击 开始菜单→程序 → VMD,打开VMD窗口
2、在VMD主窗口中,单击 File → New Molecule 打开Molecule File Browser对话框;单击Browse?按钮,在弹出的文件浏览中找到 namd-tutorial/1-1-build 文件夹,在此文件夹中选择1UBQ.pdb,单击Load按钮载入1UBQ.pdb。 提示:关于文件后缀名 如果浏览文件时看不到“.psf”“.pdb”等后缀名,可以在“我的电脑”中选择“工具”→“文件夹选项”,在“查看”选项卡中取消“隐藏已知文件类型的扩展名”。强烈推荐读者取消这一项,因为这还涉及到下文中的许多操作。 载入之后在图形窗口(VMD 1.8.5.OpenGL Display)中应当可以看到下图(图):
可以看到,所有的氧原子用红色表示,碳原子以天蓝色表示(碳原子所连的键也是天蓝色,所以整个蛋白骨架为天蓝色),硫原子以黄色表示。注意到没有出现氢原子,这是因为此结构是由X射线晶体衍射得来的,而X射线衍射一般得不到氢原子的精确位置。注意:蛋白周围的红点实际上是水分子,由于没有氢,所以仅显示出一个一个的氧原子。
我们只需要蛋白质分子的结构,因此下面我们将首先除去pdb文件中带有的水分子。 4、单击 Extension → TK Console 菜单项,弹出VMD Tk Console窗口。首先用cd命令改变当前目录到namd-tutorial /1-1-build 下。然后输入下列命令:
set ubq [atomselect top protein] $ubq writepdb ubqp.pdb
(每输入一行命令后按回车键,下同。另外,尤其要注意空格的有无和空格的位置,否则空格位置不对可能造成命令执行错误)
提示:VMD TK Console(VMD控制台)中改变当前目录的方法 在Windows命令行模式中和VMD TK Console 中都是用cd命令改换当前目录的。但是注意二者的使用方法不同。这里简单说明VMD TK Console 中改变当前目录的方法,Windows命令行改变目录的方法将在后面说明。 在VMD TKConsole中,改变目录的命令十分简单。无论是改变到哪一个目录,只需要输入: cd 目标目录 比如本例中,假设需要改变目录到 E:/namd-tutorial/1-1-build ,无论当前目录是什么,只需要在VMD TKConsole中输入以下命令即可: cd e:/namd-tutorial/1-1build 输入以上命令之后,VMD已经在1-1-build目录下生成了文件 ubqp.pdb。这一PDB文件仅包含泛素蛋白,不含水分子。
5、在VMD主窗口中单击1UBQ.pdb,选择Molecule→Delete Molecule菜单项删除当前分子。
6、下面我们将生成泛素蛋白的psf文件。注意:VMD组件中实际上提供了一个全自动的psf文件生成器(选择Extensions→Modeling→Automatic PSF Builder菜单项)。但我们将人工制作所需要的psf文件,以让读者明白制作的详细流程。制作时,需要使用VMD提供的psfgen软件包。
7、首先,打开写字板,输入以下内容:
package require psfgen
topology top all27_prot_lipid.inp pdbalias residue HIS HSE pdbalias atom ILE CD1 CD segment U {pdb ubqp.pdb} coordpdb ubqp.pdb U guesscoord writepdb ubq.pdb writepsf ubq.psf
8、输入完成之后,保存文件。注意文件保存在1-1-build目录中,文件名为ubq.pgn,文件类型选择文本文档。然后退出写字板。这样我们便制作了pgn文件,这一文件可以被psfgen软件包所识别,并处理成我们想要的psf文件。我们需要在VMD中使用该文件调用psfgen数据包
下面我们详细介绍一下刚刚输入的每一行命令的意义:
package require psfgen:通知VMD我们将要调用psfgen数据包
topology top all27_prot_lipid.inp:载入拓扑文件 top_all27_prot_lipid.inp pdbalias residue HIS HSE:改变组氨酸残基名,使得残基名称能够和拓扑文件中的一致。在pdb文件中组氨酸残基名是HIS,而在拓扑文件中组氨酸残基名为 HSE, HSD, HSP 三种。分别对应组氨酸的三个不同的带电荷形式。
pdbalias atom ILE CD1 CD:改变异亮氨酸中的原子名。pdb文件中异亮氨酸δ碳的
名称为CD1,而拓扑文件中原子名应该为CD。
segment U {pdb ubqp.pdb}:生成一个集合(segment)U,包含ubqp.pdb中的所有原
子。
coordpdb ubqp.pdb U:从ubqp.pdb中读取坐标,比较各个原子的名称是否对应,然
后旧的集合名被改换成新的名称“U”。
guesscoord:根据拓扑文件推测缺少的原子(氢原子)的空间位置。
writepdb ubq.pdb:生成新的pdb文件,包含所有原子的坐标,包括刚刚推测出的氢
原子。
writepsf ubq.psf:生成psf文件,该文件包含蛋白结构的全部信息。
知识链接:组氨酸的三种离子模式
知识链接:PDB文件中原子的命名方式 9、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。然后输入以下命令: source ubq.pgn
这样我们就成功得到了含有氢原子的psf文件。同时,可以看到VMD TKConsole中显示出系统返回的信息。信息显示我们的系统中有1231个原子,631个原子的坐标是推测的(图)。
现在在你的1-1-build文件夹下应当有ubq.pdb和ubq.psf两个文件。到此为止,我们已经成功制作了下一步分子动力学模拟所需的psf文件。 2.2 蛋白质的溶质化
显然在真实情况下,蛋白质不是在真空中存在下面。所以我们需要把蛋白质放入一个水环境中,以更真实的模拟生物体内的环境。我们可以使用两种水体环境进行动力学模拟:
? 球状水体(water sphere)。水体包围蛋白质,四周则是真空,动力学模拟时没
有周期性边界条件(periodic boundary condition)
? 立方水体(water box)。立方水体是正六面体形状的水体(不一定是正立方体)。
使用立方水体需要我们设定周期性边界条件。
2.2.1 生成球状水体(water sphere)
我们将使用一个脚本文件建立球状水体。脚本文件在1-1-build目录下,文件名是wat_sphere.tcl。
1、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。然后输入以下命令: source wat_sphere.tcl
输入之后VMD将会调用脚本文件,之后VMD会反馈一系列信息(图),
2、由所给的信息我们可以看出,VMD生成了两个文件:ubq_ws.pdb文件和ubq_ws.psf。 在最后两行还给出了生成的球状水体的质心坐标(center of mass of sphere)和球状水体的半径(radius of sphere),精确到小数点后第十位。记下这些数字,以后我们还会用到。
这时在图形窗口中却会出现一个立方水体包围的蛋白质分子(图)。不过没有关系,在VMD主窗口中可见分子名为del_water,并不是我们所要的结果。我们的最终结果已经储存在1-1-build中,文件名分别为ubq_ws.pdb和ubq_ws.psf。