1、 留一法 点击leave-one-out为红色
去掉use samples,在Column filtering中填入过滤值,建议为2(能量大于此值的分子将被过滤),在components 中填入主成分数,可以大一些,这是PLS的优点之一,即我们填入的主成分数过大,它也能自动找到一个合适的主成分数。最后在Analysis Name 中填入文件名。点击Do PLS,提示为PLS命名-ok 该过程较慢,需要耐心等待。
计算完毕,在shell中出现component 值和R2的值,注意此时的主成分数需要在下一步No-cross-validation中的component中填入。 2、非交叉验证:点击No-cross-validation
在上面的界面中点击No-cross-validation,填入上一步得到的主成分数,命名-Do PLS,当返回表格后,点击end
上面的结果,F值,立体场,静电场等会在shell中出现
第五步 查看CoMFA图
在分析表格中点击QSAR→View QSAR→CoMFA,出现下列表格
选择show sterics→show或show electrostatics,出现立体或静电彩图
第六步 平动转动:
1. 准备工作
程序文件:rotate.sh, rotate.spl, trans.sh, trans.spl, generate_box.awk
6
需要准备的文件:align.mdb, activity.txt
结果输出文件:rotate (graph.file, message ), trans (graph.file, message, original) 2. 具体步骤 2.1 转动
2.1.1 命令:sh rotate.sh
注意:可以改变的地方.dbname改成要进行转动的数据库;txtname为活性数据文件;output_file是结果输出文件名;increment为转动角度;select 是val的数目。此步生成很多数据库,完成后把没用的数据库删除。
其中调用的rotate.spl文件可以修改step_size, charge, probe_atom, min_sigma, principal_componet
2.1.2 结果分析:
graph.file文件中前三列是X,Y,Z轴的转动角度(0,30,60,90,……)对应着数据库的名字(0,1,2,3,……),例如下图中的第二行(30 0 0)对应数据库database1_0_0.mdb.
7
第四、五列是leave-one-out的主成分数和q2值。
2.2 平动
2.2.1 命令:sh trans.sh
转动后得到最好的数据库基础上进行平动。同理转动,修改dbname, txtname, output_file, step_size, increment.
同理可以修改principle_component.
trans.spl中的
step_size, charge, probe_atom, min_sigma,
8
2.2.2 结果分析
graph.file文件中前三列是X,Y,Z轴的平动步长(0.00,0.20,0.40,0.60,……)对应着数据库的名字(0,1,2,3,……),例如下图中的第二行(0.00 0.00 0.20)对应的格点文件original中的r0_0_1.rgn.第四、五列是leave-one-out的主成分数和q2值。
找到最佳q2对应的格点r0_0_1.rgn,打开original文件,截取相应部分令存为trans.rgn,可以用于后续的交叉验证分析。
9
第七步 从工作站上抓图
进入工作的文件夹,再打开一个Unix窗口,Desktop→open Unix shell-在shell中运行下面两个程序:snapshot和imageworgs
在工作的文件夹下进入sybyl
打开数据库:file→database→open
调出叠合分子:analyze-data-base RMSD Fitting
调出经过最小二乘法后的活性数据表格: file→molecule spreadsheet→open 分别调出立体场合静电场的彩图,去掉其它分子,只剩下模板分子,改成ball 方法:view→mixed rendering→ball→all→ok
将光标放在snapshot上,压住左键下拉,将要抓的图圈住(前提是将彩图转到方便观看的角度)
右键 newfile name→*.rgb 右键 save as 文件名.rgb 点击 flower图标打开
file→open→*.rgb→accept 调出刚才的rgb 文件
file→save as→file format→TIFF→accept 将rgb文件格式改为TIF格式即可。
10