间。
? 为了继续一节,关上SDS PAGE Gel Simulation窗口。
Features注释(与GeneQuest中讲解的相似,这里从略)
进行BLAST检索
Protean允许你通过因特网或企业内部互联网进行序列数据库检索。
在这一节中,我们将在NCBI的BLAST服务器上检索与人的钙调蛋白序列相似的序列。注意电脑必须与因特网相连接,否则,跳过这一的部分,继续下一部分。 ? 单击调色板工具中的范围选择器(箭图标),在序列上选择你想进行检索的
部分。由于我们的序列比较短,所以我们选择全序列进行比较。 ? 从EDIT MENU选择Select All。
? 从网络检索菜单,选择BLAST
查找。BLAST对话框出现(如左),默认的数据库是nr。 ? 单击同意开始查找。
BLAST结果显示为一个二分窗口(如下,结构、内容与相关操作参见
GeneQuest的BLAST结果)。
现在我们选择三个BLAST序列,在Protean中打开他们。 ? 在BLAST结果窗中选择一个结果。
? 单击Create Document,保存对话
框窗打开(如左)。从保存的下拉菜单选择Next(默认为Selected)。 ? 在“Sequences.”的左边文本框输
入数字“3”。
? 单击同意,打开三个新的选定序列
的Protean的分析文件。 现在关上BLAST结果窗。
二级结构模拟
36
Protean能够展示诸如螺旋轮,螺旋网和beta片层等基本元件的二级结构。另外, 它能以线性的space-fill样模型或者化学公式样模型展示蛋白质序列。在这一节中,我们做一个阿尔法区域的螺旋轮二级结构。二级结构Garnier-Robson方法已经应用于我们序列,阿尔法螺旋也已展示出来。选定其中的一个阿尔法区域后,我们就能以螺旋轮展示其二级结构。
? 单击调色板工具中的范围选择器(箭图标)。
? 点击Protean文件最上边的Garnier-Robson分析结果中的一个阿尔法区域。 ? 从分析菜单,选择Model Structures中的Helical Wheel,就会出现左边的
二级结构预测图。
为继续这一节,关上螺旋轮窗口。 展示滴定曲线
下面,我们将查看全蛋白质序列的滴定曲线。
? 单击Protean’s调色板工具右
边的白色空间。这使得选择回到起始位置,如果没有选中的序列,在绘制滴定曲线时,Protean就会默认是对全序列进行计算。 ? 从分析菜单,选择Titration Curve。
? 打开序列的滴定曲线窗口(如上)。Protean会在等电点处加一个蓝色的
“crosshairs”,以显示pH和所带电荷。
保存分析的文件(略)。
37
SeqMan II的使用方法 SeqMan II不仅仅能够将成千上万个序列装配成contigs,而且在装配前,可以修整质量差的序列以及从你的序列中清除污染数据,还提供完善的编辑和输出功能。SeqMan II可以使用DNASTAR独特的跟踪(trace)品质评价策略,通过对自动测序仪产生的跟踪数据进行评价,自动生成最精确的一致序列。
装配过程从序列输入开始,输入的序列可以是自动测序仪输出的、也可以是文本格式或DNASTAR序列格式。另外, 你可以从因特网的Entrez或BLAST服务器输入序列。使用Preassembly options中的命令可以进行包括修整质量差的数据,除掉特定的载体或污染序列等操作。你甚至可以在装配过程中选择最后加入重复序列。
Contigs装配完毕后,Strategy View可以用图形化的方式展示contig的范围和质量,并提示你什么地方需要补充序列。在需要的情况下,你可以加入更多的序列,或其他的SeqMan II文件对现有的结果进行再装配。Alignment View 允许你编辑,修整连续的一致序列,找回以前修整过的数据,调整队列(alignments)结果。另外, 你可以查看每一个或所有序列的质量评分。SeqMan II为你提供自动或手动工具,帮助你选择是否加入多个contigs。和其他Lasergene应用程序一样,SeqMan II也提供整合的BLAST查找功能。
输入序列片段
我们将从打开“Demo Seqman”文件夹中的14样品序列开始。每个序列都是自动测序仪(PE Applied Biosystems, Inc.)输出的文件格式(*.trace)。 ? 从文件菜单,选择New打开Unassembled Sequences窗口和一个空的未命名
Project Summary窗口。Project Summary窗口在你装配序列之前始终是空的。
? 从Sequences菜单选择Add打开
Enter Sequences对话框(如右)。 ? 打开“Demo Seqman.”文件夹会出
现14个序列。这些就是我们将要装配的序列。
? 把片段序列通过把Add All按钮移到右边的窗口。现在14序列名字应该出
现于右边的窗口中。单击Done按钮。
? Unassembled Sequences窗口现在会出现这14个序列。
38
? 通过拖拽其窗口右下角展开窗口,直到你能同时看全部样品名字。 Pre-Assembly Options操作 在装配前面,你可以考虑进行两三个装配前的选择。你可以从你的片段中除掉载体和污染序列,优装配顺序,设定片段末端和标记重复序列。在这一节中,我们将从样品中自动除掉Janus载体序列并修整序列末端。 ? 选定全部14个序列。
? 在窗口右上的下拉菜单中选择“Janus”
作为SeqMan I要寻找的载体。
? 点击窗口上边的Trim Ends按钮打开右
边的对话框。你将注意到在没有特别指定的情况下,SeqMan II将用适中的严谨度进行末端修整。不改变设定退出对话框。
? 单击窗口右上的Options按钮。打开下
面的对话框,显示全部装配前的选择一览表。默认设定显示扫描载体,实行序列末端修整,使用最适当的序列装配顺
序。
? 单击Scan All。报告窗口将出现,
但是现在可以放到一旁。在扫描后,你将注意到Unassembled Sequences窗口的2中心专栏发生了变化。现在载体栏显示:载体名字前都有一个检测通过的标志,说明Janus载体在全部14序列中都已经检测到了。limits栏展示新的序列末端,说明载体序列已经去除,末端修整已经完成。
查看修整的数据
现在我们可以查看在扫描完成的末端修整和载体序列去除的细节报告。 ? 从PROJECT MENU,选Trim Report
打开左边的窗口,窗口中显示:末端修整的参数、每个序列的名字,平均质量,被修整的数量以
及修整前和修整的序列长度。 ? 在你查看完报告之后,关上它。
要查看SeqMan的修整结果,让我们查看休整后序列的跟踪数据。
? 从Unassembled Sequences窗口,双击打开8号样本,打开右面的
chromatogram窗口。 从5’末端起变淡的部分将不会用于序列装配。注意大部分
39
序列修整部分优化后的质量。之所以从这里去除,是因为这些变淡的序列是Janus载体序列。
垂直的黑的棒出现于修整和未修整的序列之间。你可以根据需要拖动黑棒调整用于装配的序列末端。
下面,让我们查看一下序列的5’末端: ? 单击一致序列的任何地方。
? 从编辑菜单,选择Go To Position。 ? 在位置文本框输入“500”。 ? 单击同意。
注意到最好的质量落到这区域上,SeqMan II认为507位以外的序列质量低于中等水平。
? 检查完跟踪数据后,关上那个窗口。
序列装配
现在我们准备调用序列装配程序。
? 单击Unassembled Sequences窗口左上的装配按钮。
Unassembled Sequences窗口立即消失,报告窗口显示装配的进度。装配完整之
后,出现左边的窗口,窗口上边为装配好的一致序列,窗口下边为所有连续的序列。在我们例子中,SeqMan II将14个序列装配成为单一的contig。
查看覆盖面和构建结果
现在我们已经将所有的片段装配成一个序列,下面我们用Strategy View查看一下其中的矛盾碱基的数量和序列的覆盖程度。这个窗口图形化的显示了
每个片段在contig中位置和方向。
? 单击Project window中
的contig。
? 从CONTIG菜单,选择
Strategy View打开右边的窗口。注意标尺下面的那条带,显示学的覆盖程度。
条带的颜色和厚度代表覆盖序列的数量。你会看到在大致200-900之间有绿色的较
厚条带。这表示两条链都被测序,且高于最小覆盖面临界值的区域。(覆盖面临界值可以通过PROJECT MENU-Parameters-Strategy Viewing来改变)。中间的蓝线表示只有一条链被测序的区域。。出现于contig两边的细红线表示这个区域只测过一次序。
? 选定窗口左上的Conflicts box可以查看片段序列间的一致程度方型图。方
40