实习 3 : : 本地数据库搜索及比对
实验目的:
1. 学会用BLAST+进行本地数据库搜索
2. 学会使用HMMER进行HMM模型构建,数据库搜索和序列比对 进行多条序列比对分析 实实验内容: 一、 二、 作业:
1) 用NCBI搜索yeast核酸序列,限定Refseq,下载fasta格式文件。安装
blast++后,在命令行窗口进行运行,将所下载的粘贴到blast-2.2.31+\\bin文件夹,构建数据库,如下图
使用Blast+进行本地搜索 HMMER
对数据库进行过滤,如下图
再进行建库,如下图
找到topoisomerase ,粘贴到blast-2.2.31+\\bin文件夹,如下图寻找
由result可知,Sequences producing significant alignments (hits)为29,最高分4167,最高匹配100%,两个最高分分别是TOP1的mRNA和全序列,并没有TOP2, TOP3,可以判断不存在直系同源的关系。
2、用NCBI搜索nitrogenase蛋白质序列,限定Refseq,下载fasta格式文件,将所下载的粘贴到blast-2.2.31+\\bin文件夹,构建数据库,如下图
对数据库进行过滤,如下图
再进行建库,如下图
找到NifD ,粘贴到blast-2.2.31+\\bin文件夹,如下图寻找
从protein_result结果知hit为40,最高分为1035,最高匹配为100%,据此可知为同源序列。
3、用Pfam数据库搜索nac family序列,下载序列的Stockholm格式和maize protein sequence 【fasta】格式,粘贴到hmm\\tutorial文件夹中,使用命令窗口输入hmmbuild NAC.hmm tutorial/NAC.sto得到NAC.hmm文件,然后
利用HMM模型搜索数据库(hmmsearch)输入hmmsearch NAC.hmm tutorial/ZmB73_5b_FGS_translations.fasta > NAC.out后得到NAC.out文件,再利用HMM模型比对多条序列(hmmalign),输入hmmalign NAC.hmm tutorial/ZmB73_5b_FGS_translations.fasta > NAC.sto得到NAC.sto,最后再用Muscle进行比对。
得到17条序列Hmmalign比对结果通过Clustal显示如下图所示
Muscle比对如下图所示,
通过比对结果分析,两者比对结果存在差异,Hmmalign是经过构建模型而得到,因此其比对结果更有效。