选择您感兴趣的基因,进行多物种的基因组搜索,将获得的序列进行基因序列特征分析,并构建多序列比对和系统发生树,请阐明选择基因的目的、试验步骤和进行结果分析。 解:本次作业以人类(homo sapiens)的视黄醇结合蛋白RBP4为例来做.其序列文件如下:
>Homo sapiens retinol binding protein 4, plasma (RBP4), mRNA|gi|55743121|ref|NM_006744.3 CGCCTCCCTCGCTCCACGCGCGCCCGGACTCGGCGGCCAGGCTTGCGCGCGGTTCCCCTCCCGGTGGGCG GATTCCTGGGCAAGATGAAGTGGGTGTGGGCGCTCTTGCTGTTGGCGGCGCTGGGCAGCGGCCGCGCGGA GCGCGACTGCCGAGTGAGCAGCTTCCGAGTCAAGGAGAACTTCGACAAGGCTCGCTTCTCTGGGACCTGG TACGCCATGGCCAAGAAGGACCCCGAGGGCCTCTTTCTGCAGGACAACATCGTCGCGGAGTTCTCCGTGG ACGAGACCGGCCAGATGAGCGCCACAGCCAAGGGCCGAGTCCGTCTTTTGAATAACTGGGACGTGTGCGC AGACATGGTGGGCACCTTCACAGACACCGAGGACCCTGCCAAGTTCAAGATGAAGTACTGGGGCGTAGCC TCCTTTCTCCAGAAAGGAAATGATGACCACTGGATCGTCGACACAGACTACGACACGTATGCCGTGCAGT ACTCCTGCCGCCTCCTGAACCTCGATGGCACCTGTGCTGACAGCTACTCCTTCGTGTTTTCCCGGGACCC CAACGGCCTGCCCCCAGAAGCGCAGAAGATTGTAAGGCAGCGGCAGGAGGAGCTGTGCCTGGCCAGGCAG TACAGGCTGATCGTCCACAACGGTTACTGCGATGGCAGATCAGAAAGAAACCTTTTGTAGCAATATCAAG AATCTAGTTTCATCTGAGAACTTCTGATTAGCTCTCAGTCTTCAGCTCTATTTATCTTAGGAGTTTAATT TGCCCTTCTCTCCCCATCTTCCCTCAGTTCCCATAAAACCTTCATTACACATAAAGATACACGTGGGGGT CAGTGAATCTGCTTGCCTTTCCTGAAAGTTTCTGGGGCTTAAGATTCCAGACTCTGATTCATTAAACTAT AGTCACCCGTGTCCTGTGAAAAAAAAAAAAA
通过 Genbank(http://www.ncbi.nlm.nih.gov/blast/)中的Blastn 检测最相似序列或在GenBank 中下载参考序列,选择Nucleotide-nucleotide BLAST (blastn)。将上述序列粘贴到输入框中,如下图:
注:这里选用
点击 Blast,得到如下结果:
库
根据序列相似性大小,将相似性最大的序列下载下来,这里选择如下一些序列:
并与原始文件放在一起形成一个文件
:
之后的建树的步骤和上面的实验的步骤就大同小异了: ①多序列比对:
比对后产生的多序列比对文件保存为
②比对后序列修剪(掐头去尾):
修剪后的文件
③系统发生树构建:
这里就用n-j法建树:
得到发生树如下
: