西 安 交 通 大 学 实 验 报 告
课 程 生物信息学 实验名称 核酸和蛋白质序列数据的使用
系 别 实 验 日 期 : 专业班级 组别 交报告日期 : 姓 名 学号 报 告 退 发 :(订正、重做)
同 组 人 无 教师审批签字:
实验目的:了解常用的序列数据库,掌握基本的序列数据信息的查询方法。 实验步骤:在序列数据库中查找某条基因序列(insulin人的),通过相关一系列数据库的
搜索、比对与结果解释
实验结果:
1.该基因的功能是?
DNA结合、RNA结合、雄激素受体结合、酶结合、蛋白结合、转录激活活性、转录调控区的DNA结合、微管蛋白结合、泛素蛋白与连接酶结合、泛素蛋白连接酶的活性、提高泛素蛋白连接酶的活性、锌离子结合
2. 编码的蛋白质序列是怎样的? 10 20 30 40 50 60 MALWMRLLPL LALLALWGPD PAAAFVNQHL CGSHLVEALY LVCGERGFFY TPKTRREAED 70 80 90 100 110 LQVGQVELGG GPGAGSLQPL ALEGSLQKRG IVEQCCTSIC SLYQLENYCN 3. 该蛋白质有没有保守的功能结构域
该蛋白质有保守的功能结构域。分别为cd00027(Location:1763 – 1842 Blast Score: 107) cd00162(Location:23 – 68 Blast Score: 134) pfam04873(Location:655 – 978 Blast Score: 1301) pfam12820(Location:344 – 507 Blast Score: 809)pfam13923(Location:20 – 65 Blast Score: 135)
4. 该蛋白质的功能是怎样的?
①E3泛素蛋白连接酶,专门介导LYS-6'-联泛素链的形成,并通过促胞对DNA损伤的反应,在DNA修复中起着核心的作用;目前还不清楚是否也介导其他类型的泛素链形成。E3泛素蛋白连接酶的活性是其抑癌能必需的。②BARD1- BRCA1异源二聚体协调各种不同的细胞通路,如DNA损伤修复,泛素化和转录调控,以维持基因组稳定性。③调节中心体微核。④从G2到有丝分裂的正常细胞周期进程所必需的。⑤参与转录调控在DNA损伤反应中的P21。⑥为FANCD2靶向DNA损伤位点所需。⑦可以用作转录调控因子。⑧绑定到ACACA和防止其去磷酸化,抑制脂质合成。
5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。
该蛋白有三级结构,如图所示
西 安 交 通 大 学 实 验 报 告
课 程 生物信息学 实 验 名 称 双序列比对
系 别 实 验 日 期 : 专业班级 组别 交报告日期 : 姓 名 学号 报 告 退 发 :(订正、重做)
同 组 人 无 教师审批签字:
实验目的:
1、练习使用动态规划算法进行双序列比对; 2、理解打分矩阵和参数对; 3、双序列比对结果的影响; 4、理解动态规划算法的原理。 实验步骤及结果:
1. RNP1和RNP2是否得到比对?
选择至少三个(差别大的)空位罚分和延伸值来进行比对 (1)空位开启 1.0 空位延伸:0.5 结果:比对成功
# -gapopen 1.0 # -gapextend 0.5 # Length: 75
# Identity: 38/75 (50.7%) # Similarity: 51/75 (68.0%) # Gaps: 14/75 (18.7%) # Score: 203.5
EMBOSS_001 1 --ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45
|.||||||||||:|| | | : :||.:||.|.:|:::|| | ||.|. EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46
EMBOSS_001 46 GYAFVDFTSEM--DSQRAIKVLNG- 67 ||.||:: |: |:.:||..|||
EMBOSS_001 47 GYGFVNY-SD-PNDADKAINTLNGL 69
(2)空位开启:5.0 空位延伸:0.5 结果:比对成功
# -gapopen 5.0 # -gapextend 0.5 # Length: 69
# Identity: 35/69 (50.7%) # Similarity: 47/69 (68.1%) # Gaps: 2/69 ( 2.9%) # Score: 181.0
EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAF 49
.|.||||||||||:||..|..:||.:||.|.:|:::||..||.|.||.| EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGF 50
EMBOSS_001 50 VDFTSEMDSQRAIKVLNG- 67 |:::...|:.:||..|||
EMBOSS_001 51 VNYSDPNDADKAINTLNGL 69
(3)空位开启:1.0 空位延伸:10.0 结果:比对成功
# -gapopen 1.0 # -gapextend 10.0 # Length: 74
# Identity: 38/74 (51.4%) # Similarity: 51/74 (68.9%) # Gaps: 12/74 (16.2%) # Score: 203.0
EMBOSS_001 1 --ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45
|.||||||||||:|| | | : :||.:||.|.:|:::|| | ||.|. EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46
EMBOSS_001 46 GYAFVDFTSE-MDSQRAIKVLNG- 67 ||.||:: |: .|:.:||..|||
EMBOSS_001 47 GYGFVNY-SDPNDADKAINTLNGL 69
2a. 算法是否找到RNP1和 RNP2的正确比对?
如上图
b. 当空位开启罚分高时,结果发生什么变化?
对比上图(1)和(2)得知空位开启罚分高时,结果得分变低 c. 当空位延伸罚分高时,结果发生什么变化?
对比(1)和(3)得知空位延伸罚分高时,结果变低,但不明显 d. 为什么k个连续的空位罚分要小于k个间隔的空位罚分?
因为空位开启的罚分影响要高于空位延伸罚分,综合2a和b可知,所以k个连续空位罚分要比k个间隔空位罚分低。
使用PAM250矩阵重复上述过程。 3. 比对结果是否发生变化?
(1)
# -gapopen 1.0 # -gapextend 0.5 # Length: 76
# Identity: 38/76 (50.0%) # Similarity: 56/76 (73.7%)
# Gaps: 16/76 (21.1%) # Score: 213.5
EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S 44
.|:||||||||||:|| | | : :|| :||.|::|:::|| | || | EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45
EMBOSS_001 45 YGYAFVDFTSEM--DSQRAIKVLNG- 67 .||:||:: |: |:::||:.|||
EMBOSS_001 46 LGYGFVNY-SD-PNDADKAINTLNGL 69 (2)
# -gapopen 5.0 # -gapextend 0.5 # Length: 70
# Identity: 36/70 (51.4%) # Similarity: 55/70 (78.6%) # Gaps: 4/70 ( 5.7%) # Score: 191.0
EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYK-TGYSYGYA 48
.|:||||||||||:||:.|:.:||.:||.|::|:::|| | ||.|.||: EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRD-KITGQSLGYG 49
EMBOSS_001 49 FVDFTSEMDSQRAIKVLNG- 67 ||:::...|:::||:.|||
EMBOSS_001 50 FVNYSDPNDADKAINTLNGL 69
(3)
# -gapopen 1.0 # -gapextend 1.0 # Length: 75
# Identity: 38/75 (50.7%) # Similarity: 56/75 (74.7%) # Gaps: 14/75 (18.7%) # Score: 213.0
EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S 44
.|:||||||||||:|| | | : :|| :||.|::|:::|| | || | EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45
EMBOSS_001 45 YGYAFVDFTSE-MDSQRAIKVLNG- 67
.||:||:: |: .|:::||:.|||
EMBOSS_001 46 LGYGFVNY-SDPNDADKAINTLNGL 69
4a. RNP1 和RNP2 是否在局部比对中得到比对? RNP1 和RNP2 在局部比对中比对成功。 b. 局部比对的生物学意义是什么?
局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义
c. 为什么在这种比对中我们选择局部比对而不是全局比对?
答:局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。 5. 比对结果发生了什么变化?
答:从3的图中可以看出,在同一个打分矩阵下,比对结果基本没有差别;在不同的打分矩阵下,比对结果也基本无区别,但得分有所变化。