对蛋白质和合成多肽进行的研究揭示了氨基酸残基对??螺旋、??片层、和??拐弯结构倾向的部分原因。??螺旋是预臵构型(default conformation)。但是??碳原子有分支结构(如颉氨酸、苏氨酸、异亮氨酸)时,??螺旋结构将出现原子的立体碰撞。这些残基倾向于??链结构(侧链凸出于多肽主链平面外)。丝氨酸、天冬氨酸和天冬酰胺因有氢键供体或受体的侧链与主链很近,能竞争主链相应的氢键受体或供体不利于??螺旋结构的稳定。由于脯氨酸缺乏NH基团、其环状结构将?角度限制在60o左右,所以脯氨酸会破坏??螺旋和??片层。甘氨酸适于任何类型的结构,因此这个氨基酸对??螺旋并无偏好。
利用氨基酸残基构型的偏好性能够预测蛋白质的二级结构吗?长度是六氨基酸残基或更少的肽段,预测二级结构的准确性达到60%~70%。那么,有没有更为准确的预测方法?注意,氨基酸残基的倾向性结构并不是在所有情况下占统治地位(表2.3)。例如谷氨酰胺倾向于??螺旋结构只是??片层结构倾向性的两倍。其它氨基酸残基的结构倾向性大多数比谷氨酰胺还弱。实际上有些五肽或六肽在一蛋白质中采用一种结构,但在另一种蛋白质中会采用完全不同的另一种结构(图2.60)。因此有些氨基酸序列没有唯一的二级结构。三级水平的相互作用(即在氨基酸序列上相距很远的氨基酸残基之间的相互作用)在确定一些氨基酸序列所选用的二级结构方面可能起关键作用。一段氨基酸序列的前后内容也影响这段氨基酸序列的二级结构选择。蛋白质构型进化的结果使该蛋白质在特定环境或特定的前后序列环境中能发挥作用。用家族蛋白的相关序列(这些序列常常采用相同的结构)修改蛋白质二级结构预测方案,能够改进预测结果。
图2.60 同一序列的肽段在不同蛋白质分子中采用不同的二级结构。有很多序列在不同蛋白质分子中有不同的二级结构。VDLLKN(用红色表示)在一种蛋白质(左边)中是??螺旋,而在另一种蛋白质分子中是??链(右边)。[Drawn from 3WRP. Pdb(left) and 2HLA(right). pdb]
蛋白质错误折叠与一些神经疾病有关
直到最近人们仍然认为所有的传染性疾病都是病毒或细菌感染所致。但现代医学有一个称奇的发现:有些神经性传染病是一种大小与病毒相当,但只含有蛋白质的传染剂。这些疾病包括疯牛病(mad cow disease, bovine spongiform encephalopathy),以及其它生物体的类似疾病如人类的Creutzfeldt-Jacob disease (CJD) 和羊的瘙痒病(scrapie)。导致这些疾病的试剂叫阮病毒(prion)。Stanley Prusiner首先提出纯粹蛋白质也能传播疾病的概念,并因此获得1997年诺贝尔生理学和医学奖。
这些传染剂有下列特征:
1. 传染试剂是积聚形式的特定蛋白质。参与积聚的分子有数量差异。 2. 积聚后蛋白质能够耐受多数蛋白质不能耐受的处理条件。 3. 主要成分或全部成分是一种胞内蛋白(PrP),在正常情况下PrP存在于大脑组织。
积聚状态与脑内正常蛋白在结构上有什么差异?脑内正常的PrP蛋白大多数区域是??螺旋,少数区域是b?链。由于这种蛋白质积聚状态不均一、而且难溶解,因此至今没有确定患者脑组织的PrPSC结构。但是不同的证据显示原来的??螺旋或??拐弯在患者组织转化成??链。一个蛋白质分子的??链与另一个蛋白质的??链相互作用形成??片层,导致蛋白质积聚。纤维蛋白积聚常被称为淀粉样形式。
所以,prion类疾病是大脑内已有蛋白质的积聚所致。有人提出了这种疾病的传播模型(图2.61)。蛋白积聚成为PrP异常的核心,其它PrP蛋白将粘合在这个核心上。因此Prion疾病的传播就是一个患者的PrP异常的核心颗粒传播到另一个体,产生了1990年代英国疯牛病流行。当初用患病牛做成的动物饲料饲养牛,又导致后者也患上疯牛病。
图2.61 Prion疾病传播的模型。
有些非传染性神经退化疾病如Alzheimer和Parkinson疾病患者的脑组织也有淀粉样纤维,Alzheimer患者多肽链A?发生淀粉样蛋白积聚。多肽链A?来源于APP(即淀粉样前体蛋白)。APP经特殊蛋白酶切后产生淀粉样变性。尽管这些蛋白质不溶解,但是用NMR解析出多肽链A?(固态而不是液态)的详细结构。如我们所料,多肽链转化成富含??链的结构形式,后者形成平行排列的??片层伸展结构(图2.62)。
这种积聚如何导致携带这种蛋白质的细胞死亡?目前的答案还是相互矛盾的。一种假设是大积聚体本身没有毒性,但同一蛋白的小积聚体也许会损伤细胞膜,成为细胞死亡的元凶。
图2.62 淀粉样纤维的结构。固相NMR研究推测A?的结构模型显示蛋白积聚源于大的平行b-片层的形成[From A. T. Petkova, et al. Proc Natl Acad Sci USA 99(2002): 16742 - 16747.]
蛋白质折叠是协同进行的
如同早先所指出的,加热或用化学变性剂如尿素或盐酸胍处理能变性蛋白质。很多蛋白质变性程度与变性剂浓度之间的关系显示蛋白质从折叠状态(天然形式)到非折叠状态(变性形式)的转化曲线相当急促,提示蛋白质变性过程中主要构象成分就是两种(即折叠的天然状态和没有折叠的变性状态)(图2.63)。如果将变性剂从蛋白质溶液中移去,使蛋白质从变性状态恢复折叠成天然状态,其复性过程也是非常急促的。
图2.63蛋白质折叠和非折叠的急促转化显示这种转化呈“全是”或“全不是”的协同过程。将蛋白质臵于部分蛋白处于热力学不稳定的条件下,由于部分结构已经变性,它们将与蛋白质分子内其它区域相互作用,导致其余区域的结构不稳定使蛋白质分子的全部结构变成非折叠状态(即变性形式)。这一特性能够合理解释蛋白质变性的协同特征。
图2.63 从折叠状态转化成非折叠状态。增加变性剂浓度,大多数蛋白质从折叠状态变成非折叠状态的转变过程很急。
图2.63 从折叠转化成非折叠状态。逐步增加变性剂浓度使蛋白质从折叠转化成不折叠状态,大多数蛋白质呈现出结构急促转化的特征。
分析在折叠和非折叠转化曲线的中点蛋白质折叠状态能解释蛋白质协同性折叠的结果。在这种条件下蛋白质处于“半折叠”状态。但是蛋白质溶液没有一个“半折叠”分子,而是50%的蛋白质是全折叠的天然结构和50%的蛋白质是全变性的非折叠结构(图2.64)。虽然宏观上看,此条件下的蛋白质溶液似乎只有两种结构,但是从原子角度看,这种简单的两结构是不真实的。在全折叠的天然蛋白结构和全不折叠的变形蛋白结构之间肯定有不稳定的中间转化状态。确定这些中间转化状态是生物化学研究的热点之一。
图2.64 部分变性蛋白质溶液的蛋白质组分。在半折叠蛋白质溶液中,有50%蛋白质是全折叠(天然结构),50%蛋白质是全不折叠(变性结构)。
蛋白质折叠是一个渐进稳定过程而不是随机搜寻过程
变性蛋白质如何转化成天然蛋白(全折叠状态)?一种可能是蛋白质呈现各种可能的空间结构,然后从中寻找热力学上最稳定的空间结构。如果这样,1种长度达到100个氨基酸残基的蛋白质进行这类稳定结构搜寻需要多长时间?Cyrus Levinthal假定一个氨基酸残基有3种构象选择,那么该蛋白质就有3100种可能结构(相当于5 x 1047种)。如果将一种结构转化成另一种结构需要10-13秒,整个搜寻过程需要5 x 1047 x 10-13秒(即1.6 x 1027年)。因此从所有可能出现的蛋白结构搜寻正确结构所需的时间太长了。计算时间与蛋白质折叠实际所需要的时间之间的差异称为Levinthal矛盾。该矛盾证明蛋白质折叠不是尝试所有可能的折叠模式,而是用完全折叠形式和完全非折叠形式之间的几种中间折叠模式构成部分限定的折叠途径。
解决Levinthal矛盾的一个方法是累积筛选。Richard Dawkins研究猴子随机点击打印机需要多长时间才能打印出\(图2.65)。发现要击打1040次才能成功。但是,如果猴子在某些位点点击的字符正确就不用再点击该点字符,只要求猴子重新点击那些错误字符,就只要几千次点击就可以打印出\。两者之间的关键差异在于前者是全部随机,后者是保留部分正确的中间体(仅修改错误)。
蛋白质折叠也有保留部分正确的中间体的倾向。但是蛋白质折叠比上述猴子打字试验要复杂多了。第一,没有一个预先就已经知道的标准来判断各个氨基酸残基构象的正确性,从而决定是否保留,而完全依靠临时出现的中间体所具备的自由能加以判断。第二,蛋白质的稳定性很差。长度在100氨基酸残基蛋白质的折叠和非折叠状态自由能的差异只有42kJ/mol(相当于10kcal/mol),因此各个残基对自由能的平均贡献只有0.42kJ/mol (相当于0.1kcal/mol)。这个数据比室温下的热能(2.5kJ/mol)低。如此细微的稳定能量提示哪些中间体(尤其是早期形成的中间体)是否正确的难度很大。就像猴子得自由地敲击正确键盘(而不是仅敲击错误之处)。然而,残基之间的相互作用产生的协同折叠能稳定构建的中间体结构。因此,有明显结构倾向性的区域,虽然这种倾向性结构不一定对这个局部自身的稳定性重要,但仍然会选择倾向性结构。因为该区域一旦形成这种倾向性结构,就能与该蛋白质其它区域相互作用而进一步提高蛋白质的稳定性。这种模式叫成核-凝聚模型(nucleation-condensation model)。