海洋微生物来源的天然活性物质的筛选策略
New Technologies for Discovery of Natural Rroducts from Marine
Mcrooganisms
摘要:细菌耐药性产生和新药退化的速度越来越快,使得寻找新型抗菌药物迫在眉睫。目前上市的新药数量很少且基本都是对已上市药物的结构进行改造,很难从本质上改变细菌的耐药性问题。自然界中微生物(尤其是海洋微生物)的多样性及其代谢产物的多样性,为发现新药以及先导化合物提供了不竭动力。海洋微生物在所处环境和代谢途径上与陆地微生物有很大不同,人类在陆地资源开发陷入瓶颈之际,应更多地关注新生境、新资源给天然药物开发带来的活力。面对日益严重的病原微生物耐药性,以及天然药物筛选过程中大量的重复发现,如何采用新技术、新资源、新模型筛选发现新的活性次生代谢产物,已成为天然药物开发中亟待研究的重要课题。
关键词:细菌耐药性;海洋微生物;先导化合物;药物筛选;次生代谢产物
20世纪,虽然新型抗生素的发现和临床开发已经在医学上迈进了一大步,但抗生素耐药性问题也日趋严重,耐药性产生的速度远远快于新型抗生素的发现的速度。1962年以来,只有三类新型抗生素应用于临床:2000年上市的利奈唑胺(linezolid,噁唑烷酮类抗菌药,辉瑞制药),2003年上市的达托霉素(daptomycin,环酯肽类抗生素,Cubist制药公司)以及最新上市的瑞他帕林(retapamulin,截短侧耳素衍生物,葛兰素史克制药公司)。随着耐药菌株和新型病原菌的出现,迫切需要发现具有新型抗菌机制的药物。自然界中含有丰富的微生物资源,有学者认为,其中99%以上的微生物是不可培养的。微生物(尤其是海洋微生物)的多样性及其代谢产物的多样性,为发现新药以及先导化合物提供了不竭动力。面对日益严重的病原微生物耐药性,以及天然药物筛选过程中大量的重复发现,如何采用新技术、新资源、新模型筛选发现新的活性次生代谢产物,已成为天然药物开发中亟待研究的重要课题。前人给我们提供了大量可信的工作和易于理解的综述。本文主要对从可培养的微生物与不可培养的微生物中发现
1
新化合物的研究方法方面进行综述。 1 从可培养的微生物中发现新的化合物
1.1 Genome-mining为导向的微生物来源的天然产物的发现
近年来,基于结构相似的次生代谢产物的合成基因簇也有一定程度相似性的假设,基因筛选成为寻找新化合物的重要手段之一。通过将特定基因作为筛选标记,可以在基因水平上评估相应菌株的活性物质产生能力 ,从而筛选到在初始条件下菌株低表达或不表达的活性物质;另一方面,通过对基因筛选所获得的次生代谢产物合成相关基因(簇)进行生物信息学分析,可以初步预测产物结构,在一定程度上避免化合物的重复发现。放线菌的大部分次生代谢产物是通过聚酮合酶(polyketide synthase,PKS) 和非核糖体多肽合成酶(non-ribosomal peptide synthetase,NRPS) 途径形成主要结构模块;而活性产物更重要的一个特性—结构多样性,则是由一类称为后修饰酶的蛋白决定的,其中包括卤化酶。卤化作为赋予次生代谢产物生物活性的一种重要修饰行为,常常通过依赖黄素腺嘌呤二核苷酸(FADH2)的卤化酶引入。基于上述假说,这种同源基因可以被用作合适的标记在分子水平上预测产物结构。目前已有将此策略成功应用于筛选天然含卤化合物产生菌的报道。 1.1.2 FADH2-依赖型卤化酶序列特异性
通过对FADH2 -依赖型卤化酶氨基酸序列(约550AA)比对发现,在氨基酸末端有两个保守区域[1](图1),其中一个为靠近氨基端的保守序列GxGxxG,该序列与黄素的结合相关;另一个为位于蛋白中间包含两个色氨酸残基的保守序列WxWxIP,两个色氨酸残基与黄素相邻,可能是起到阻止底物与黄素结合的作用[2]。
图1. FADH2-依赖型卤化酶氨基酸序列保守区域
1.1.2 FADH2-依赖型卤化酶在寻找天然卤化物方面的应用
很多卤化物的生物合成基因簇中的卤化酶为FADH2-依赖型卤化酶。Hornung等[3]利用avilamycin、simocyclinon、complestatin、balhimycin、calicheamicin和ansamitocin的卤化酶保守区域设计一对简并引物,对550株随机选择的放线菌进行筛选,发现其中103株(约20%)含有潜在的FADH2依赖型卤化酶基因。并通过与已知的卤化酶进行比对,根据具有相似结构的次级代谢产物的生物合成基因簇中往往含有某些同源性很高的基因这一假说,Hornung等通
2
过对一株含有与糖肽类balhimycin卤化酶相似性为93%的放线菌进行研究,发现了一个糖肽类抗生素cb2364(图2a)新的产生菌。另外,将其中一株放线菌假定的卤化酶基因及其连锁的PKSII型基因簇在背景较清楚的白色葡萄球菌中异源表达,发现了一种新的聚酮类卤化物CBS40(图2b),其对VRE的抗菌活性为万古霉素的100倍。高鹏和黄英[4]也利用Hornung 等人设计的引物,对228株放线菌进行筛选,并研究其分布与进化规律,为寻找天然卤化物奠定了一定的基础。通过以上的研究表明,寻找新的FADH2-依赖型卤化酶可成功应用于新的含卤素抗生素及其生物合成基因簇的发现与预测。
图2. A) CB2364化学结构,B)CBS40化学结构
1.2. Transcriptome-mining为导向的微生物来源的天然产物的发现
微生物来源的天然产物(NPs)是一种具有结构多样性的小分子物质,它们在先导化合物的发现和新型药物的发展中起了举足重轻的作用。NPs的产生依赖于微生物生物合成基因簇中相关基因的协调转录,形成的mRNA再翻译成相关的多肽链,这种多肽链正确折叠后形成具有功能的蛋白质,协调催化小分子的前体物质形成复杂结构的化合物(图3)。在过去十年内,由于放线菌基因组的不断测序发现,每个菌株的基因组中至少存在十几个生物合成基因簇,但是只有10%的基因簇被鉴定能够产生相应的次级代谢产物[5]。生物转化为导向的研究已经成功的发现了十几种生物合成基因簇能够产生新的代谢产物,这些化合物包括PKS,NRPS和萜类合成酶催化产生的。在新化合物发现已举步维艰的趋势下,通过新的方法钓取基因组中隐藏的基因簇,使之能够产生相应的化合物。在后基因组时代,通过新的策略靶向的发现新的天然产物已变的尤为重要。因此,中国科学院有机所刘文教授[6]用S. flaveolus DSM 9954作为模式系统,在转录水平,钓取活性生物合成途径和他们相关的产物。这种有效的mRNA-based mining策略,在提高新的天然化合物的发现效率方面,具有潜在的应用价值。 整个过程如下所示:
3
(1)首先估计了S. flaveolus DSM 9954在不同培养基中的化学成分。分别用6中培养基进行发酵4天。HPLC分析培养液,显示产物成分的区别。对产生产物最多样性的培养基成分进行时程分析,第四天大部分产物产量达到最高。这些点被选择做转录组学分析。从第四天培养液中分离总RNA,反转录成cDNA,这样就组成一个条件性转录组。 (2)对cDNA进行PCR扫描,引物设计根据产生不同结构基序的多种生物合成基因而来。PCR产物通过280到550bp的退化性引物扩增产生,这些引物包括组装多聚乙酰碳骨架的PKS I型模块 的酮酯酰合成酶(KS)区域,活化氨基酸底物的线性NRPS途径中的腺苷酸区域,核糖体肽途径中负责噻唑琳部分的硫肽环化脱水酶,脱氧糖形成相关的(d) NDP-d-glucose-4,6-dehydrase 以及负责添加卤原子的FDH。然而,对tcdh,dgdh和fdh的扩增没有得到产物,pks和nrps扩增得到不同产物。PCR产物克隆到质粒,转化进E. coli.。随即选择50克隆测序。所有序列都与一直的PKS和NRPS基因有同源性。对产物进行分组:7pkss和3nrpss。mRNA表达得到的产物中有5pkss和1nrpss是全新的,在已报告的产物中没有发现类似物,他们可能编码未知的多聚酮,多肽链或者它们的杂交。 (3)重复上述提到的程序,用基因组DNA代替cDNA比较这种基于转录组的方法和传统PCR依赖性的基因组扫描方法的效率。同样没有tcdh和fdh反应,说明在S. flaveolus基因组中不存在或者没有足够分散阻止变形引物的退火。ngdh有,说明基因组存在但在本发酵过程中不表达。对pkss和nrpss扩增分别得到11中基因,随即测序15个克隆,在SF生物合成基因簇中之发现了1个。说明基于cDNA比Genomic DNA得到的产物更具多样性。这说明在钓取生物合成基因是这个策略在效率方面有很大优势。 (4)为了建立基因和位置化合物之间的联系,对每个基因进行敲除。
(5)用pcr1-5和pcr8为探针,将负责MTYCs合成的生物合成基因簇从基因组文库中克隆。结果说明了cDNA方法在NPs相关活性生物合成途径的加快和鉴定方面具有优势。
这种新的转录组扫描方法可用从位置基因组序列的菌体发现NP产物或者从生物合成途径中组装NP。这个方法省时,并且适合特定的感兴趣的化合物,比如改变培养条件来活化特定代谢产物的产生或设计心的引物来扩增特定的生物合成原件。这中可以整合到可行的基因组吊取策略中来唤醒隐藏的基因簇,使NPs扫描和它们生物合成研究变的更灵活。
4
图3. Transcriptome-mining为导向的微生物来源的天然产物的发现
1.3 质谱为导向的genome-mining途径筛选的肽类天然产物(PNPs)的发现[7]
肽天然产物是一种普遍存在的化合物,在所有的生物形式中都有发现,并且在这些生物体的生长、防御以及信息传递方面发挥多样的生物功能。自然界中已经发现包括核糖体和非核糖体在内两种生物合成途径来合成这些多修饰的肽类。尽管非核糖体肽类分布相对有限,这种限制主要对具有大的基因组的微生物而言,而核糖体合成并经翻译后修饰的肽在自然界中具有广泛的分布,这也包括人体内的肽。然而,PNPs的多样性、分布的广泛性及其相关的功能直到今年才被人们认识,这主要因为该研究过程需要大量的时间。我们报道了一种新的质谱指导的基因组挖掘方法,该方法能够快速的建立PNPs的化学型跟其生物合成途径之间的联系,因此能够在一个流线型的筛选平台上快速鉴定具有活性PNP的生物合成基因簇进而对其产物进行分组。
在PNPs中,核糖体肽作为一个天然产物组其数量快速增加。通过生物合成途径,已经鉴定了多组原核生物起源的核糖体肽天然产物(RNPs)。通过这些途径合成的产物经多种翻译后修饰得到含羊毛硫氨酸的肽,含硫环状多肽,cyanobactins,套索状肽和其他的小菌素。鉴于此,依据生物活性、产生菌以及结构的传统RNP分类方法向主要依据生物合成途径的新的分类方法改变。在RNP生物合成过程中,肽段氨基酸序列是由前体基因编码的,该基因经核糖体直接翻译后形成包括前导肽和核心肽的区域。前导肽作为支架并且包含加工酶的识别位点参与RNP生物合成系统的翻译后修饰,而该系统中的核心肽是经修饰的天然产物的主要部分。生物合成酶对核心肽翻译后修饰现象十分广泛并且能够丰富这些肽类的结构,粗略一看并不能
5
辨认出它们就是核糖体合成的分子。与此相反,非核糖体肽由一系列多功能的蛋白模块通过腺苷酰化酶作用编码氨基酸前体。这些蛋白能够选择性的向转运蛋白传送其底物以便非核糖体肽合成酶(NPRS)对肽类的合成。这一过程能够捕获除20种基本氨基酸外的其他底物,生成一些值得关注的例如万古霉素、达托霉素以及环孢菌素等具有临床应用价值的物质,而RNPs仅有20种基本氨基酸组成。
为了估算细菌中PNP的化学多样性,我们系统的分析了截至到2010年9月the Joint Genome Institute(JGI)数据库中跟RNP及NRPS途径相关的1035个已经完成的基因组。通过搜索Pfam(蛋白家族)数据库中具有RNP特征结构域的RNP生物合成基因簇,我们估计至少71%已经确认的基因组具有合成RNP的特征。我们还鉴定了1966个候选RNP基因簇,其中637个基因簇含有2到3个在RNP基因簇中频繁出现的区域,这些区域共有9个。相比而言,在我们已经研究的基因组中69%含有NRPS的Pfam区域并且53%具有NRPS/PKS杂合特征。因为在该训练组中我们的运算法则只有24个已知的RNP基因簇,所以对于RNPs的估计是不全面的。尽管如此,这一分析表明在大多数细菌中具有普遍的生产RNPs的能力,因此RNPs代表了一大类未被充分认识的生物活性分子家族。 1.3.1 NPP概念
NPP是一个易于操作并且没有偏好性、以质谱为基础的从化学型到基因型的基因组挖掘方法,能够快速鉴定已测序列生物中核糖体和非核糖体肽天然产物及其合成基因簇。简而言之,NPP目的是实现假定PNP串联质谱图中的物质偏转(mass shift)跟编码基因之间的匹配。NPP的基因组挖掘操作包括许多标准步骤,它们能够保证肽的串联质谱数据跟基因组来源的肽结构相互匹配(图4)。在这个过程中,NPP充分利用了过去十年中获得的关于PNP生物合成的大量知识。在实际使用过程中,NPP操作流程开始于利用机制辅助激光解析电离飞行时间质谱(MALDI-TOF MS)来分析生物或者提取物以鉴定未知物质。我们的目标是分子量范围1500-5000Da的物质,因为微生物中该范围内的大多数物质还没有化学水平的描述,因此这正好需要NPP方法。然而,NPP方法在检测方面不受大小的影响,只要串联质谱数据能够作为检测生物合成途径的一种的方法。MALDI-TOF MS对丙醇粗提物或者琼脂培养物的分析能够保证活跃表达的化合物从半固体培养基上被捕获。尽管在PNP搜索过程中不是必须的,MALDI图像联系跟微生物形态有关的分泌代谢物可以减少人工提取过程。在质谱的指导下,假定的肽可以通过分子排阻色谱及随后的富集和脱盐操作而得到富集。经富集的假定PNP随后通过串
6
联质谱在序列标签步骤进行分析。通常来说,NPP序列标签是一种从头序列标签能够从PNPs的基因组挖掘空间里面被查找到。这包括在串联质谱图谱中依据物质偏转生成一个氨基酸顺序和随后根据该串联质谱顺序标签确定找寻标签。物质偏转从所有可能的单体中限定了候选的氨基酸残基,这些单体包括RNP为基础的前提基因的编码单体以及对应于NRPS的单体。串联质谱物质偏转到基因组挖掘单体的过程需要确认PTMs、非核糖体底物、气相片段的行为以及在纯化和质谱分析过程的氨基酸残基的化学修饰。NPP为基础的RNP基因组挖掘引入候选前体肽基因组的六框翻译来确认可能的搜索标签。因为5-10个氨基酸长度的搜索标签可能形成很多的配对情况,正确的RNP前体基因再应用生物合成知识进行确定,这个认识是搜索标签应该跟小于100个氨基酸长度的开放阅读框C末端相互联系,而这个阅读框跟RNP生物合成基因形成基因簇。NPP为基础的NRP基因挖掘需要查询所有目的基因组中可能的非核糖体肽作为搜索标签。
NPP在建立PNP结构跟生物合成基因方面联系上得有效性有赖于遵循生物合成逻辑多次匹配串联质谱为基础的结构跟基因组为基础的候选结构,例如每次搜索标签的匹配必需结合串连质谱分析在物质的量、顺序和生物合成标签方面进行确定。为了说明该方法的有效性,我们比较了NPP方法跟目前使用的蛋白质组方法在从RNP基因组中鉴定前体基因的实验。所有的像Mascot和InsPecT这样的标准的蛋白质组平台都不能鉴定NPP确定的RNPs,这些RNPs是一些具有平常的RNP PTMs或者从未知或没有限制的的情况下去发现未知的PTMs。InsPecT在预设了用于NPP分析的PTMs后才能够鉴定两个RNPs。
图4. 天然产物肽基因组学总流程图
1.3.2 NPP鉴定核糖体肽AmfS
7
为了证明NPP在RNPs发现上面的能力,作者以灰色链霉菌IFO 13350中的AmfS作为研究目标,因为它是一种已知的含有四个PTMs的含羊毛硫氨酸的肽。对灰色链霉菌的MALDI成像以及MALDI-TOF MS分析提取物鉴定了一个分泌分子量为2212Da的物质。我们最后将这种肽进行CID的片段化(图5)。在串联质谱图中,我们确定了序列片段离子的电荷状态并确认物质偏移的顺序是99-99-113-69-101。我们随后将这些物质偏转信息跟候选的可能氨基酸相互匹配,在可能的位点初步用基本氨基酸取代偏转信息获得序列标签。我们接下来利用已知PTMs中的RNP单体来替换非基本氨基酸物质。我们用非基本氨基酸脱氢丙氨酸(Dha)取代69Da的偏转。Dha是核糖体肽中的一个候选氨基酸,这是因为脱氢的丝氨酸和苏氨酸或者脱硫的半胱氨酸在串联质谱中经常看到,这一过程可能是翻译后修饰的结果也可能是串联质谱的气相重排所致。从确认的序列标签VVI(L)S(C)T,我们总结了一个包括正反方向的所有八种可能的PNP的序列标签来搜索灰色链霉菌的基因组序列。在以六框翻译为基础的成百万计的所有可能肽序列中,我们只确认了一条包含43个氨基酸的以VVLCT为搜索标签的前体。这一结果满足RNP生物合成所要求的搜索标签位于一个小于100个氨基酸长的肽产物的C末端。接下来我们比较了预测的核心肽跟串联质谱中获得的物质的量,其中对于串联质谱的结果考虑到了PTMs,比如脱氢。22个氨基酸长的核心肽的计算物质的量跟预测的含有四个假定PTM脱氢的结果不一致,但是跟形成两个Dha和两个二硫键的AmfS一致。另外,预测的核心肽序列还能够在接下来跟串联质谱数据的对比中进一步确认。通过序列比对分析能够确认AmfS生物合成基因簇的其余部分的相邻基因可以进一步确定RNP化学型跟基因的联系。以基因簇的原件为基础,特别是AmfS的核心肽及其PTM的相关酶AmfSA和AmfSB,从已知RNP生物合成基因簇,我们可以确定这个分析的肽属于含羊毛硫氨酸的肽的家族Ⅲ。最后,依据已知的核心肽序列、串联质谱数据以及有关AmfS样的含羊毛硫氨酸肽的PTMs,我们确定了一个AmfS的结构。对AmfS及其基因簇的确定说明了NPP这种利用串联质谱数据和基因数据能够将PNP的化学型跟基因型相互联系起来。
8
图5. NPP鉴定核糖体肽AmfS流程
1.3.3 NPP确定非核糖体脂肽
对NPP的操作流程做一微调后可以用于发现NRPs。我们又将该方法用于由MADIL图像从灰色链霉菌ATCC 53653的一个菌落里面检测到的多个脂肽(图6)。串联质谱对SHY-1628的分析获得一个99-99-83-83-71-113-99-57-115的序列片段,因为高序列中的大多数物质偏转跟基本氨基酸相对应,开始是被置于RNP的工作流程得到V-V-83-83-A-I(L)-V-G的序列标签。我们用Dhb代替83-Da的物质,而Dhb的合成前体是苏氨酸。用搜索标签VVTTA(I)VG从灰色链霉菌的六框翻译中查询,在已经描述的RNPs中我们没有合适的前体肽。利用长的序列标签找寻前体肽的失效说明以SHY-1628为基础的肽被一系列的非核糖体肽所替代。为了验证这一猜测,我们修订了最初的序列标签使它包括NRP特异的非基本氨基酸来进行NRP的基因组挖掘。因此,这个83-Da的物质偏转可能对应于Dhb、NMe-Dha或者高丝氨酸内酯(HseL)。因为HseL通常是位于NRP的C末端,因此我们排除该物质。Dhb和NMe-Dha很可能是在NRP的组装过程或者组装后分别来源于苏氨酸和丝氨酸,这是因为假定的Dha和Dhb单体中的烯氨的不稳定性。此外,Dhb的物质偏转也可能是从MS气相诱导的从苏氨酸-大内酯跟NRP的C端切除一个开环后形成的。我们推测出VVT(S)T(S)A(L)VG这样一个序列标签而不是像NP.searcher和antiSMASH运算法则那样对NRP的预测要从基因组大重叠群中来预测NRPS基因簇和它们的NRP产物。这一分析结果得到的还原的、全长8个氨基酸的序列标签跟灰色链
9
霉菌基因组中5个预测的NRPS的一个候选NRP序列相匹配。通过反复的检验过程,我们发现对应的基因簇包含一个N末端的跟脂肽生物合成相关的酰基连接,这跟发现的14-Da的分离母离子(parent ions)具有脂肽特征完全一致。进一步的串联质谱以及核磁共振分析确认这个脂肽作为lipotetradecapeptides中涂链霉素抗生素家族的膜,包含一个其次跨膜的大内酯并且总共有七个修饰位点。除了来源于Streptomycetes endus的涂链霉素Ⅰ,我们还鉴定了5个新的涂链霉素类似物(Ⅱ-Ⅵ),它们在酰胺链以及5位和13位的缬氨酸或者异亮氨酸的取代物跟灰色链霉菌ATCC 53653中的原始结构均不同。已鉴定基因簇的生物合成特征跟NRPS的底物及修饰物中的涂链霉素Ⅰ的结构相匹配。因此,正如我们对RNPs的研究,串联质谱分析跟基因组挖掘方法也能够快速、准确地用于NRP化学型跟基因型的联系。例如,我们在涂链霉素Ⅰ的2级串联质谱中检测到一个低分辨率的115Da的物质偏转,并且首次鉴定为天冬氨酸。假定的涂链霉素NRPS相应模块取代了以前的NMe-苏氨酸,这样串联质谱的物质偏转就能够解释了。这个例子说明在NRP序列标签中,像基本氨基酸的N-甲基化甚至非基本氨基酸如果在第一个循环中不能够识别,还是可以通过进一步的分析得到序列标签。
我们还成功的通过NPP方法得到了许多其他的NRPS衍生物。最近,NPP甚至还能够在只有两个氨基酸序列标签的前提下成功的发现arylomycin。
图6. NPP确定非核糖体脂肽流程
1.3.4 NPP鉴定新的RNP化学型和基因型
利用NPP方法,研究人员还从测序的涂链霉素菌中发现了许多其它未鉴定的RNPs。从
10
七个涂链霉素菌株中,研究人员鉴定了许多未知的RNPs及其基因簇,其中第一个被鉴定的RNP及其基因簇是套索肽家族Ⅰ中一个命名为SSV-2083的肽物质。对SSV-2083的发现和分离主要借助了MALDI成像跟MALDI-TOF MS。串联质谱分析该未修饰化合物没有得到序列信息。之所以得不到结果,主要因为这些分子中含有二硫键或者生成硫醚连接。所以,研究人员就采用NaBH4及NiCl2脱硫处理后进行串联质谱分析。从除去限制的SSV-2083谱图中获得一个10个氨基酸长度的串联质谱序列标签,利用该标签研究人员鉴定了SSV-2083生物合成基因簇(图7)。
图7. 从7个链霉菌中鉴定新的RNP化学型和基因型
NPP的创新之处在于有效地将目的肽跟它们的基因簇联系起来,这种联系的建立主要以修饰肽的从头串联质谱序列标签搜索前体肽或者预测的NRPS产物,并进一步应用生物合成知识以及利用串联质谱和PNP基因组挖掘之间的多个步骤来确定化学型跟基因型的匹配。 总之,NPP是一个新的、以MS为基础的基因组挖掘平台用于指导核糖体肽和非核糖体肽的发现。这种方法能够从多个生物体中流线化的筛选肽的化学型并能方便的研究它们的分离、结构解析以及生物方面的性质和途径从而充分理解肽天然产物的生物学作用和治疗潜能。 1.4 基于反义RNA技术抗菌新模型筛选的天然活性物质的发现
细菌耐药性产生和新药退化的速度越来越快,使得寻找新型特异性靶标药物迫在眉睫。
11
自然界中微生物的多样性及其代谢产物的多样性,为发现新药以及先导化合物提供了不竭动力。但由于微生物次级代谢产物往往含量极低,采用常规抗生素的筛选模型,发现自然界中含量较低的新型药物变得越来越困难。因此,建立一个针对特定新靶标且灵敏度极高的全细胞筛选技术成为发现新型抗菌药物的关键。近年来,反义RNA技术在构建特异性靶标的超敏细胞新药筛选模型中的应用备受关注。
1.4.1 反义技术在建立抗菌药物新筛选模型中的应用
反义RNA是指与mRNA或DNA互补的小型单链RNA分子,其长度一般不到200bp。它是一种本身缺乏编码能力,但能与特异靶RNA(主要是mRNA)互补的RNA分子,可通过配对碱基间氢键作用与靶RNA的特定互补区域结合形成双链复合物,抑制靶RNA的功能,从而调控基因的正常表达。反义RNA广泛存在于各类生物中。反义RNA技术的基本原理是利用自然存在的或人工合成的反义RNA,通过基因重组技术反向插入到合适的表达载体形成重组DNA,然后转染受体细胞,则这一反向插人的序列就会随细胞周期产生大量反义RNA,对基因的表达进行调控,从而抑制、封闭或破坏靶基因的表达。选择具有明显的生物学效应的靶序列后,反义RNA即通过和相应的RNA互补而达到阻断其功能的目的(图8)。
12
图8 反义RNA作用机制
对于新型抗菌药物的研发而言,细菌必需基因的鉴定为发现大量新的抗菌药物靶点提供了可能,但并非所有的细菌必需基因都是理想的药物靶点。理想的药物靶点必须具备以下特征:(1)为细菌生长所必需,其抑制将导致细菌死亡(或者是毒性因子,其抑制可使细菌毒性丧失);(2)在多种细菌中存在,这有利于广谱抗菌药物的研发;(3)具有较高的特异性,其抑制剂对人体无毒或毒性较弱;(4)为了能够高效地进行药物筛选,最好能够建立体外的高通量筛选模型。
图9. 大肠杆菌脂肪酸合成途径
脂肪酸是细胞生物膜等的重要组成成分,故在生物体内,脂肪酸的合成是必须的。根据参与脂肪酸生物合成(FAS)酶的不同(图9),可以将脂肪酸的合成途径分为I型和Ⅱ型两种,I型脂肪酸合成途径存在于哺乳动物体内,而Ⅱ型脂肪酸合成途径存在于细菌和植物中的。I型脂肪酸合成途径中,参与脂肪酸合成反应的酶是由一条多肽链构成的,这条链包括了合成脂肪酸所需的所有催化活性中心;而在Ⅱ型脂肪酸合成途径中,每一步反应都有一个单独的酶催化,而且这些酶在不同种属的细菌中具有高度的专一性。但两类脂肪酸合成酶系总的序列同源性差异较大。正是因为Ⅱ型FAS酶在细菌中的广泛存在以及在活性位点组织结构上的差异,使得催化该途径的酶成为较为理想的靶点,进行抗菌药物的筛选。 1.4.2. ACP是抗菌模型中的重要新型靶标
目前,以 E.coli为模型的Ⅱ型脂肪酸合成途径已经得到了广泛的研究。FASⅡ主要包括7 种单功能酶:酰基载体蛋白(ACP) ,丙二酸单酰-CoA :ACP转酰酶(FabD), β-酮脂酰-ACP合成酶
13
(FabH ,FabB ,FabF), β-酮脂酰-ACP还原酶(FabG), 羟脂酰-ACP脱水酶(FabA/FabZ), 烯脂酰-ACP还原酶(FabI/Fab/FabL),以及酰基硫酯酶(PlsB)。参与细菌ACP(FAS II)在总的序列及蛋白三维结构上完全不同于哺乳动物的酶系(FAS I),且细菌和人体内的ACP在结构、组成和脂肪酸合成中的作用的显著不同,使ACP成为一种引人关注的的新型抗感染药物作用的靶点。下面对已报道的此途径中可以作为抗菌药物筛选靶点的几种酶进行简单介绍。 (1) β-酮脂酰-ACP还原酶(FabG)
FabG催化乙酰乙酰-S-ACP的还原。E.coli中FabG单体的分子质量为25.5 kD,在溶液中以四聚体的形式存在,NADP是其辅酶。E.coli FabG晶体结构的研究结果表明,FabG结合其辅酶NADP后引起FabG构象的变化,使3个与其催化活性有关的氨基酸(Serl38、Tyrl51、Lysl55)进入活性口袋,行使催化功能。目前尚未见以FabG为靶点的抑制剂研究的报道。 (2) 羟脂酰-ACP脱水酶(FabA/FabZ)
FabA/FabZ可以催化D-β-羟丁酰-S-ACP的脱水反应。它们是同功酶,FabA还具有异构酶的功能,参与不饱和脂肪酸的生物合成,而FabZ则不能。它们在氨基酸的一级序列上具有很高的相似性,但是生物信息学的研究表明它们属于不同的家族。
针对FabA和FabZ酶抑制剂的研究报道较少。有研究表明,3-癸炔酰-N-乙酰半胱胺(3-decynoyl-N-acetylcysteamine,NAS)可以抑制FabA的活性,它是关于FabA的一个典型的自杀性的抑制剂。最近以NAS为模板,合成了2个小分子化合物,分别命名为NAS-75和NAS-91,它们在分子水平具有抑制FabZ的活性,通过与酶的活性口袋附近的氨基酸残基相互作用与底物竞争活性中心,从而抑制酶活性。 (3) 烯脂酰-ACP还原酶(FabI/FabK/FabL)
目前,已发现了三种细菌烯脂酰-ACP还原酶(FabI、FabL和FabK),不同种属的细菌可能含有不同的烯脂酰-ACP还原酶,某些细菌中含有不止一种烯脂酰-ACP还原酶,大肠杆菌只含有一种烯脂酰-ACP还原酶(FabI),是一种必需酶。
FabI 是fabI 基因编码的还原型烟酰胺腺嘌呤二核苷酸(NADH) 或还原型烟酰胺腺嘌呤二核苷酸磷酸酯(NADPH) 依赖型单功能酶[5][5][5]。其催化机制是一个氢转移过程, FabI 将NADH中H 转移到烯酰基C-3 位上,底物经过重排形成烯醇化阴离子中间体,再得到一个质子形成还原产物。
应用高通量筛选技术在已有化合物库中对具有细菌FabI 抑制活性的化合物进行筛选,发
14
现了一些活性先导化合物,对其进行结构修饰确定相关的药效团,然后通过衍生化得到另一些具有FabI 抑制活性的新化合物,根据其结构大致可分为5 类:1,4-二取代咪唑类、2,9-二取代-1,2,3,4-四氢吡啶并[3,4-b]吲哚类、氨基吡啶类、吲哚萘啶酮类以及3-氰基-4,6-二取代-2-吡啶硫醚类。
目前以FabI为靶点的抑制剂有DBZ(diazaborines)、三氯生(triclosan)和异烟肼(isoniazid)等
[8]
。一直以来,三氯生被当作一种非特异性的、广谱的抗细菌和抗真菌杀虫剂,存在于包括肥
皂、漱口水、纺织品和塑料等消费品中。已知三氯生抗性常常与包括异烟肼(一线抗肺结核药物)在内的其他FabI抑制剂的抗性相伴。异烟肼对分支杆菌具有强烈的抑制作用,有研究表明,异烟肼对结核分枝杆菌Ⅱ型脂肪酸合成酶系中的多个组分均有影响。 (4) β-酮脂酰-ACP合成酶(FabB/FabF/FabH)
FabB/FabF催化丙二酸单酰-ACP形成乙酰乙酰-S-ACP反应,FabF具有与FabB相似的结构和催化机理,但是它们在对于不同底物的结合能力上存在很大的差别。FabH也是一个β-酮脂酰-ACP合成酶,它在起始反应阶段起着关键作用。目前以FabB/FabF为靶点的抑制剂有硫乳霉素(thiolactomycin,TLM)和浅蓝菌素(cerulenin,CER)。以FabH为靶点的抑制剂有TLM和SB418011,但CER却不能抑制FabH的活性。
默克公司汪俊研究组[9,10,11]以细菌脂肪酸合成过程中的关键酶FabH/FabF 为靶点建立的全细胞筛选方法。该研究组将FabH/FabF编码基因反向插入在木糖诱导的启动子下游,获得反义RNA表达载体,将其导入金黄色葡萄球菌内诱导表达。反义RNA分子能够有效降低靶基因的表达水平,因此从理论上讲,表达反义RNA分子的菌株对脂肪酸合成酶特异性抑制剂的敏感性增强,即为敏感菌。采用双平板敏感性差异实验,将敏感菌和携带空白载体的对照菌分别接种于两块平板,杯碟法测定抑菌圈大小。抑菌圈大小反映了样品抑菌活性高低,两块平板抑菌圈的差异则可以揭示样品作用的选择性高低,即如果所筛样品对敏感菌的抑制活性较强,而对携带空白载体的对照菌抑制活性较弱或没有抑制作用,则可以说明该天然产物为FabF/FabH抑制剂。该研究组采用这一方法筛选了几十万种天然产物发酵液,先后获得了全新活性化合物平板霉素和平板素(图10)。平板霉素的作用靶点为FabF,平板素是FabF和FabH的双重抑制剂,这两种化合物均具有新颖的化学骨架、良好的广谱抗革兰阳性菌活性,对多种重要的抗生素耐药菌株也具有活性,包括MRSA和VRE等,在体内实验中平板霉素和平板素也都显示出了良好的抗菌活性,非常有希望发展成为具有全新作用机制和化学结构的新型抗菌药物。
15
图10. 平板霉素(A)和平板霉素(B)的结构式
2 从不可培养的微生物中发现新化合物的技术-宏基因组学
从环境中分离微生物是一个令人惊异的来源。迫于生存竞争和环境压力形成的保卫性,攻击性和信号多样性进化,这些进化会产生化学和生物多样性和新药物产生的潜能。环境微生物,主要是放线菌,杆菌和丝状真菌,有产生次级代谢产物的巨大能力,并应用于新药开发。地球上的微生物细胞的总数估计为1030。原核生物占生物个体的比例最大,包括106至108个独立基因型群[12]。这些主要的还未开发物种的基因整套基因排列,为新型酶和代谢研究提供了很大的一个积蓄。宏基因组学省略掉了微生物的分离或培养的需要。宏基因组方法基于直接从环境样本中分离核酸,已被证明是一个非常强大的工具,它被用于比较和探索分析复杂环境微生物群落的生态代谢,以及利用由分离的核酸组成的总库来发现识别新型生物分子。随着新技术的发明和发展,使得我们更有信心从―非培养微生物‖中发现新的可成药物质。多学科方法结合不同技术可加速从非培养微生物进行新药发现的研究发生革命性的变革。 2.1宏基因组学方法作为从非培养微生物中发现新药的方法
大量未被利用的自然环境中非培养微生物基因组贮金库中,宏基因组在探索和开发做出了非常大的努力。这种方法 涉及直接从环境样品中提取总遗传物质,不需要培养。然后将遗传物质连接到载体上转移至新的宿主细胞,一般是E.coli,产生宏基因组库。之后这些文库可通过DNA序列研究结构和功能的多样性,或者基于序列钓取或功能表达发现新产物。然而,非常重要的是用于宏基因组研究的样品必须定向的采取于特殊的地方,从而增加成功率。因为同这种方法发现代谢产物直接依赖于样品中存在的微生物。例如,如果目标是抗肿瘤药物,那么应该选择海洋系统中的宏基因组,因为陆地样品显示非常低的抗肿瘤潜能(0.01%),而海洋样品1%。相似的,如果意向解毒剂,那么应该从有毒的地方选择样品来增加命中率[13]。 2.2环境基因组提取
未被切断的高质量DNA是必须的,这要求不能用过于激烈的方法如玻璃珠。最好是高分子量DNA,因为编码抗生素或其他工业感兴趣化合物的生物合成基因簇大小通常在30-100kb。
16
有两种常用方法:1)是反复冻融直接裂解环境样品[14]。2)是间接法,在裂解之前先将微生物细胞分离出来[15]。直接法使用更为广泛,因为它可以更快速高效,并且能够得到更多DNA产量。但是,这种方法提取的总DNA不能区分细菌、古细菌、真和生物来源的DNA,过多的信息会降低筛选效率。另外对不希望的化合物的共提取,如腐殖质,会导致下游进程的受抑制。对裂解产物的纯化可能导致DNA的产量下降。另一种选择是间接裂解法。这种方法中,细菌细胞从环境混合物中分离,然后再进行裂解。虽然这种方法耗时较长,但是可以避免干扰性污染物如腐殖质,并且能够增加后续筛选的效率。进一步的问题是,总DNA的提取会导致某优势基因的过表达。这可以通过采用CsCl2密度梯度离心通过DNA中GC含量的不同来分离基因组,DNA解离方法,差减杂交来克服[16]。 2.3构建宏基因组DNA文库
可用来构建文库的载体:小片段0.5-5kbp,质粒。>35kbp,cosmid or fosmid (都允许插入35-45kbp)vector 或者 BAC载体(100kbp)。 Cosmid和BAC最常用;但是当插入原核或真核片段时cosmid文库不稳定,fosmid更好。 2.4 宏基因组文库的表达载体
遗传操作容易,工业发酵使用广泛,E.coli 通常作为表达载体宿主细胞。在Ecoli中已经成功的:羟基丁酸的利用,羰基产生和抗生素产生。但是也有局限性:当高GC含量的片段对扰乱含低GC宿主的转录,如抗生素的产生。插入片段和表达宿主的GC含量要相近更容易成功表达。其他可选择的宿主为链霉菌Streptomyces spp., 假单孢菌Pseudomonas spp. and 杆菌Bacillus spp. 链霉菌适合:检测次级代谢产物因为链霉菌基因组中富含GC。缺点是生长较慢,这可能会影响其工业效率。 2.5宏基因组文库筛选 2.5.1基于序列的筛选
以基因序列为基础方法,是根据已知的基因或蛋白质家族的保守区域设计DNA探针或引物来实现的。通过这种方式,只能识别那些功能已知的蛋白的新变异体。然而这一方法可以成功的鉴定那些编码新型酶的基因,例如二甲基巯基丙酸降解酶[17],双加氧酶[18,19],亚硝酸盐还原酶[20]等。
(1)基于序列的筛选-PCR
Bartossek等人[20]使用PCR的方法,通过对来自不同的环境的样品,如土壤,沉积物,淡
17
水,鸡粪和无脊椎动物进行研究,在氨氧化古细菌中检测到了编码依赖铜的亚硝酸盐还原酶(NirK)的同源基因。根据对细菌NirK蛋白质的氨基酸序列的推断和两个同源古细菌,为古细菌nirK相关基因的扩增设计出了两套不同的简并引物。通过这个途径,作者证明了古亚硝酸盐还原酶无处不在,为促进全球生物地球化学氮循环作出贡献。为了分析在土壤动力学中TFDA类基因编码的除草剂降解的双加氧酶的多样性和丰富性,Zaprasis等人设计了定量PCR检测方法[19]。共分析了437 tfdA类似序列,分别采用5对不同的引物,从而有针对性的确定保守tfdA区域。计算得出每克干土中约有1.0×106至65×106份tfdA类似基因的拷贝。这表明在土壤中存在着未知的会降解双加氧酶除草剂。 (2) 基于序列的筛选-基因靶向宏基因组学
为了对兴趣基因的序列空间获得更全面的了解,采用了PCR为基础的筛查方法,并结合大规模的扩增产物的焦磷酸测序方法。随后可以利用已收集的序列信息设计适合的探针来获得靶基因的全长。这个方法是由Iwai等人[21]介绍的。作者称它为基因靶向宏基因组学(GT - 宏基因组学)。这是适用于从多氯联苯污染的土壤样品中获得编码芳香双加氧酶的基因。作者利用一对针对524 bp的保守区域的PCR引物,来赋予底物对联苯双加氧酶的特异性。总计分别回收了PCR产物5`和3`端的2000和604个序列。根据队列,序列被分配到225`端),3(3`端)新的聚簇,不包括以前已知的序列。因此,可以参与碳循环的基因的丰富性不再是假设。为了评估细菌的多样性,即与β 二甲基巯基丙酸内盐去甲基化有关的基因研究,在海洋环境中类似的方法已应用。 Varaljay等人[17]通过利用针对10个不同DmdA的类型和亚类型的引物,对不同的自由生活的沿海浮游细菌的复合DNA进行扩增,获得编码β 二甲基巯基丙酸内盐脱甲基的dmdA基因。随后,对焦磷酸序列的PCR产物进行了测序。随着 90%的核苷酸序列的鉴定,约62,000序列被分配到700多个环境中基因dmdA序列的聚簇。 (3) 基于功能的筛选
大多数编码新型生物分子的新基因分离筛选的工作都是基于宏基因组库中克隆的代谢活性。由于不需要序列信息,这是唯一的策略,它蕴藏着可以识别到完整的拥有已知或全新功能的基因。 三种不同的功能的方法已用于探索新型生物分子:预期活性的表型检测,异源互补的宿主菌或突变体,以及基因的诱导表达。
i. 预期活性的表型检测
在大多数情况下,表型检测采用化学染料、不溶的或生色团衍生物的酶反应底物纳入到
18
生长介基质中,负责单一克隆特定的代谢功能。近期的一个研究案例中,依靠活性筛选编码细菌的β-D-葡萄糖醛酸酶的目的基因,β-D-葡萄糖醛酸酶是人体肠道微生物的一部分。这些酶是公认的对人类身体健康是有利的[22]。一个包括有4600个克隆的宏基因组,是从来自粪便池的细菌DNA进行筛选,即利用缺乏β-D-葡萄糖醛酸酶的大肠杆菌菌株进行的筛选。通过这种方式,获得的19个阳性克隆,在被克隆到相应的基因表达载体后,表现出很强的β-D-葡萄糖醛酸酶的活性[22]。另一个研究案例,利用基于活性的筛选,直接对表型检测,已经由Beloqui等发表[23]。为了发现新的糖基水解酶,大肠杆菌克隆拥有的宏基因组fosmid库,是从依赖消耗纤维素的微生物群落(蚯蚓的新鲜脱落物)得到的,用于检测它们水解P -硝基苯基- D -葡萄糖苷和P -硝基苯基- L-吡喃阿拉伯糖苷的能力。其中发现的两种糖基水解酶与已知的糖基水解酶没有任何的相似性,代表了两个新的家族即β-半乳糖苷酶/ 吡喃阿拉伯糖苷酶。
ii. 异源互补的宿主菌或突变体
与功能性筛选的不同之处是基于异源互补的宿主菌或突变型宿主菌,在有选择性条件下,这类突变型宿主需要目标基因才能生长。这种技术可以简单而快速的筛选复杂的数以百万计的克隆宏基因组库。由于几乎没有误报的发生,这种做法对目的基因[24]具有高度选择性的。近期的研究表明,以互补为基础的446000克隆的筛选,它们包括土壤衍生的宏基因组文库的基因,赋予了抵抗四环素-内酰胺类或氨基糖苷类抗生素的抗性,从而发现了13种不同的抗生素耐药性克隆[25]。更多类似的研究,如用人异源互补的筛选包括:鉴定基因编码的赖氨酸消旋酶[26],抗生素抗性[27],参与聚3 - 羟基丁代谢的酶[28]等。 iii. 基于活性的筛选
a. 底物诱导的基因表达筛选(SIGEX)
2005年,Uchiyama等人[29]引入了第三种基于活性的筛选,这被称为底物诱导的基因表达筛选(SIGEX)。这种高通量筛查方法采用一个操纵子陷阱GFP的表达载体与荧光激活细胞分选相结合。筛选是基于代谢基因的表达,它主要是由特异性底物诱导,往往受靠近代谢基因的调控元件所控制。要执行SIGEX,将绿色荧光蛋白基因克隆在宏基因组DNA上游,从而将GFP表达受控于存在于宏基因组DNA中的启动子(图11)。
19
图11. 底物诱导的基因表达筛选(SIGEX)过程
b. 利用指定代谢物调节的表达(METREX)
Williamson 等人发表的一种类似的筛选类型,利用指定代谢物调节(METREX)的表达
[30]
。为了找出生产小分子的宏基因组克隆,生物传感器(图12)存在于同一个细胞中,如同
拥有一个宏基因组DNA片段的载体,它可以检测小的扩散性的信号分子,这些信号分子诱发群体感应。生物传感器的主要组件是一个群体感应子,它可以控制报告基因GFP。当由宏基因组DNA片段编码的信号分子的阈浓度值超标,绿色荧光蛋白(GFP)就产生了。随后,通过
荧光显微镜就可以鉴定阳性克隆。
20
sensitivity strategy[J]. J Am Chem Soc, 2006, 128(36):11916-11920. [12].
Sleator, R. D., C. Shortall, C. Hill. Metagenomics[J]. Lett. Appl. Microbiol.
2008,47:361–366.
[13]. Singh, B.K. Organophosphorus degrading bacteria: ecology and industrial application[J]. Nat.
Rev. Microbiol. 2009,7, 156–164.
[14]. Zhou, J. et al. DNA recovery from soils of diverse composition. Appl. Environ. Microbiol.
1996, 62, 316–322.
[15]. Courtois, S. et al. Quantification of bacterial subgroups in soil: comparison of DNA extracted
directly from soil or from cells previously released by density gradient centrifugation. Environ. Microbiol. 2001,3, 431–439
[16]. Cowan, D. et al. Metagenomics gene discovery: past present and future. Trends Biotechnol.
2005, 23, 321–329
[17]. Varaljay, V. A., E. C. Howard, S. Sun, and M. A. Moran. Deep sequencing of a dimethyl
sulfoniopropionate -degrading gene (dmdA) by using PCR primer pairs designed on the basis of marine metagenomic data. Appl. Environ. Microbiol. 2010,76:609–617.
[18]. Sul, W. J., et al. DNA-stable isotope probing integrated with metagenomics for retrieval of
biphenyl dioxygenase genes from poly- chlorinated biphenyl-contaminated river sediment. Appl. Environ. Mi- crobiol. 2009,75:5501–5506.
[19]. Zaprasis, A., Y. J. Liu, S. J. Liu, H. L. Drake, M. A. Horn. Abundance of novel and diverse
tfdA-like genes, encoding putative phe- noxyalkanoic acid herbicide-degrading dioxygenases, in soil. Appl. Environ. Microbiol. 2010,76:119–128.
[20]. Bartossek, R., G. W. Nicol, A. Lanzen, H. P. Klenk, C. Schleper. Homologues of nitrite
reductases in ammonia-oxidizing archaea: diversity and genomic context. Environ. Microbiol. 2010,12:1075–1088.
[21]. Iwai, S., et al. Gene-targeted-metagenomics reveals extensive diver- sity of aromatic
dioxygenase genes in the environment. ISME J. 2010,4:279–285.
26
[22]. Gloux, K., et al. Microbes and Health Sackler Colloquium: a meta- genomic β-glucuronidase
uncovers a core adaptive function of the human intestinal microbiome. Proc. Natl. Acad. Sci. U. S. A. 2010. doi:10.1073/ pnas.1000066107.
[23]. Beloqui, A., et al. Diversity of glycosyl hydrolases from cellulose- depleting communities
enriched from casts of two earthworm species. Appl. Environ. Microbiol. 2010,76:5934–5946. [24]. Simon, C., J. Herath, S. Rockstroh, R. Daniel. Rapid identification of genes encoding DNA
polymerases by function-based screening of metagenomic libraries derived from glacial ice. Appl. Environ. Microbiol. 2009,75:2964–2968.
[25]. Donato, J. J., et al. Metagenomic analysis of apple orchard soil reveals antibiotic resistance
genes encoding predicted bifunctional proteins. Appl. Environ. Microbiol. 2010,76:4396–4401. [26]. Chen, I. C., V. Thiruvengadam, W. D. Lin, H. H. Chang, and W. H. Hsu. Lysine racemase: a
novel non-antibiotic selectable marker for plant transformation. Plant Mol. Biol. 2010,72:153–169.
[27]. Denef, V. J., et al. Proteomics-inferred genome typing (PIGT) dem- onstrates inter-population
recombination as a strategy for environmental adaptation. Environ. Microbiol. 2009,11:313–325.
[28]. Wang, C., et al. Isolation of poly-3-hydroxybutyrate metabolism genes from complex microbial
communities by phenotypic complementation of bacterial mutants. Appl. Environ. Microbiol. 2006,72:384–391.
[29]. Uchiyama, T., T. Abe, T. Ikemura, K. Watanabe. Substrate- induced gene-expression screening
of environmental metagenome libraries for isolation of catabolic genes. Nat. Biotechnol. 2005,23:88–93.
[30]. Williamson, L. L., et al. Intracellular screen to identify metagenomic clones that induce or
inhibit a quorum-sensing biosensor. Appl. Environ. Microbiol. 2005,71:6335–6344.
[31]. Uchiyama, T., and K. Miyazaki. Product-induced gene expression (PIGEX): a product-
responsive reporter assay for enzyme screen- ing of metagenomic libraries. Appl. Environ. Microbiol. 2010, doi:10.1128/ AEM.00464-10.
27
[32]. Kalyuzhnaya, M.G. et al. High resolution metagenomics targets specific functional types in
complex microbial communities. Nat. Biotechnol. 2008, 26, 1029–1034.
[33]. Beloqui, A. et al. Reactome array: forging a link between metabolome and genome.
Science,2009, 326, 252–257.
28