的明确定义非常重要,应在方案中进行详细描述。
2.1 TTP和PFS
与TTP相比,PFS是更常选用的替代终点。因为PFS包括死亡,更好地反映了受试药物的毒副作用,因此与总生存期有更好的相关性。在对TTP的分析中,无论是在死亡时还是相对较早的随访期间,死亡均被删失(试验中的非随机脱落)。PFS可假设患者的死亡与肿瘤进展有着随机的联系。然而,当大多数死亡与癌症不相关的情况下,TTP也可以是一个合适的终点指标。
2.2 PFS作为支持药物审批的终点
上表列出了用PFS作为支持抗癌药物审批终点的优点和缺点。PFS反映了肿瘤的生长,又可以在证实生存期获益之前进行评价。不会受到后续治疗的混淆。对于预定的样本量,PFS受到的影响可大于总生存期受到的影响。然而对于许多不同种类的恶性肿瘤来说,正式确认PFS作为生存期的替代终点是比较困难的。通常没有足够的数据对生存期和PFS的相关性进行评价。抗肿瘤药物临床试验规模通常较小,已有药物的生存获益通常比较小。在不同的抗肿瘤治疗试验中,用于支持审批的PFS终点所起的作用是不同的。无进展生存期的延长是否直接代表临床获益或仅是临床获益的替代终点,取决于这种新治疗方法的疗效大小以及与现有治疗相比的风险-效益比。
2.3 PFS试验设计问题
在试验方案和统计分析计划(SAP)中应详细描述评价、测量和分析PFS的方法学。同样,在试验方案中仔细对肿瘤进展标准进行定义也很重要。现在还没有法定标准对肿瘤进展作出定义,申请人可能使用不
11
同的标准,包括RECIST标准。除了公认的PFS标准中列出的大纲,试验方案和统计分析计划应增加其他细节。在两个试验组中,随访和影像学评价必须是均衡的,以避免系统偏倚。研究应尽量采用盲法。如果将患者或研究者评价作为进展终点的一个因素,则设盲显得尤其重要。至少,应由处于盲态的独立裁定小组(independent adjudication team,一般包括影像学家和临床医师)进行评价。SFDA和申请人应在以下方面提前达成一致意见: ● 研究设计; ● 疾病进展的定义; ● 记录在CRF表上的数据; ● 统计分析计划(SAP);
● 缺失数据的处理办法和数据删失办法;
● 如适用,独立终点审核委员会(IRC)的操作规程(见附件4)。
2.4 PFS的分析
由于有数据缺失等现象,PFS的分析变得比较困难。试验方案中应针对每位患者对“一个充分的评价随访(即,在此次随访中完成了所有约定的肿瘤评价)”给予定义。分析计划应总结比较各治疗组的随访充分性。方案应详细说明如何分析不完整和/或缺失的随访数据,以及数据删失的方法。分析计划应明确说明主要分析,以及一个或多个敏感性分析,以评价结果的可靠性。虽然所有含缺失数据的分析都存在一定问题,但只要敏感性分析和主要分析都支持结论,那么结果就是正确的。评价中应该包括长期失访患者的死亡人数。这类死亡会造成高估了随访较少的组的PFS,从而导致PFS的测定产生偏倚。
12
由于可以从多个时间、多种来源获得病情进展数据(包含计划外随访的身体检查和各种类型的影像学扫描),因此每次评价随访进行的数据收集有必要在随访前后限定的较短时间内进行。在较长时间内收集数据时,难以确定事件日期和删失日期。建议:如果之前不存在缺失的评价,将最早观察到病情进展的时间标记为进展日期,并将确定无进展的末次影像学评价日期确定为截止日期。附件3提供了一套主要分析或敏感性分析中可用于PFS的表格,建议在Ⅱ期临床试验结束后与SFDA讨论PFS数据的收集和分析计划,在专门的方案评估中进行核实。
3.客观缓解率
客观缓解率(ORR)是指肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例。缓解期通常是指从开始出现疗效直至证实出现肿瘤进展的这段时间。一般定义客观缓解率为完全缓解加上部分缓解之和。客观缓解率是一种直接衡量药物抗肿瘤活性的指标,可以在单臂试验中进行评价。疾病稳定不应该是客观缓解率的组成部分。疾病稳定可以反映疾病的自然进程,而肿瘤缩小则是直接疗效。同样,疾病稳定可通过TTP或PFS分析进行更精确的评价。如果可能,应采用标准化的指标以确定疗效,如RECIST标准。缓解标准应在试验开始前的方案中提前定义。客观缓解率的评估包括缓解程度、缓解持续时间以及完全缓解率(没有可测量到的肿瘤)。
4.治疗失败时间
治疗失败时间(TTF)是一个复合的终点指标,即从随机化开始到无论何种原因(包括疾病进展、治疗毒性和死亡)导致治疗终止之间的时间。一个合理的支持审批的终点指标应当能清楚地将有效性和药物毒
13
性、患者或医师退出、或患者不耐受区分开,TTF不能将有效性与其他变量进行充分区分。因此,不建议将TTF作为支持药物批准的终点。 (三)基于症状评估的临床试验终点
症状和体征的改善通常被认为是临床受益,如体重的增加、疼痛的减轻或止痛药用量减少等。主要可用于盲法、多数患者有症状、无有效治疗药物和较少做影像评估的试验的疗效评价指标。在非盲法试验中则容易受到主观因素的影响,导致结果偏倚。当以症状和体征的改善作为支持抗肿瘤药物审批的主要终点时,应当能够区分是肿瘤相关症状的改善还是药物毒性的减小或缺失。
患者自评结果(Patient Reported Outcome ,PRO)是直接来自患者的关于其健康状况的报告,而非来自临床医生或其他任何人,可作为反映症状获益的恰当评价方法。但有一定局限性,研究者和受试患者报告中可能存在很大差别,问卷信息收集的时间点也会有影响,语言因素也会导致不能准确评估。生活质量评分(Quality of Life, QOL)也可以用来评估与健康相关的生活质量。但应当注意,以QOL来衡量药物的结果可能只能说明某种药物相对其他药物来说毒性较小,但并非其有效性更好。
设计适宜的详细的评估量表是准确评估药物作用的基础,不应仅仅提供“出现或未出现”这样的数据。用于抗肿瘤药物临床试验效果评价的量表必须经信度(reliabitlity)和效度(validity)分析,且是学术界认可的。量表中各项目的评价应尽可能采用定量或等级来反映观察项目变化的程度,应尽可能避免采用“是或否”、“出现或未出现”这样的二分类数据。
14
由于毒性或肿瘤进展而终止对受试者的评价,导致数据丢失,这种情况在抗肿瘤药物临床试验中较为常见。数据的丢失会导致评价的困难。因此,在试验方案中应有相应的措施尽可能避免或减少数据的缺失。
1.特定症状终点
与“疾病进展时间(TTP)”相似,“癌症症状进展时间(Time to progression of cancer symptoms)”是临床获益的直接测量指标而不是替代终点。如上文所述,疾病进展测量中存在的问题(例如评估缺失)同样存在于“症状进展时间”的评估中。在非盲的试验中可能导致评价偏倚。其次,肿瘤的发展和肿瘤相关症状开始之间会出现间隔。往往在达到症状终点前,治疗就进行了调整,从而混淆了分析结果。此外,许多抗肿瘤药物的试验中采用的是肿瘤相关症状很轻的患者。而且很难将肿瘤相关症状和药物毒性区分开。
复合症状终点的中的某一症状指标应当具有相似的临床重要性,并且
其结果不应当仅仅归因于一个指标。例如,基于复合终点批准用于治疗肿瘤骨转移患者的药物,与骨骼相关的事件被定义为病理性骨折、骨放射治疗、骨外科手术和脊髓压迫。
选择恰当的研究人群是证明症状方面获益的关键。对于在研究基线时即有症状的患者,可利用分类的症状缓解分析评价。对于在基线时无症状的患者,应分析“首次发生症状的时间”。即使患者终止使用研究药物或开始使用一种新药,如果随访持续到首次出现症状,仍可评价症状的进展。
2.症状数据面临的问题
数据缺失以及评价不充分可能使症状数据的评价更复杂,特别是对于开放性研究而言。因药物毒性或肿瘤进展而退出研究是症状数据丢失
15