新药信息版在讨论Avastin乳癌适应证的问题(详见http://xdrug.dxy.cn/bbs/topic/20454372?tpg=1&age=0)
佩服美国大佬能挑战PFS能否作为生存期的surrogate。
由此我想到了一个更大的问题:
Surrogate广泛用于临床研究,代替clinical outcome作为研究的endpoint,甚至是primary endpoint。
Surrogate不仅能缩短研究时间,还可以提高检测的灵敏度、减少研究的样本量。
由PFS和生存期的关系延伸开去,当我们使用surrogate作为primary endpoint的时候,对于margin的要求是多少?当不同arm的检测到的surrogate结果的差异达到多大的时候,我们能相信,clinical outcome会是有差异的,而且这种差异确实存在的可能性很大(即不是by chance的)?或者简单的说,两个arm的surrogate结果的差异是10或者5的时候,clinical outcome有差异的可能性是一样的吗?
这个问题,似乎还从来没有什么人去讨论过?
在今后用surrogate作为主要终点的时候,是否首先要明确一个能够体现出clinical outcome差异的margin?
如果要定义一个足够大的margin,确保clinical outcome有差异,那surrogate的advantage是否会在很大程度上丧失呢?如果不定义一个足够大的margin,保持surrogate的advantage,那以后在pivotal研究中,还能使用surrogate吗?类似此次Avastin的问题,还会出现吗?
假设如果以clinical outcome作为主要终点的话,可接受的margin是Delta-C
如果以Surrogate作为主要终点的话,设定的margin是Delta-S
如果Delta-S不能反映Delta-C,则:
1、替代终点本身只是clinical outcome的在一定情况下的alternative,换言之,大家还是希望药物最后能在clinical outcome上有Delta-C的margin,则Delta-S不能反映-Delta-C就有违这一期望;如果是IIb使用surrogate,总是希望其结果能够启示,如果在3期中使用clinical outcome,成功的把握大否?如果无关,则如何预估3期成功的可能性?
2、如果Delta-S能反映-Dealta-C,那为什么不直接使用Delta-C,如果实在是impractical,不能在临床研究中使用clinical outcome也就罢了(但这样,如何分析Delta-S和Delta-C的关系,流行病学可以吗?),如果在临床研究中可以使用clinical outcome,则在此种情况下使用delta-S和使用DELTA-C对于研究在样本量、研究时间等方面造成的差异有多少?还有必要使用Delta-S吗?
看来,我的问题,ICH-E9已经提出来了,只是没有提供明确的解决方法。
我从Avastin的帖子跟到这里,很高兴与楼主这样喜欢思考的人交流。
软指标与硬终点的关联,具体到千差万别的各种疾病上各种指标上,难以一言蔽之,临床试验中不外乎以下几种情况:
1. 软指标改善了,硬终点也改善了,没话说,皆大欢喜,就等FDA敲章。说到多大的改善幅度才有临床意义,厄洛替尼联合吉西他滨一线治疗胰腺癌,与吉西他滨单药比起来中位PFS延长了6天,OS延长了10天,可愣都是P<0.05,结果厄洛替尼一线治胰腺癌(联合吉西他滨)的适应证居然被FDA批准了!
2. 软指标改善了,但硬终点没改善。以我关注较多的肿瘤领域来说,PFS/DFS是常用的软指标,OS可以近似看作各线治疗PFS之和+最后BSC的时间,PFS/DFS延长而OS没延长很常见,除样本量因素以外原因可能是:组间后续治疗的不平衡导致后续治疗阶段的PFS反向变化,抵消了当前研究阶段的PFS改善(例如某药一线治疗的PFS比对照显著延长了2个月,但因为一线用过该药,导致在二线治疗中更有效的某交叉耐药药物使用率降低了,不得不使用疗效弱一些的非交叉耐药药物,结果二线治疗的PFS比对照短了2个月,OS没变);PFS/DFS优势被后续治疗或随访的时间所稀释(见我在Avastin治MBC贴中的解释,又如Avastin用于结直肠癌辅助治疗的NSABP C-08研究,术后化疗加A一年或不加,第一年的DFS A组显著占优,第3年DFS差异就不显著了,OS更是如此);实验组优势药物耐药后的肿瘤接受后续治疗的效果更差(例如某药一线治疗可更久地维持病情,但一旦肿瘤进展了对其他药物也不敏感了,或是增加脑转移的几率)等等。
对于糖尿病、心血管疾病、肝病等,软指标往往与硬终点的单位不一致(例如HbA1c数值、LDL-c与心血管事件发生率和死亡率、病毒载量与终末期肝病发生率),不能用PFS和OS之间此消彼长的关系说明,如果软指标改善而硬终点不变甚至更差,首先要从安全性方面找原因(如罗格列酮降糖有效,但增加心梗、心衰发生率),其次要思考软硬终点之间的因果关系和疾病的内在机制,一个重要的医学命题是,去除导致某病的原因,或是让该病导致的异常指标恢复正常,不必然(虽然有时)能治疗该病,例如改善缺血可能引起再灌注损伤,加重缺血区的损害。
3. 软指标没改善,硬指标却改善了,比较罕见,但也有例子:FLEX研究中肺癌一线化疗联合西妥昔单抗比单用化疗显著延长了OS 1.2个月,但一线PFS没延长,原因PI解释过,我记不清了,囧。
4. 软硬指标都没改善,也不用说,等着被毙掉吧。
楼主有兴趣可以进一步深入探讨,最好具体到某种疾病,否则病与病、指标与指标之间差异太大了。
非常感谢回复。
从临床研究的角度,hard/soft指标,可能指的是客观性的强弱,而非是否clinical outcome。最hard的当然是生与死,最soft的,可能是PRO(patient reported outcome),仅为我从某些书本上得来的知识。
其次,替代指标(surrogate)的问题:
1、是否是valid的surrogate,这个是疾病特异性、乃至药物特异性的,有很多标准,例如处于疾病发生发展~最后clinical outcome的唯一通路上(不然不能反应clinical outcome的最终变化),受治疗药物和对照药物作用的影响而变化(和药物作用无关的话,无法体现治疗药物或对照药物的效果,继而不能用于比较疗效),认为其变化可以反映clinical outcome的变化。虽然抽象,但据我所知,真正可以视为valid的surrogate不多,大多数临床研究所使用的“surrogate”尚有争议。
2、两全的难题:评估一个药物,势必结合疗效和安全性。但是临床研究,几乎不可能将这两个都列为primary endpoint。而我们知道,临床研究设计上,secondary endpoint更多是exploratory的,研究设计往往会首先满足/照顾primary endpoint。但在临床实践应用中,必定是通盘考虑这两者。surrogate往往是体现疗效的,而非安全性。 2 1 2 下一页 尾页
佩服美国大佬能挑战PFS能否作为生存期的surrogate。
由此我想到了一个更大的问题:
Surrogate广泛用于临床研究,代替clinical outcome作为研究的endpoint,甚至是primary endpoint。
Surrogate不仅能缩短研究时间,还可以提高检测的灵敏度、减少研究的样本量。
由PFS和生存期的关系延伸开去,当我们使用surrogate作为primary endpoint的时候,对于margin的要求是多少?当不同arm的检测到的surrogate结果的差异达到多大的时候,我们能相信,clinical outcome会是有差异的,而且这种差异确实存在的可能性很大(即不是by chance的)?或者简单的说,两个arm的surrogate结果的差异是10或者5的时候,clinical outcome有差异的可能性是一样的吗?
这个问题,似乎还从来没有什么人去讨论过?
在今后用surrogate作为主要终点的时候,是否首先要明确一个能够体现出clinical outcome差异的margin?
如果要定义一个足够大的margin,确保clinical outcome有差异,那surrogate的advantage是否会在很大程度上丧失呢?如果不定义一个足够大的margin,保持surrogate的advantage,那以后在pivotal研究中,还能使用surrogate吗?类似此次Avastin的问题,还会出现吗?
假设如果以clinical outcome作为主要终点的话,可接受的margin是Delta-C
如果以Surrogate作为主要终点的话,设定的margin是Delta-S
如果Delta-S不能反映Delta-C,则:
1、替代终点本身只是clinical outcome的在一定情况下的alternative,换言之,大家还是希望药物最后能在clinical outcome上有Delta-C的margin,则Delta-S不能反映-Delta-C就有违这一期望;如果是IIb使用surrogate,总是希望其结果能够启示,如果在3期中使用clinical outcome,成功的把握大否?如果无关,则如何预估3期成功的可能性?
2、如果Delta-S能反映-Dealta-C,那为什么不直接使用Delta-C,如果实在是impractical,不能在临床研究中使用clinical outcome也就罢了(但这样,如何分析Delta-S和Delta-C的关系,流行病学可以吗?),如果在临床研究中可以使用clinical outcome,则在此种情况下使用delta-S和使用DELTA-C对于研究在样本量、研究时间等方面造成的差异有多少?还有必要使用Delta-S吗?
看来,我的问题,ICH-E9已经提出来了,只是没有提供明确的解决方法。
我从Avastin的帖子跟到这里,很高兴与楼主这样喜欢思考的人交流。
软指标与硬终点的关联,具体到千差万别的各种疾病上各种指标上,难以一言蔽之,临床试验中不外乎以下几种情况:
1. 软指标改善了,硬终点也改善了,没话说,皆大欢喜,就等FDA敲章。说到多大的改善幅度才有临床意义,厄洛替尼联合吉西他滨一线治疗胰腺癌,与吉西他滨单药比起来中位PFS延长了6天,OS延长了10天,可愣都是P<0.05,结果厄洛替尼一线治胰腺癌(联合吉西他滨)的适应证居然被FDA批准了!
2. 软指标改善了,但硬终点没改善。以我关注较多的肿瘤领域来说,PFS/DFS是常用的软指标,OS可以近似看作各线治疗PFS之和+最后BSC的时间,PFS/DFS延长而OS没延长很常见,除样本量因素以外原因可能是:组间后续治疗的不平衡导致后续治疗阶段的PFS反向变化,抵消了当前研究阶段的PFS改善(例如某药一线治疗的PFS比对照显著延长了2个月,但因为一线用过该药,导致在二线治疗中更有效的某交叉耐药药物使用率降低了,不得不使用疗效弱一些的非交叉耐药药物,结果二线治疗的PFS比对照短了2个月,OS没变);PFS/DFS优势被后续治疗或随访的时间所稀释(见我在Avastin治MBC贴中的解释,又如Avastin用于结直肠癌辅助治疗的NSABP C-08研究,术后化疗加A一年或不加,第一年的DFS A组显著占优,第3年DFS差异就不显著了,OS更是如此);实验组优势药物耐药后的肿瘤接受后续治疗的效果更差(例如某药一线治疗可更久地维持病情,但一旦肿瘤进展了对其他药物也不敏感了,或是增加脑转移的几率)等等。
对于糖尿病、心血管疾病、肝病等,软指标往往与硬终点的单位不一致(例如HbA1c数值、LDL-c与心血管事件发生率和死亡率、病毒载量与终末期肝病发生率),不能用PFS和OS之间此消彼长的关系说明,如果软指标改善而硬终点不变甚至更差,首先要从安全性方面找原因(如罗格列酮降糖有效,但增加心梗、心衰发生率),其次要思考软硬终点之间的因果关系和疾病的内在机制,一个重要的医学命题是,去除导致某病的原因,或是让该病导致的异常指标恢复正常,不必然(虽然有时)能治疗该病,例如改善缺血可能引起再灌注损伤,加重缺血区的损害。
3. 软指标没改善,硬指标却改善了,比较罕见,但也有例子:FLEX研究中肺癌一线化疗联合西妥昔单抗比单用化疗显著延长了OS 1.2个月,但一线PFS没延长,原因PI解释过,我记不清了,囧。
4. 软硬指标都没改善,也不用说,等着被毙掉吧。
楼主有兴趣可以进一步深入探讨,最好具体到某种疾病,否则病与病、指标与指标之间差异太大了。
非常感谢回复。
从临床研究的角度,hard/soft指标,可能指的是客观性的强弱,而非是否clinical outcome。最hard的当然是生与死,最soft的,可能是PRO(patient reported outcome),仅为我从某些书本上得来的知识。
其次,替代指标(surrogate)的问题:
1、是否是valid的surrogate,这个是疾病特异性、乃至药物特异性的,有很多标准,例如处于疾病发生发展~最后clinical outcome的唯一通路上(不然不能反应clinical outcome的最终变化),受治疗药物和对照药物作用的影响而变化(和药物作用无关的话,无法体现治疗药物或对照药物的效果,继而不能用于比较疗效),认为其变化可以反映clinical outcome的变化。虽然抽象,但据我所知,真正可以视为valid的surrogate不多,大多数临床研究所使用的“surrogate”尚有争议。
2、两全的难题:评估一个药物,势必结合疗效和安全性。但是临床研究,几乎不可能将这两个都列为primary endpoint。而我们知道,临床研究设计上,secondary endpoint更多是exploratory的,研究设计往往会首先满足/照顾primary endpoint。但在临床实践应用中,必定是通盘考虑这两者。surrogate往往是体现疗效的,而非安全性。 2 1 2 下一页 尾页