既然DeepTech深科技号称是关注三个方面:基于科学的发现;真正的科技创新;深科技应用的创新。既然你们要以科学的名义进行评价(review?),

那么:

一、关于文章的题目

虽然你们写的不是论文,但尚未起跑已分高下,这样的题目,想要告诉读者什么?你们这个标题,起得足够科学吗??这和标题党有多大的区别?

二、关于针对的患者人群(trial population)

原文:

两个试验,一个注册在国内的世卫组织临床试验注册一级平台,一个注册在美国的clinicaltrials.gov。我分别在两个平台上查阅了这两个试验的资料,确实如DeepTech深科技文章中所言,双黄连的试验排除了需要机械通气、危重型新冠肺炎患者,就是针对轻、中症患者的,我想这一治疗定位,与大家心里对于双黄连的定位,还是比较恰当的。但是反过来,瑞德西韦的试验,会入组哪些病人,其中有多少是危重的,只能等到试验数据公布时,我们才会知道,我们不能想像它就是针对重症患者的,虽然它没有明确排除危重患者,但,在瑞德西韦的试验方案中,排除标准的第1条是:

Physician makes a decision that trial involvement is not in patients' best interest, or any condition that does not allow the protocol to be followed safely.

也就是说,最终还是由医生决定某个患者是否入组。所以,最终这个试验入了哪样的患者,等试验结果公布。

三、关于药物结构与机理

原文:

这一段,你们大概是要告诉读者,双黄连天生不行。

我想说的是,它们俩本来就不一样,这种比较的意义何在?不过话要说回来,就算双黄连天生不行,也不代表瑞德西韦天生就行。开展临床试验的目的,就是要验证它们行不行。

在人体之外的试验,只是参考,毕竟人体是一个极其复杂的系统,进入人体会怎么样,疗效与安全性如何,要看最终的临床试验结果。瑞德西韦在理论上可以阻断病毒的复制,在体外实验中也有不错的表现,但据报导,在刚果开展的治疗埃博拉病毒的试验失败了。所以,在试验结果未出之时,行与不行的主观猜想,很显然不符合所谓科学的定位。

我们关注一个药物,核心的,应该是它的疗效与安全性,而非它的出身。 成份复杂,机理不清,正是我们深入研究的原由,而非打压的噱头。成份单一,机理清晰,只能为将来可能的疗效与安全性,提供一个相对容易的预测基础,而不代表将来的结果。

四、关于试验的设计

原文:

随机、对照、双盲的临床试验设计,可以看作是开展临床研究的金标准。瑞德西韦的试验采用双盲设计,客观讲,更为严谨科学。

但没有采用双盲设计,就不科学了? 在你们和某些专家眼里,确实非常不科学。

不过,在R.A.Fisher提出实验设计三原则的时候,还没有所谓的“双盲”。事实上,避免组间偏倚的最重要的手段,仍然是随机化。盲法的采用,只是让可能存在的偏倚尽可能再小些。

我们不应抓住设不设盲这个问题不放,盲不与盲,在严格随机、客观评价的情况下,不太可能从根本上改变试验的结果。

当然站在严谨、科学的角度,我也赞成试验在尽可能的情况下要设盲,能双盲就别单盲,能单盲就别开放,事实上,这是我给申办者一贯的建议。

但是,我们也不要迷信双盲(双盲试验设计仍然有可能被人为操作,国外不少试验造假、或者选择性地报导结果也是事实),同时把开放性试验妖魔化,或者猜想它的结果会怎么怎么样(此处略去几个字。。。),如果要质疑,请以科学的态度,凭借双盲与否就主观臆断研究者的态度,实属不该。这是其一。

其二,我更关心的,是试验的对照。双黄连采用了复合对照的方式(类似有基础治疗的安慰剂对照),即两组都接受常规治疗,试验组要加用双黄连,所以在最后比较时,要采用优效性检验,即,必须证明试验组优于对照组。否则,试验失败。

瑞德西韦的试验,采用了安慰剂对照,而且,我确实没有在公开的资料(clinicaltrials.gov)中看到两个组有接受基础治疗的说明,如果真的是单纯安慰剂对照,而无基础治疗,那么问题来了:这个试验的伦理是怎么考虑的?既然是随机双盲,而且是两组平行对照,那么理论上有一半(1:1对照的情况;如果是2:1对照,也有151例之多)的患者将进入安慰剂组。2003年我刚刚进入临床试验领域时,就从孙晓春博士那里知道了临床试验的两个核心问题:伦理与科学,而伦理(可以简单地理解为受试者的安全与权益),是第一位的,如果伦理与科学有冲突,那么,我们要站伦理一边。

如果瑞德西韦这个试验确实没有设置基础治疗,我想这个试验的伦理委员会专家们要出来给一个说法。

其三,关于主要终点指标的选择

原文:

从两者方案的注册资料看,主要终点的设计,瑞德西韦的比双黄连更严谨。其实双黄连的试验设计,国内当前的中医药研究中比较常见,众多中医药的研究,确实需要提高研究的设计水平,这是咱的心里话

但是,瑞德西韦与双黄连比,就没毛病了?你们,包括文中出现的这些专家(得罪了啊),既然要质疑那就本着科学的态度,两者的优缺点,全部列一列,客观地比一比。不能只拿一个的优点与另一个的缺点相比。

瑞德西韦的设计有没有可挑剔的地?

  • 主要终点,进行了修改(虽然不是大改,但确实是改变了评价标准);

  • 样本量刚注册时写的452,后来改为453,我很奇怪,Study Arms 那里明明写的2个试验组,453如何随机的,由原来的1:1对照,改成2:1对照了?在试验的中间修改随机化方法,这可是临床试验的大忌;另外有没有区组,有没有中心分层?

  • 关于试验终点,瑞德西韦共设计了:从6死亡到1出院共6个等级,主要终点TTCI是下降2个等级所用的时间,那么肯定是没有从6降到4的情况了,而且从5到3、从4到2、从3到1,都是下降两个等级,但病情的变化难度是相同的吗?(谁知道!)不同的变化程度对应的时间是不是要分层进行分析,而作为一个采用“生存分析”的试验,定义治愈、未愈的结局,会不会更好?等等。

五、最后,关于两个药物的安全性

原文:

我看了2014年的国家药品不良反应监测年度报告,确实有“中成药口服制剂排名前五位的品种分别是:双黄连合剂(口服液、颗粒、胶囊、片)”这一句,但是没有明确是按照什么标准排的,是报告不良反应的总数,还是发生的比例(排在首位这一句前面,一直是说报告的总数)。如果是报告的总数,那我们就得考虑实际的销量。如果是因为销量大排在前列,而实际发生的比例不高,那就是另外一种情况了。

瑞德西韦的安全性,很好?没有大规模的用药记录,目前已有的样本量和实验室研究,并不足以支持其安全性的说法。美国FDA审过上市的药,还有后来因为安全性问题退市的呢,何况一个还没上市的在研新药。所以安全性上不要妄下结论。搞统计的,看重的是用数据说话的,无论中西,都要用真实、准确、完整的数据说话。


写在最后:

其实每个试验的设计,都是从试验能够取得成功出发的,每个研究者也都有自己的考量。试验设计的水平确有高下,要质疑也没有问题,有问题提出来,大家共同提高。

在临床试验行业将近20年,亲身的感受,是国内临床试验的水平,这些年其实提高不少。但也确实存在一些设计不够严谨、不够合理的情况(很多情况是受限于研究经费),存在的问题,提出来应该是为了进一步提高我们的试验水平。

但是我反对厚此薄彼式的评价,站一个踩一个。如果一个事物的好与坏,已经在人的脑子里形成,那很可能就没有了公正、科学地评判,而在科学的名义下,这样的行为就更具危害性。