纽约州伊萨卡市——康奈尔大学研究人员磨练和推进的另一种统计方法可以使临床试验更加可靠和可信,同时还有助于解决科学界所谓的“可复制性危机”。
在本月发表在《美国国家科学院院刊》上的一篇新论文中,康奈尔大学的研究人员进一步研究了“脆弱性指数”,这是一种在医学界获得关注的方法,作为 p 值的补充,p 值是一种应用于科学的概率测量,自1920 年代,有时甚至不顾后果地引用作为良好结果的证据。
“临床医生相信,他们执行的程序和协议是通过合理的临床试验得出的。少任何事情都会让外科医生感到紧张,这是理所当然的,”查尔斯·A·亚历山大 (Charles A. Alexander) 统计科学教授、论文合著者马丁·威尔斯(Martin Wells)说。“我们发现,许多这些显示出有希望的结果并发表在顶级期刊上的后续试验都是脆弱的。这是这项研究带来的令人不安的惊喜。”
这篇由康奈尔大学的统计学家、威尔康奈尔医学院和多伦多大学的医生撰写的论文提出了一种新的统计工具包,使用脆弱性指数作为替代方法,以帮助研究人员更好地确定他们的试验结果实际上是否可靠或者仅仅是偶然的产物。
“当你告诉全世界应该或不应该使用某种治疗方法时,你希望该决定基于可靠的结果,而不是基于一两个患者的结果可以以一种或另一种方式摆动的结果,”本杰明说贝尔博士'21,论文合著者,目前是罗彻斯特大学的博士后研究员。“这样的结果可以被认为是脆弱的。”
[Randomized,临床试验,以测试效果是外科手术和药物治疗是必不可少的。为了解释试验结果的统计显着性,几十年来,研究人员转向了一种经常被误解的衡量标准,即 p 值,以确定结果是否有价值或只是偶然发生。
但是,在过去的 15 年中,当单独使用且没有支持方法时,对 p 值可靠性的怀疑越来越多,特别是因为过去的试验结果最初被认为是强大的,无法在后续试验中复制。在2014 年使用脆性指数的一项研究中,研究人员分析了 400 项随机临床试验,发现四分之一具有“统计显着”p 值的试验实际上具有低得惊人的脆性评分,表明结果不太可靠。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!