长寿随机对照试验 RCT

长寿研究的细致入微和多方面方法

虽然随机对照试验仍然是黄金标准，但了解其局限性对于推进长寿科学至关重要

作者：泰勒·耶特、凯瑟琳·伯肯巴赫、彼得·阿提亚

2025 年 1 月 18 日

随机对照试验 (RCT) 彻底改变了现代医学，为医学治疗和其他干预措施提供了一种确定因果关系（而不仅仅是关联）的方法。如果设计得当，它们可以最大限度地减少偏见和混杂变量，并提供强有力的证据来证明某种治疗方法是否能达到预期目的。然而，随着我们进入一种更加个性化和预防性的医学形式（我称之为“医学 3.0”），我们需要认识到，尽管 RCT 很强大，但它并不总是解决所有问题的正确工具。

RCT 的剖析

正确执行 RCT 需要几个关键要素，这些要素虽然对科学严谨性至关重要，但可能会限制其在长寿相关研究中的适用性。根据定义，这些研究必须涉及适当的对照干预，以便与研究治疗进行比较，并且参与者必须随机接受干预。但满足这两个要求的策略通常受到实际考虑的限制。

其中一个实际考虑就是道德问题。道德禁止对某些研究问题进行随机化或最佳控制设计，因为参与者不能被随机分配到我们有充分理由相信可能有害的干预措施中。例如，从未进行过临床试验来巩固吸烟与肺癌之间的因果关系，因为流行病学研究和临床前数据的证据已经如此压倒性，以至于随机分配参与者进行吸烟干预是不道德的。同样，我们知道运动对健康和幸福的好处，我们不能从道德上通过将个人分配到需要完全不运动多年的对照组来测试这些好处。在某些情况下，可以调整控制干预措施以避免主动伤害（例如，通过比较高运动组和中等运动组），但正如我们在之前的关于第 100 代研究的通讯中详细讨论的那样（该研究采用了这种方法），这样做很容易破坏研究结果。

适当的盲法对于创建有效的对照组也至关重要，但并非所有干预措施都可实现盲法。继续以锻炼为例，有人会知道自己是否在锻炼；你不能让他们对这种治疗视而不见。因此，治疗组和对照组不仅在治疗本身上有所不同，而且在对接受治疗的认识上也有所不同，这可能会引入安慰剂效应或表现偏差（如果参与者知道自己所在的组，他们可能会因此改变其他行为，从而影响结果）。换句话说，组间结果的任何差异都可能源于对干预措施的了解，而不是干预措施本身。同样的挑战也适用于饮食干预、睡眠研究和许多其他对长寿研究至关重要的生活方式改变。

RCT 非常适合测试简单二元干预的效果，大多数药物研究都是如此——参与者要么服用有效药物，要么不服用。但我们如何设计对照干预措施来与地中海饮食等进行比较？橄榄油和全谷物没有“对立面”。我们如何在数千名参与者中多年标准化地中海饮食本身？即使干预措施简单且二元化，人类也不是简单的二元生物。人类衰老是一个复杂的系统，具有多个相互作用的变量，当我们孤立地研究干预措施时，我们可能无法解释不同干预措施相互作用的方式。

为了节省时间和金钱而做出的妥协

由于这些试验的后勤和成本，它们必须有合理的持续时间，通常不超过四到五年——超过这个时间，研究可能会变得成本过高。（例如，妇女健康倡议最初获得了 15 年的资助，高达 6.25 亿美元。）但对于许多干预措施来说，对人类寿命或慢性病发病率的有意义的影响可能需要几十年才能在一般人群中显现出来。因此，研究人员通常必须在他们选择监测的读数和他们选择研究的人群方面做出妥协，以控制成本。

为了在可控的时间内得到某个研究问题的“答案”，研究人员经常放弃直接测量我们最关心的结果（如慢性病发病率或死亡率），而是选择与这些结果相关但可能在较短时间尺度上显示干预效果的指标。例如，正如我最近与Eric Ravussin讨论的那样，CALERIE 试验的目的是评估卡路里限制对寿命的影响，但研究人员并没有继续研究数十年以确定参与者的平均死亡年龄，而是监测了可能影响或与寿命相关的众多指标，如氧化应激和免疫功能。当我们遇到跟踪载脂蛋白 B 水平或冠状动脉钙化 (CAC) 的试验时，也是同样的逻辑，以得出药物如何影响重大不良心脏事件 (MACE，如心脏病发作或中风) 风险的结论——这些结果最具临床意义。

研究人员用来限制 RCT 持续时间的另一种策略是将研究人群限制为已经面临高风险的个体。例如，预防 MACE 的干预措施试验通常仅限于过去已经经历过至少一次此类事件的患者。相对于研究一般人群，这种方法大大缩短了观察治疗组和对照组之间风险差异所需的时间，但它可能会限制研究结果的普遍性。

超越 RCT，迈向医学 3.0

让我们明确一点：RCT 仍然是我们目前拥有的确定干预措施与结果之间因果关系的最有力工具。我们当然不是想贬低它们的重要性，但我们上面提到的局限性表明，在适当的时候，需要其他形式的证据来补充 RCT 得出的见解。循证医学必须通过从多个来源进行智能推断来补充循证医学，使我们能够填补 RCT 产生的知识空白。

例如，流行病学和观察性研究可以帮助我们找到有趣的问题，而动物和细胞研究可以帮助回答有关机制的问题。在无法进行符合伦理道德的随机化的情况下，孟德尔随机化研究可用于减少混杂因素的影响，从而提高我们对观察数据的理解。（孟德尔随机化使用与酒精消费等暴露相关的基因变异作为该暴露的替代。由于基因变异在人群中随机分布，它模仿了“自然”随机试验，最大限度地减少了生活方式或环境因素的影响。）要回答长寿研究试图解决的难题，需要结合有趣的问题、适当的研究设计来回答这些问题，以及对这些数据的智能解释和综合。

除了将 RCT 的证据与不同研究设计的证据相结合之外，新兴技术和资源还在扩展 RCT 本身的能力，以解决更复杂、更具挑战性的研究问题。例如，长期运动试验历来受到难以确保坚持干预的阻碍，但使用可穿戴活动追踪器可以缓解这些问题，同样，用于追踪睡眠、血糖、体温和其他指标的可穿戴设备也可以提供有关个人对这些领域干预措施反应的丰富纵向数据。机器学习算法、人工智能、网络分析和其他分析和统计技术可以帮助我们识别传统统计分析中可能不明显的模式和相互作用。根据新信息调整研究方案的自适应试验设计可以帮助减少临床试验的成本和持续时间，而不会损害其得出可靠结论的能力。这些改进将使我们能够回答以前难以或无法解决的问题。

结论

RCT 仍然是我们在医学科学中确定因果关系的最有力工具。然而，长寿研究的未来需要一种更细致入微的方法，将正确的研究设计与正确的问题相匹配。有时这将是 RCT，但通常需要综合来自多个来源和研究类型的证据。

缺乏 RCT 证据并不一定意味着干预无效——以这种形式进行研究可能根本不切实际。随着长寿科学的发展，我们需要在评估证据的方式上变得更加成熟，在适当的情况下使用 RCT，在不适当的情况下开发和验证其他方法。

这并不意味着降低我们的证据标准——如果真要说有什么不同的话，那就是通过要求多条证据汇聚到同一结论来提高证据标准。长寿研究的未来不在于取代 RCT，而在于用其他形式的证据来补充 RCT，以更全面地了解如何延长寿命和健康寿命。

https://peterattiamd.com/beyond-randomized-controlled-trials/

Edit:2025.01.21

讨论列表 AKP讨论查看原帖及回帖

目录

长寿 随机对照试验 RCT

长寿研究的细致入微和多方面方法

RCT 的剖析

为了节省时间和金钱而做出的妥协

超越 RCT，迈向医学 3.0

结论

长寿随机对照试验 RCT