本文通过比较孟德尔随机化和随机对照试验研究方法,重点探讨孟德尔随机化分析方法在流行病学领域中相较于随机对照试验具有的优势。孟德尔随机化作为一种创新的统计技术,在流行病学研究中越来越受到重视。该方法利用遗传变异作为工具变量,模拟了随机化过程,有助于解决传统流行病学研究中的混杂和因果推断问题。本研究通过实例“孟德尔随机化方法应用于揭示多囊卵巢综合征相关激素与代谢功能障碍相关脂肪性肝病的因果关系”,进一步展示了孟德尔随机化分析的功能。研究人员掌握孟德尔随机化的分析方法,有助于提升其病因探究和疾病预防领域的科研能力,并推动流行病学研究方法的创新与发展。
流行病学专注于探究疾病和健康状况在人群中的模式及其影响因素,对于制定公共卫生策略至关重要[1]。虽然随机对照试验(randomized controlled trial,RCT)被认为是评估干预效果的最佳流行病学研究方法,但其在实际应用中往往面临伦理、成本等诸多限制。孟德尔随机化(Mendelian randomization,MR)作为一种创新的统计技术,在流行病学研究中越来越受到重视。该方法利用遗传变异作为工具变量,模拟了随机化过程,有助于解决传统流行病学研究中的混杂和因果推断问题。在流行病学领域开展MR分析,不仅丰富了研究人员的工具箱,也为其提供了新的视角来理解疾病原因和预防策略。本文比较了MR与RCT两种流行病学研究方法,并通过实例阐述MR在流行病学中的应用,以期为提升研究人员在病因探究和疾病预防领域的科研能力,以及推动流行病学研究的创新与发展贡献力量。
1 随机对照试验与孟德尔随机化
1.1 随机对照试验及其在流行病学中的作用
RCT在流行病学研究中占据着至关重要的地位,作为一种实验性研究设计,其主要目的是评估特定干预措施(如治疗方案、预防策略、健康教育等)的效应[2]。参与者被随机分配至试验组和对照组,其中试验组接受某种干预措施,对照组不接受干预或接受安慰剂/标准治疗,通过比较两组间的结果来确定干预效果。
RCT在医学、公共卫生、社会科学等多个学科领域具有深远影响。首先,RCT为确定因果关系提供了强有力的证据。通过随机化过程,RCT能够有效控制混杂因素,为干预措施与结果之间的因果推断提供了可靠的支持。其次,RCT提升了研究的内部效度。随机化策略有助于平衡已知和未知的混杂变量,从而增强研究结果的可靠性。第三,RCT对临床实践具有指导作用。其研究结果常作为制订临床指南和医疗决策的基础,辅助医疗专业人员及患者选择最有效的治疗路径。最后,RCT在优化公共卫生决策中扮演着关键角色。RCT有助于评估疫苗、健康干预措施或其他公共卫生策略的效果,进而支持决策者做出基于证据的决策[2]。
然而,RCT在实际应用中面临诸多挑战。实施RCT通常需要较大的人力、物力和时间投入。参与者的不依从性可能会在长期随访中影响研究结果的有效性。RCT涉及的干预措施可能会带来伦理风险,且试验条件下的干预在现实世界中的推广和应用可能受限。此外,RCT设计可能存在反向因果关系的风险,即研究结局可能影响干预的实施。
1.2 孟德尔随机化及其在流行病学中的作用
MR是一种基于遗传学原理的因果推断技术,其核心在于利用与特定暴露相关的遗传变异来估计该暴露因素与结局之间的因果联系[3]。该方法基于以下假设:所研究的遗传变异与暴露因素之间存在因果关系,且这些遗传变异仅通过影响暴露因素对结局产生作用,而不存在直接影响结局的其他途径。
MR的主要特点[4]包括:①遗传变异作为工具变量。所选遗传变异应与暴露因素相关,同时满足工具变量的两个基本条件。首先,遗传变异在人群中的分布应随机且不受环境因素的影响,满足相关性和独立性;其次,遗传变异仅通过影响暴露因素间接影响结局,即满足工具变量的独立性条件。②降低混杂偏倚。遗传变异的随机分配性质有助于减少或消除观察性研究中常见的混杂偏倚。③避免反向因果关系。由于遗传变异在个体出生时已固定,因此不会受到结局的逆向影响,从而规避了反向因果关系的问题。④独立于传统流行病学假设。MR分析不依赖于暴露因素与结局之间关联的线性或可建模假设,而是直接通过遗传变异来估计因果效应。⑤适用于RCT不适用的情况。对于不可操作或伦理上不宜开展RCT的暴露因素,MR提供了一种评估其因果效应的途径。⑥提供强有力的因果关联证据。在满足工具变量假设的前提下,MR能够提供较传统观察性研究更有力的因果关联证据。
尽管MR方法在因果推断中具有独特优势,但仍存在局限性[5]。首先,MR依赖于目标暴露因素存在显著相关的遗传变异,但许多暴露因素缺乏强工具变量或其影响较弱,导致统计效能不足。工具变量的有效性验证至关重要,针对遗传工具变量的多效性偏倚,当前方法学体系发展出多维度敏感性分析框架:①采用多效性稳健的MR方法,如MR-PRESSO、加权中位数法(weighted median,WM),识别并剔除异常遗传变异;②通过多变量MR模型控制潜在混杂因素的影响;③整合蛋白质定量性状位点数据验证生物学通路特异性;④利用反向MR检验排除工具变量与结局的直接因果路径。其次,MR分析需处理多基因遗传效应以确保结果的同质性,但基因变异对暴露因素的影响通常较弱,且多基因效应的复杂性增加了分析难度。针对遗传变异对暴露的解释力不足(F<10)的问题,可采用以下方法:①开发基于汇总数据的贝叶斯MR框架,有效降低弱工具偏倚;②采用限制性极大似然估计法替代传统两阶段最小二乘法;③通过跨群体Meta分析提升工具变量强度;④应用Steiger过滤法验证工具变量与暴露的因果方向。同时,不同数据集的异质性可能影响结果的准确性和可重复性。此外,MR方法还面临其他挑战,包括多效性导致工具变量无效、弱工具变量问题引发因果估计偏差,以及基因-环境交互作用和社会经济地位等混杂因素对研究准确性的影响。基于横断面数据的MR分析也难以捕捉暴露因素与结局之间的时间动态关系。未来方法学研究可着力于以下三个关键维度:在理论模型层面,开发可整合多组学数据的新型MR扩展模型;在数据基础层面,可建立全球性遗传-表型数据库以增强统计效力;在方法整合层面,推动MR分析框架与因果中介分析、靶向试验设计的协同应用。
值得注意的是,STROBE-MR指南已为工具变量验证和敏感性分析建立了标准化报告规范,研究者需严格遵循以确保证据的可重复性和因果推断的有效性[6]。这些方法学进展与生物样本库的深度融合,将推动MR从单纯的因果推断工具向精准病因解析平台的跨越式发展,特别是在复杂疾病的环境-遗传交互作用研究领域展现出独特价值,将为精准医学时代的病因学研究提供有力支撑。
1.3 随机对照试验与孟德尔随机化在流行病学中的作用比较
在流行病学领域,研究者经常面临挑战,如需确定某些不可改变或难以干预的暴露因素与健康结局之间的因果关系。这些暴露因素可能包括遗传变异、早期生活经历或长期的生活方式选择。在这些情况下,传统的RCT可能不适用或难以实施。MR方法的出现为研究者提供了一种新的研究途径,以解决这些复杂的研究问题,特别是在探索遗传因素与健康结局关联的领域[7]。MR与RCT的比较见表1。
2 孟德尔随机化在流行病学中的应用实例
MR在流行病学中的应用主要集中在揭示遗传因素与疾病之间的因果关系方面。研究者利用遗传标记物,如单核苷酸多态性(single nucleotide polymorphisms,SNPs)来探索疾病的病因、评估个体患病风险,并为进一步的预防研究提供依据[8]。通过选择和验证这些遗传标记物,并结合先进的研究设计和统计方法,MR方法在流行病学研究中发挥着重要作用。应用MR研究方法时须遵循以下三个基本假设:①SNPs与暴露因素的关联性假设,所研究的SNPs与特定的暴露因素之间存在显著联系;②SNPs与混杂因素的独立性假设,所选SNPs与结局之间的关系不应受到其他混杂因素的影响;③SNPs作用途径的唯一性假设,SNPs对结局的影响应当仅通过影响暴露因素这一途径,而不应存在其他独立的影响路径[9],见图1。这些假设的满足程度直接决定因果推断的可靠性,因此在研究设计和分析阶段需通过多维度验证加以保障。本部分将通过案例“MR应用于揭示多囊卵巢综合征(polycystic ovarian syndrome,PCOS)相关激素与代谢功能障碍相关脂肪性肝病(metabolic dysfunction-associated steatotic liver disease,MASLD)的因果关系”进行介绍。
已有研究发现,PCOS相关激素(如黄体生成素、卵泡刺激素、硫酸脱氢表雄酮、性激素结合球蛋白、雌二醇和生物有效性睾酮等)与内分泌系统密切相关[10-11],可以通过与脂肪代谢、胰岛素敏感性、腹部脂肪分布和肝脏脂肪积聚的相互作用,直接或间接地影响MASLD的发生发展。基于MR方法学基础,本研究构建了PCOS相关激素与MASLD因果关系的分析框架。PCOS相关激素的数据来源于大规模全基因组关联研究(genome-wide association study,GWAS),具体为黄体生成素(编码:prot-a-529)、卵泡刺激素(编码:prot-a-528)、硫酸脱氢表雄酮(编码:ebi-a-GCST004941)、性激素结合球蛋白(编码:ebi-a-GCST90012110)、雌二醇(编码:ebi-a-GCST90012105)、生物有效性睾酮(编码:ebi-a-GCST90012102)和睾酮(编码:ebi-a-GCST90014013)。MASLD数据来源于IEU OpenGwas数据库(https://gwas.mrcieu.ac.uk)的一项荟萃分析(编码:ebi-a-GCST90091033),共有来自欧洲的8 434例MASLD患者和770 180例对照。
2.1 工具变量的筛选
MR分析中工具变量的筛选遵循以下标准:①遗传标记物初筛,采用全基因组显著性阈值(P <5×10-8)确保遗传关联强度,通过遗传距离(kb>10 000)和连锁不平衡系数(R2<0.001)排除存在连锁不平衡的SNPs,最终保留具有强独立关联的遗传变异;②弱工具变量排除,采用F统计量评估工具变量强度,剔除F<10的弱工具变量;③表型重叠排除,去除在MASLD GWAS研究中同样达到显著性水平的SNPs,消除暴露与结局的遗传重叠干扰;④回文结构校正,去除碱基方向不明确的回文SNPs[12],避免基因型与表型关联的方向性误判。
2.2 因果效应的多模型验证
在建立有效工具变量的基础上,因果效应的评估常采用多模型联合验证策略,主要包括:①MR Egger回归,允许存在工具变量多效性;②WM法,容许50%无效工具变量;③逆方差加权法(inverse variance weighted,IVW),假设工具变量无多效性的金标准;④简单模式法(simple mode);⑤加权模式法(weighted mode)[13-14]。效应值以比值比(odds ratio,OR)及其95%置信区间(confidence interval,CI)呈现。
2.3 研究结果的解读
通过R 4.3.1软件安装并调用TwoSampleMR和孟德尔随机化数据包[15-16]进行分析后发现,按照标准进行工具变量筛选后,分别有1、4、10、84、2、369和122个SNPs可作为PCOS相关激素,即黄体生成素、硫酸脱氢表雄酮、雌二醇、睾酮、卵泡刺激素、性激素结合球蛋白及生物有效性睾酮的工具变量(图2)。IVW法分析结果显示,卵泡刺激素(OR=0.83,95%CI:0.70~1.00,P=0.046)、性激素结合球蛋白(OR=0.75,95%CI:0.59~0.95,P=0.017)和生物有效性睾酮(OR=1.29,95%CI:1.11~1.49,P=0.001)与MASLD存在因果关联。WM法进一步验证,性激素结合球蛋白(OR=0.57,95%CI:0.42~0.78,P <0.001)和雌二醇(OR=0.15,95%CI:0.02~0.96,P=0.045)与MASLD存在因果关联(表2)。
上述分析流程从工具变量的严格筛选到多模型因果验证,各环节均依托于MR研究的三大基本假设。研究通过表型重叠排除和回文结构校正等步骤强化独立性假设,利用F统计量确保关联性假设,并借助多模型比较检验排他性假设,从而构建出完整的因果推断证据链。
3 结语
MR分析作为因果推断方法学的重要突破,为现代流行病学研究开辟了新的方法论路径。本文通过系统比较MR与RCT的方法学特征,并将MR方法引入PCOS相关激素与MASLD的因果关系研究,构建了基于遗传变异的因果推断框架,揭示了MR方法通过遗传工具变量模拟自然随机化过程。本研究发现,卵泡刺激素、性激素结合球蛋白和雌二醇的遗传升高与MASLD风险降低显著相关,而生物有效性睾酮的遗传升高则与MASLD风险增加密切相关。这一发现不仅揭示了PCOS相关激素在MASLD发生发展中的关键作用,明确了MR方法在复杂暴露因素研究中的互补价值,以及其有效规避混杂偏倚与反向因果关联的独特优势,更重要的是为MASLD的人群筛查和临床干预提供了精准预防的新策略。
近年来,MR研究取得了显著进展,成为现代流行病学和医学研究中一种重要的因果推断工具。随着GWAS的快速发展,遗传数据的积累为MR研究提供了丰富的工具变量资源[17]。这些数据不仅使研究者能够更全面地探索暴露因素与结局之间的因果关系,还推动了MR分析方法的创新。MR Egger回归、WM法和多变量MR等多种统计方法的出现,能够更好地处理多效性和异质性问题,从而提高因果推断的可靠性。
MR研究的应用范围不断扩大,不仅在传统流行病学领域被广泛应用,还逐渐扩展到药物靶点发现、公共卫生政策制定等领域[18]。通过MR分析,研究者能够评估饮食及运动等生活方式因素对健康的影响,为公共卫生干预提供科学依据。此外,MR研究还可用于探索慢性背痛等慢性疾病的遗传基础,并为潜在药物靶点提供证据[19]。
尽管RCT被认为是评估因果关系的“金标准”,但在实际应用中,RCT需要大量的人力、物力和时间投入。此外,在某些研究中,将受试者随机分配到可能有害的暴露组不符合伦理要求[20]。MR研究利用遗传变异的自然随机化特性,能够有效控制混杂因素和反向因果关系,提供较传统观察性研究更可靠的因果推断。
在流行病学研究中,MR和RCT是两种重要的研究方法,它们在识别和处理暴露因素与结局之间的因果关系方面各有优势。MR研究通过利用遗传变异的随机分配特性,能够有效规避反向因果关联,降低混杂因素的影响[21]。然而,MR研究的应用需满足严格的假设条件,如工具变量的选择必须满足关联假设、无混杂假设和无多效性假设。此外,MR研究还需考虑样本量要求、水平多效性及人群异质性等问题。
随着因果推断技术的不断革新,MR分析为流行病学研究提供了新的视角,帮助解析疾病的原因并制定有效的预防措施。公共卫生领域的研究人员应顺应时代发展的需求,整合遗传学、统计学与数据科学的技术优势,主动学习并掌握MR分析技术,推动多组学数据的整合应用,将基因表达、代谢组等分子表型纳入分析框架,深化对疾病因果网络的系统认知。同时,MR研究可结合RCT等传统方法的优势,以实现更全面、可靠的因果推断。通过持续优化研究设计与分析技术,MR方法将为公共卫生领域研究提供有力的方法学支撑。
1.Vandenbroucke JP, von Elm E, Altman DG, et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration[J]. Int J Surg, 2014, 12(12): 1500-1524. DOI: 10.1016/j.ijsu.2014.07.014.
2.Hariton E, Locascio JJ. Randomised controlled trials - the gold standard for effectiveness research: Study design: randomised controlled trials[J]. BJOG, 2018, 125(13): 1716. DOI: 10.1111/ 1471-0528.15199.
3.Zuber V, Colijn JM, Klaver C, et al. Selecting likely causal risk factors from high-throughput experiments using multivariable Mendelian randomization[J]. Nat Commun, 2020, 11(1): 29. DOI: 10.1038/s41467-019-13870-3.
4.Lovegrove CE, Howles SA, Furniss D, et al. Causal inference in health and disease: a review of the principles and applications of Mendelian randomization[J]. J Bone Miner Res, 2024, 39(11): 1539-1552. DOI: 10.1093/jbmr/zjae136.
5.Schmidt AF, Finan C, Gordillo-Marañón M, et al. Genetic drug target validation using Mendelian randomisation[J]. Nat Commun, 2020, 11(1): 3255. DOI: 10.1038/s41467-020-16969-0.
6.Skrivankova VW, Richmond RC, Woolf BAR, et al. Strengthening the reporting of observational studies in epidemiology using Mendelian randomization: the STROBE-MR statement[J]. JAMA, 2021, 326(16): 1614-1621. DOI: 10.1001/jama.2021.18236.
7.Sobczyk MK, Zheng J, Davey Smith G, et al. Systematic comparison of Mendelian randomisation studies and randomised controlled trials using electronic databases[J]. BMJ Open, 2023, 13(9): e072087. DOI: 10.1136/bmjopen-2023-072087.
8.Spiga F, Gibson M, Dawson S, et al. Tools for assessing quality and risk of bias in Mendelian randomization studies: a systematic review[J]. Int J Epidemiol, 2023, 52(1): 227-249. DOI: 10.1093/ije/dyac149.
9.Liu W, Yang C, Lei F, et al. Major lipids and lipoprotein levels and risk of blood pressure elevation: a Mendelian Randomisation study[J]. EBioMedicine, 2024, 100: 104964. DOI: 10.1016/j.ebiom.2023.104964.
10.Hoeger KM, Dokras A, Piltonen T. Update on PCOS: consequences, challenges, and guiding treatment[J]. J Clin Endocrinol Metab, 2021, 106(3): e1071-e1083. DOI: 10.1210/clinem/dgaa839.
11.Dewailly D, Robin G, Peigne M, et al. Interactions between androgens, FSH, anti-Mullerian hormone and estradiol during folliculogenesis in the human normal and polycystic ovary[J]. Hum Reprod Update, 2016, 22(6): 709-724. DOI: 10.1093/humupd/dmw027.
12.Zhang HF, Zhang QX, Feng YH, et al. Association of thyroid disease and risk of fatty liver disease: an exposure-wide Mendelian randomization study[J]. Eur Rev Med Pharmacol Sci, 2023, 27(23): 11402-11411. DOI: 10.26355/eurrev_202312_34579.
13.Bowden J, Davey Smith G, Burgess S. Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression[J]. Int J Epidemiol, 2015, 44(2): 512-525. DOI: 10.1093/ije/dyv080.
14.Burgess S, Bowden J, Fall T, et al. Sensitivity analyses for robust causal inference from Mendelian randomization analyses with multiple genetic variants[J]. Epidemiology, 2017, 28(1): 30-42. DOI: 10.1097/EDE.0000000000000559.
15.Hemani G, Zheng J, Elsworth B, et al. The MR-Base platform supports systematic causal inference across the human phenome[J]. Elife, 2018, 7: e34408. DOI: 10.7554/eLife.34408.
16.Yavorska OO, Burgess S. MendelianRandomization: an R package for performing Mendelian randomization analyses using summarized data[J]. Int J Epidemiol, 2017, 46(6): 1734-1739. DOI: 10.1093/ije/dyx034.
17.Larsson SC, Butterworth AS, Burgess S. Mendelian randomization for cardiovascular diseases: principles and applications[J]. Eur Heart J, 2023, 44(47): 4913-4924. DOI: 10.1093/eurheartj/ehad736.
18.Gill D, Georgakis MK, Walker VM, et al. Mendelian randomization for studying the effects of perturbing drug targets[J]. Wellcome Open Res, 2021, 6: 16. DOI: 10.12688/wellcomeopenres.16544.2.
19.Daghlas I, Gill D. Mendelian randomization as a tool to inform drug development using human genetics[J]. Camb Prism Precis Med, 2023, 1: e16. DOI: 10.1017/pcm.2023.5.
20.Zabor EC, Kaizer AM, Hobbs BP. Randomized controlled trials[J]. Chest, 2020, 158(1s): S79-S87. DOI: 10.1016/j.chest.2020. 03.013.
21.Davey Smith G, Holmes MV, Davies NM, et al. Mendel' laws, Mendelian randomization and causal inference in observational data: substantive and nomenclatural issues[J]. Eur J Epidemiol, 2020, 35(2): 99-111. DOI: 10.1007/s10654-020-00622-7.