• 中国精品科技期刊
  • 《中文核心期刊要目总览》收录期刊
  • RCCSE 中国核心期刊(5/114,A+)
  • Scopus收录期刊
  • 美国《化学文摘》(CA)收录期刊
  • WHO 西太平洋地区医学索引(WPRIM)收录期刊
  • 《中国科学引文数据库(CSCD)》核心库期刊 (C)
  • 中国科技核心期刊
  • 中国科技论文统计源期刊
  • 《日本科学技术振兴机构数据库(中国)》(JSTChina)收录期刊
  • 美国《乌利希期刊指南》(UIrichsweb)收录期刊
  • 中华预防医学会系列杂志优秀期刊(2019年)

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

倾向性评分与孟德尔随机化国内研究现状

和思敏 张雨 彭刘庆 景佳蕊 陈淑婷 王文杰 高绒绒 高雪 高倩 王彤

和思敏, 张雨, 彭刘庆, 景佳蕊, 陈淑婷, 王文杰, 高绒绒, 高雪, 高倩, 王彤. 倾向性评分与孟德尔随机化国内研究现状[J]. 中华疾病控制杂志, 2022, 26(3): 325-330. doi: 10.16462/j.cnki.zhjbkz.2022.03.014
引用本文: 和思敏, 张雨, 彭刘庆, 景佳蕊, 陈淑婷, 王文杰, 高绒绒, 高雪, 高倩, 王彤. 倾向性评分与孟德尔随机化国内研究现状[J]. 中华疾病控制杂志, 2022, 26(3): 325-330. doi: 10.16462/j.cnki.zhjbkz.2022.03.014
HE Si-min, ZHANG Yu, PENG Liu-qing, JING Jia-rui, CHEN Shu-ting, WANG Wen-jie, GAO Rong-rong, GAO Xue, GAO Qian, WANG Tong. Research progress of propensity score and Mendelian randomization in China[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2022, 26(3): 325-330. doi: 10.16462/j.cnki.zhjbkz.2022.03.014
Citation: HE Si-min, ZHANG Yu, PENG Liu-qing, JING Jia-rui, CHEN Shu-ting, WANG Wen-jie, GAO Rong-rong, GAO Xue, GAO Qian, WANG Tong. Research progress of propensity score and Mendelian randomization in China[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2022, 26(3): 325-330. doi: 10.16462/j.cnki.zhjbkz.2022.03.014

倾向性评分与孟德尔随机化国内研究现状

doi: 10.16462/j.cnki.zhjbkz.2022.03.014
基金项目: 

国家自然科学基金 81872715

国家自然科学基金 82073674

详细信息
    通讯作者:

    王彤,E-mail: tongwang@sxmu.edu.cn

  • 中图分类号: R181.2

Research progress of propensity score and Mendelian randomization in China

Funds: 

National Natural Science Foundation of China 81872715

National Natural Science Foundation of China 82073674

More Information
  • 摘要: 混杂偏倚是非随机化研究中偏倚一类的重要来源,对混杂因素的控制是研究中获得可靠结果的保证。本文简要介绍了在非随机化研究中常用的两类混杂控制方法——倾向性评分和孟德尔随机化,并对近年来国内相关研究现状进行综述,为倾向性评分匹配和孟德尔随机化的应用提供建议。
  • 在人群研究中,基于随机对照试验(randomized controlled trial, RCT)的研究设计是评价因果效应的“金标准”。然而,在实际情况中,RCT容易受到伦理、时间或经费以及受试者依从性等因素的限制。相较之下,非随机化研究资料易于获得,人群选择更接近现实世界情况,且便于实施,因而受到了越来越广泛地应用。混杂因素,即除研究因素外,其他所有可能影响结局的因素,其存在会造成研究结果偏离真实的关联效应。因此,在非随机化研究中,应当通过适当的设计和分析方法控制混杂因素带来的偏倚[1]。在实际研究中,根据混杂因素是否被测量,常用倾向性评分(propensity score, PS)或孟德尔随机化(Mendelian randomization, MR)方法控制混杂,进而对暴露与结局间的因果关联进行估计[2]。本文对近年来PS和MR方法在国内的研究现状进行综述,并对其不同应用场景进行简要介绍,为相关应用研究提供新思路。

    PS由Rosenbaum等[3]于1983年基于“反事实”框架标准提出,指给定协变量X的条件下,个体接受处理(T=1)的概率估计。PS方法本身不能控制混杂,而是通过匹配、回归调整、分层或加权等方式,不同程度地提高各对比组间的均衡性,从而平衡协变量对效应估计的影响,达到“类随机化”的效果,又称为“事后随机化”[4]

    PS方法主要分两步进行:首先,构建处理因素模型,估计PS值;第二步,应用PS值,构建结局因素模型,进行处理效应的估计。传统的PS方法没能考虑PS值的不确定性对处理效应的影响,并且在估计处理效应时没有利用先验信息。有学者提出将贝叶斯统计的思想引入到PS法中,其中包括An[5]提出的中间贝叶斯PS法和Kaplan等[6]提出的两步骤贝叶斯PS法。但是二者的理论研究和实际应用都仅适用于二分类分组变量。鉴于此,吴美京[7]在2014年将贝叶斯PS法扩展至处理因素为多分类的情况中,构建了两种新的模型:中间贝叶斯广义PS法和两步骤贝叶斯广义PS法,同时考虑了无序多分类变量和有序多分类变量两种情况。结果显示:当处理因素为无序多分类以及有序多分类时,上述两种方法均能得到比一般方法更接近处理效应真实值的结果,对偏倚的控制效果更好。但是,研究者尚未说明两种贝叶斯广义PS法哪一种方法表现更优。此外,该研究在第一步估计PS值时均采用Logistic线性回归分析模型或累积Logit模型,并且仅考虑了协变量的主效应。

    同样是针对实际研究中常见的多水平层次结构数据,于菲菲[8]在2016年提出将Boosting估计PS的方法运用到多水平数据中,并构建处理因素为无序多分类和有序分类数据的多水平PS值模型。结果显示:在不同的数据结构情况下,不同多水平PS值模型估计处理效应的准确度和精确度差异较大,各有其适用条件。Boosting算法在多水平PS模型的估计中存在一定优越性,但并不是任何情况均适用,应视数据情况而定。

    传统的倾向性评分匹配(propensity score matching, PSM)使用的是PS法的点估计,未考虑抽样误差的影响,因此有学者提出使用PS法的置信区间进行匹配,称为倾向性评分区间匹配(propensity score interval matching, PSIM)。PSIM在样本量较小的情况下可以提升匹配率,但可能导致匹配后组间协变量均衡性变差。郭轶斌[9]在2019年提出将全局最优匹配算法用于优化PSIM,构建全局最优的PSIM算法。该算法着眼于使所有形成匹配对象的PS距离之和达到最小或PS置信区间重合度之和达到最大,从而在增加匹配率的同时进一步平衡组间协变量。对优化后的方法进行评估显示:此匹配方法估计处理效应95%置信区间的覆盖率最优,并且标准化差异较小,匹配率较高,但是该法估计处理效应的均方误差较大。

    在卫生经济学研究中,倾向得分匹配-双重差分(propensity score matching-difference in difference, PSM-DID)模型作为有力的政策分析工具被广为使用。但PSM原本适用于截面数据,在运用到面板数据时存在挑战。因为,基于面板数据转化为截面数据再匹配和基于面板数据逐期匹配的两种传统方案容易产生“自匹配”现象或匹配对象在政策前后不一致的问题。谢申祥等[10]在2021年对传统的逐期匹配方案进行了改进:一是对匹配变量进行区分,并由特殊类变量(指包含众多不可观测信息,在实际研究中需要对照组和处理组在该变量上保持相同的种类变量)和PS值共同控制匹配;二是匹配方式由原来PS值点对点匹配,改为PS值序列间的整体匹配。改进结果显示,当对照组与处理组差异较大且存在特殊类变量时,利用改进后的PSM-DID模型可以更加有效地识别因政策而产生的效应。

    基于边际结构模型的逆概率加权(inverse probability weighting, IPW)法是非随机化研究中处理效应估计的一类重要方法。对于IPW法,第一阶段的逆概率权重估计非常关键,这决定了最终的处理效应估计是否无偏。近年来,有学者采用包括许多统计学习算法在内的数据适应性方法估计逆概率权重,取得了良好的效果。然而,目前的研究大多局限于二分类处理因素资料以及单一结局的纵向生存资料。鉴于此,郭威[11]在2018年利用多种统计学习算法对当处理因素为连续型变量的资料以及时依性竞争风险生存资料时的逆概率权重进行估计,并且探讨了对权重进行截断(避免极端权重)对处理效应估计的影响。模拟结果显示:对于连续型处理因素资料,协变量均衡性倾向评分(covariate balancing propensity score, CBPS)和非参数CBPS(non-parametric CBPS, npCBPS)在均衡协变量方面的能力较强;在减小估计偏倚方面,boosted分类与回归树(boosted classification and regression trees, boosted CART)法和随机森林(random forest, RF)法等统计学算法的表现较优;在采用IPW法进行效应估计时,应首先考虑权重变量的分布,若存在较多离群点,应首先对权重作截断处理,然后进行下一步的效应估计。对于时依性竞争风险生存资料,在采用边际结构风险模型进行效应估计时,由于实际资料中的处理分配机制往往未知,研究者建议采用boosted CART法和RF法替代传统的Logistic线性回归分析模型构建逆概率权重,以减小模型设定错误对于效应估计的影响。

    随着组学数据和电子医疗病例数据等大数据的广泛使用,不存在未测量混杂这一假设成立的可能性变大,但却引入了高维自变量。这种情况下,在针对连续性处理因素的PS模型中,如何有效地同时筛选出仅对结局有预测作用的变量和可能的混杂因素成为一个亟待解决的问题。鉴于此,Gao等[12]于2021年通过双重加权相关系数将结局自适应LASSO(least absolute shrinkage and selection operator)方法与非参数协变量均衡广义倾向性评分方法结合,提出了广义结局自适应GOAL(generalized outcome adaptive LASSO)方法。对比结果表明,GOAL方法各方面的表现与理想方法(只包含与结局相关变量的方法)相近甚至在某些情况下略优。

    在PSM前后需要对放入PS模型中的协变量进行均衡性检验,Flury等[13]首次提出标准化差异法以检验二分组资料协变量的均衡性。对于多组资料,则是采用不同组间标准化差异的最大值作为评价指标。但此方法的计算步骤繁琐,不便于实际应用。黄福强等[14]在2018年利用合并方差构建了用于评价三分组资料组间协变量均衡性的指标(简称FQ统计量),用于评价三分组资料协变量组间均衡性,并与假设检验法和标准化差异法进行比较。结果显示:标准化差异法和FQ统计量,检验三组间协变量均衡性的能力高于假设检验法,且不受样本量大小的影响。由于FQ统计量的计算步骤较标准化差异法简便,因此更具应用优势。

    倾向得分亚组分析在实际应用中由于总样本倾向得分估计值与真实值不一致会引起亚组样本内协变量的不均衡,进而导致亚组因果效应的有偏估计。然而直接估计亚组样本倾向得分会打破偏差与方差平衡,即实现了亚组内的协变量均衡的同时会导致方差膨胀。鉴于此,Dong等[15]在2020年提出了亚组均衡倾向性得分(subgroup balancing propensity score, SBPS)。对于每个亚组,为优化样本协变量均衡条件,自适应选择使用总样本或亚组样本估计该亚组内个体的倾向性得分,并基于匹配和加权开发了两个版本。此外,还为亚组数较大时估计亚组均衡倾向得分设计了一种随机搜索算法。结果显示:该方法能有效改善使用PS法估计亚组处理效应的表现。从自发报告系统(spontaneous reporting system, SRS)中得到的不良药物事件(adverse drug event, ADE)是药物—药物相互作用(drug-drug interaction, DDI)研究的主要来源。但是从SRS中检测DDI信号存在两个主要问题:混杂偏倚和假阳性率。Wang等[16]在2020年基于不成比例分析中的三元混合模型提出了倾向得分调整三元混合模型(propensity score-adjusted three-compoent mixture model, PS-3CMM)。研究表明:PS-3CMM模型可以调整食品药品监督管理局不良事件报告系统(Food and Drug Administration adverse event reporting system, FAERS)数据库中所有药物—药物—ADE组合的混杂偏倚,同时估计错误发现率。在检测真实DDI方面,PS-3CMM表现较现有方法更好。此外,该模型在选择具有非阳性个体药物相对ADE风险的DDI信号时也更为灵敏。但PS-3CMM模型在处理高度相关药物时存在局限性,应用在FAERS时也未考虑药物的疗程和剂量信息。

    MR方法最早由Katan[17]在探索血清胆固醇水平与癌症风险关系时提出。该方法以遗传变异作为工具变量建立模型并进行因果效应推断[18]。一方面可以从理论上避免混杂因素的影响[19];另一方面,由遗传变异所解释的这部分暴露形成先于结局,从而可以排除逆向因果的干扰。随着生物信息技术的发展,遗传变异的测量精度不断提高,这也大大降低了研究中由于测量误差可能带来的估计偏倚[20]

    MR模型中,作为工具变量的遗传变异需满足以下三个核心假设[21]:(1)遗传变异与暴露相关;(2)遗传变异与暴露—结局通路上的混杂因素独立;(3)遗传变异与结局之间只有暴露这一条因果通路。MR模型能够有效校正混杂因素的必要条件是工具变量满足核心假设[22]。而实际情况中,由于遗传物质和遗传机制的复杂性,MR研究存在一些不同于传统工具变量方法的问题。首先,在多基因体系结构中,虽然存在强效应的单核苷酸多态性(single nucleotide polymorphism, SNP),但更多的是弱效应SNP。应用弱效应SNP作为工具变量时,会降低模型估计的精度和效能[22]。其次,当用作工具变量的遗传变异具有多效性时,该工具变量会违背上述第二或第三条核心假设,成为无效工具变量,无效工具变量会使得所估计的因果效应值有偏,I型错误率增加[23]。另外,在目前广泛应用的基于汇总数据的MR研究中,还存在连锁不平衡、样本重叠等会影响研究结果准确性的问题。近年来,国内学者从上述几个问题出发,积极改进MR研究相关方法,力求通过对模型进行优化而得到更准确可靠的因果关联估计。

    从解决弱工具变量和多效性问题出发,Zhao等[24]在2019年提出了用于全基因组关联研究(genome-wide association studies,GWAS)汇总数据的贝叶斯加权孟德尔随机化(Bayesian weighted Mendelian randomization, BWMR)方法。该方法通过贝叶斯加权对异常值进行检测,可同时校正弱工具变量和横向多效性带来的偏倚。研究者同时构建了一种可变期望最大化算法来推断因果效应的后验平均值,并且导出了一个精确封闭公式来校正后验协方差。结果显示:相较于其他MR方法,BWMR方法在效应估计准确性、I型错误率控制和统计效能上均有更优的表现,特别是在工具变量存在强相关多效性时,仅BWMR方法可识别并控制其对效应估计的影响。在运用BWMR探索130种代谢物与93种复杂表型之间因果关系的实例研究中,其也有更为高效和稳定的表现。

    同样针对多效性问题,Xu等[25]在2021年提出了解决相关多效性及特异多效性的孟德尔随机化(MR approach accounting for correlated and idiosyncratic pleiotropy, MRCIP)方法。该方法放松了对工具变量的核心假设,即不要求所有工具变量均为有效工具变量。研究者用两种不同的模型分别解决相关多效性和特异性多效性。对于相关多效性,研究者构建随机效应模型,将多效性效应同时表示在模型中,并通过似然比对工具变量中相关多效性所占比例进行估计。对于特异性多效性,考虑到其对因果效应估计的影响大于一般相关多效性,研究者采用转换的Pearson残差对其进行加权,减小其权重的同时减小其对因果效应估计结果的影响。结果显示,在模型中存在无效工具变量时,MRCIP方法仍可得出有效的因果效应估计。

    GWAS是指在全基因组层面上开展的基因与疾病间的关联研究。然而,GWAS中获取的与暴露具有关联的遗传变异并不能完全解释疾病相关的生物学机制。并且,GWAS研究中的关联性分析是基于单个位点进行的,而SNP间的连锁不平衡现象会导致效应估计值之间存在信息重叠,会进一步造成MR估计的效应值有偏。基于这样的问题,林丽娟[26]在2019年提出基于方差—协方差结构校正的多工具变量孟德尔随机化(Mendelian randomization with refined instrumental variable from genetic score, MR-RIVER)方法。该方法将GWAS中提供的单位点效应值进行校正,将校正后的效应估计值作为权重计算基因得分,并以该得分作为工具变量进行暴露与结局间的因果效应估计。研究结果显示,在工具变量间存在相关关系的多工具变量MR研究中,MR-RIVER方法具有更高的检验效能和更准确的效应估计。

    TWAS集合了来自GWAS和基因表达研究的结果,在研究疾病基因调控机制中,可更好地阐明疾病与病因间的因果关联。不同于基于GWAS研究的MR研究,TWAS中用作工具变量的遗传变异普遍具有相关性,且更容易出现多效性问题。基于此,Yuan等[27]在2020年提出了用于TWAS的概率两样本孟德尔随机化方法(probabilistic Mendelian randomization with Egger assumption, PMR-Egger)。该方法基于MR似然框架,在允许工具变量间存在相关性的情况下,对模型中的水平多效性进行检验并控制,同时给出因果效应估计。结果显示:在各种模型参数设置情况下,PMR-Egger方法均有较好的稳健性,并且在水平多效性存在的情况下,I型错误率控制较好。同样针对TWAS研究,Liu等[28]于2021年在上述PMR-Egger方法的基础上进行扩展,将研究情形扩展至多个结局变量,提出了多结局PMR-Egger(multiple outcome PMR-Egger, moPMR-Egger)方法。模拟研究结果显示,相比于一般的单变量研究方法,moPMR-Egger方法在因果效应估计和I型错误率控制方面均有提高,同时该方法对水平多效性的识别和控制也有提高。研究者还应用moPMR-Egger方法分析了英国生物样本库(UK Biobank, UKB)中5个特征类别的11个特征。结果显示,moPMR-Egger方法识别出的基因关联比不同特征类别进行单一研究的方法多13.15%。

    大多数疾病都是遗传因素和环境因素共同作用的结果,且基因不仅可直接参与疾病的调控过程,还会通过影响机体受环境暴露的程度而影响疾病的发展过程。然而,目前基于GWAS的通路关联研究,多数没有考虑环境暴露相关基因可能带来的遗传混杂影响,从而降低了对疾病因果通路识别的准确性。基于此,Fan等[29]在2018年将MR与GWAS通路关联研究相结合,提出了基于MR分析的路径富集分析(Mendelian randomization-based pathway enrichment analysis, MRPEA)方法。该方法在应用GWAS汇总数据进行疾病相关通路的分析过程中,校正了环境暴露相关基因的影响,从而给出更加接近真实因果关系的结果。研究结果显示,与传统路径关联分析方法相比,MRPEA方法可提高对复杂疾病相关因果通路识别的准确性。

    生存数据是医学研究中常见的一类数据类型,由于生存数据更易受到研究中年龄、治疗史以及混杂因素的影响。因此,如何通过生存数据得出准确无偏的因果推断是一类亟待解决的问题。为此,Huang等[30]在2020年提出了一种应用于生存数据的半参数线性变换模型。该方法首先将生存时间和生存概率进行线性转换,后将线性变换后的生存时间和生存概率用于MR研究,进而估计暴露因素与生存结局间的因果效应。研究中构建了估计方程,该估计方程的渐近性对于混杂变量的分布没有要求,可规避由于未知的混杂变量而难以估计暴露和结局间关联性的困难。

    MR研究是工具变量方法的一个重要分支,而工具变量方法不仅在疾病因果推断方面有重要应用,在其他方面也有广泛应用。Li等[31]在2018年讨论了当治疗被错判(即存在测量误差)并且在治疗和效应之间有潜在的分类混杂因子时,工具变量方法对连续型干预变量二分类结果间因果效应的识别和估计。研究主要分为两个过程,首先研究者应用工具变量控制在干预和疾病结局间的潜在混杂因素,随后研究者探究了将工具变量用于解决研究中测量误差时可能带来的偏倚。研究结果显示,使用单个工具变量可有效排除潜在的混杂因素和测量误差导致的偏倚。并且根据模型识别结果,可以确定潜在分类混杂因子是否存在以及如何选择潜在影响因子的级别数。

    混杂偏倚是非随机化研究中重要的偏倚来源。大数据时代,随着人们对现实世界数据的日益关注,对控制混杂因素统计分析方法的要求也越来越高。PS通过匹配、分层、回归以及加权等方式,提高了组间均衡性,从而削弱或平衡协变量对效应估计的影响,达到“类随机化”的效果。MR研究可有效克服未知混杂和逆向因果问题所带来的偏倚,为推断暴露因素与结局之间的因果关系提供可靠的证据。近年来,国内学者在PS相关的匹配权重调整、均衡性评价指标以及MR研究过程中的多效性问题和弱工具变量问题中有所突破,期望未来在研究设计、模型构建以及统计学检验效能等方面有进一步的探索。同时,随着多学科交叉合作的发展,PS和MR方法与其他相关方法和分析结果的结合将有助于在基于“综合证据”时得到更加可靠的结论,为临床研究和公共卫生决策提供更多理论依据。

  • [1] Vandenbroucke JP. When are observational studies as credible as randomised trials?[J]. Lancet, 2004, 363(9422): 1728-1731. DOI: 10.1016/s0140-6736(4)16261-2.
    [2] 黄丽红, 魏永越, 陈峰. 如何控制观察性疗效比较研究中的混杂因素: (一)已测量混杂因素的统计学分析方法[J]. 中华流行病学杂志, 2019, 40(10): 1304-1309. DOI: 10.3760/cma.j.issn.0254-6450.2019.10.024.

    Huang LH, Wei YY, Chen F. Confounder adjustment in observational comparative effectiveness researches: (1) statistical adjustment approaches for measured confounder[J]. Chin J Epidemiol, 2019, 40(10): 1304-1309. DOI: 10.3760/cma.j.issn.0254-6450.2019.10.024.
    [3] Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects[J]. Biometrika, 1983, 70(1): 41-55. DOI: 10.1093/biomet/70.1.41.
    [4] 陈峰, 于浩. 临床试验精选案例统计学解读[M]. 北京: 人民卫生出版社, 2015.

    Chen F, Yu H. Statistical interpretation of selected cases of clinical trials[M]. Beijing: People's Medical Publishing House, 2015.
    [5] An WH. Bayesian propensity score estimators: incorporating uncertainties in propensity scores into causal inference[J]. Sociol Methodol, 2010, 40(1): 151-189. DOI: 10.1111/j.1467-9531.2010.01226.x.
    [6] Kaplan D, Chen JS. A two-step Bayesian approach for propensity score analysis: simulations and case study[J]. Psychometrika, 2012, 77(3): 581-609. DOI: 10.1007/s11336-012-9262-8.
    [7] 吴美京. 多组比较资料贝叶斯倾向性评分模型的构建及应用[D]. 上海: 第二军医大学, 2014.

    Wu MJ. Statistical modeling and application for multi-treatment Bayesian propensity score analysis[D]. Shanghai: Second Military Medical University, 2014.
    [8] 于菲菲. 分类资料的多水平倾向性评分模型构建及应用[D]. 上海: 第二军医大学, 2016.

    Yu FF. The study and application of multilevel propensity score model of categorical data in the hierarchical structure data[D]. Shanghai: Second Military Medical University, 2016.
    [9] 郭轶斌. 分类资料全局最优倾向性评分区间匹配的研究与应用[D]. 上海: 中国人民解放军海军军医大学, 2019.

    Guo YB. Research and application in global optimal propensity score interval matching for categorical data[D]. Shanghai: Naval Medical University, 2019.
    [10] 谢申祥, 范鹏飞, 宛圆渊. 传统PSM-DID模型的改进与应用[J]. 统计研究, 2021, 38(2): 146-160. DOI: 10.19343/j.cnki.11-1302/c.2021.02.011.

    Xie SX, Fan PF, Wan YY. Improvement and application of classical PSM-DID model[J]. Stat Res, 2021, 38(2): 146-160. DOI: 10.19343/j.cnki.11-1302/c.2021.02.011.
    [11] 郭威. 基于统计学习的逆概率加权方法研究及其在医学中的应用[D]. 上海: 中国人民解放军海军军医大学, 2018.

    Guo W. Research and application in medical studies of inverse probability weighting based on statistical learning[D]. Shanghai: Naval Medical University, 2018.
    [12] Gao Q, Zhang Y, Liang J, et al. High-dimensional generalized propensity score with application to omics data[J]. Brief Bioinform, 2021, 22(6): bbab331. DOI: 10.1093/bib/bbab331.
    [13] Flury BK, Riedwyl H. Standard distance in univariate and multivariate analysis[J]. Am Stat, 1986, 40(3): 249-251. DOI: 10.1080/00031305.1986.10475403.
    [14] 黄福强, 许军, 安胜利. 多组间协变量均衡性评价方法的研究[J]. 中国卫生统计, 2018, 35(2): 172-176. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGWT201802003.htm

    Huang FQ, Xu J, An SL. A research on methods of balance evaluation among the covariates of multiple groups[J]. Chin J Heal Stat, 2018, 35(2): 172-176. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGWT201802003.htm
    [15] Dong J, Zhang JL, Zeng SX, et al. Subgroup balancing propensity score[J]. Stat Methods Med Res, 2020, 29(3): 659-676. DOI: 10.1177/0962280219870836.
    [16] Wang XY, Li L, Wang L, et al. Propensity score-adjusted three-component mixture model for drug-drug interaction data mining in FDA Adverse Event Reporting System[J]. Stat Med, 2020, 39(7): 996-1010. DOI: 10.1002/sim.8457.
    [17] Katan MB. Commentary: Mendelian randomization, 18 years on[J]. Int J Epidemiol, 2004, 33(1): 10-11. DOI: 10.1093/ije/dyh023.
    [18] Emdin CA, Khera AV, Kathiresan S. Mendelian randomization[J]. JAMA, 2017, 318(19): 1925-1926. DOI: 10.1001/jama.2017.17219.
    [19] Smith GD, Lawlor DA, Harbord R, et al. Clustered environments and randomized genes: a fundamental distinction between conventional and genetic epidemiology[J]. PLoS Med, 2007, 4(12): e352. DOI: 10.1371/journal.pmed.0040352.
    [20] Evans DM, Davey Smith G. Mendelian randomization: new applications in the coming age of hypothesis-free causality[J]. Annu Rev Genomics Hum Genet, 2015, 16: 327-350. DOI: 10.1146/annurev-genom-090314-050016.
    [21] Paternoster L, Tilling K, Davey Smith G. Genetic epidemiology and Mendelian randomization for informing disease therapeutics: Conceptual and methodological challenges[J]. PLoS Genet, 2017, 13(10): e1006944. DOI: 10.1371/journal.pgen.1006944.
    [22] 高雪. 基于提高统计效能与校正多效性偏倚的改进孟德尔随机化模型构建及应用[D]. 太原: 山西医科大学, 2020.

    Gao X. The construction and application of improved Mendelian randomization model aiming at increasing statistical power and correcting for pleiotropic bias[D]. Taiyuan: Shanxi Medical University, 2020.
    [23] Sanderson E. Multivariable Mendelian randomization and mediation[J]. Cold Spring Harb Perspect Med, 2021, 11(2): a038984. DOI: 10.1101/cshperspect.a038984.
    [24] Zhao J, Ming JS, Hu XH, et al. Bayesian weighted Mendelian randomization for causal inference based on summary statistics[J]. Bioinformatics, 2020, 36(5): 1501-1508. DOI: 10.1093/bioinformatics/btz749.
    [25] Xu SQ, Fung WK, Liu ZH. MRCIP: a robust Mendelian randomization method accounting for correlated and idiosyncratic pleiotropy[J]. Brief Bioinform, 2021, 22(5): bbab019. DOI: 10.1093/bib/bbab019.
    [26] 林丽娟. 基于方差—协方差结构校正的孟德尔随机化方法及其在因果关联研究中的应用[D]. 南京: 南京医科大学, 2019.

    Lin LJ. Mendelian randomization method modified by the variance-covariance structure and the application in causal association studies[D]. Nanjing: Nanjing Medical University, 2019.
    [27] Yuan ZS, Zhu HH, Zeng P, et al. Testing and controlling for horizontal pleiotropy with probabilistic Mendelian randomization in transcriptome-wide association studies[J]. Nat Commun, 2020, 11(1): 3861. DOI: 10.1038/s41467-020-17668-6.
    [28] Liu L, Zeng P, Xue FZ, et al. Multi-trait transcriptome-wide association studies with probabilistic Mendelian randomization[J]. Am J Hum Genet, 2021, 108(2): 240-256. DOI: 10.1016/j.ajhg.2020.12.006.
    [29] Fan QR, Zhang F, Wang WY, et al. GWAS summary-based pathway analysis correcting for the genetic confounding impact of environmental exposures[J]. Brief Bioinform, 2018, 19(5): 725-730. DOI: 10.1093/bib/bbx025.
    [30] Huang YT. Mendelian randomization using semiparametric linear transformation models[J]. Stat Med, 2020, 39(7): 890-905. DOI: 10.1002/sim.8449.
    [31] Li W, Jiang ZC, Geng Z, et al. Identification of causal effects with latent confounding and classical additive errors in treatment[J]. Biom J, 2018, 60(3): 498-515. DOI: 10.1002/bimj.201700048.
  • 期刊类型引用(14)

    1. 卜宁,张露,夏季,高巍. 两样本双向孟德尔随机化的2型糖尿病与肺功能的因果关系研究. 重庆医学. 2025(01): 63-69+75 . 百度学术
    2. 郭紫薇,武庆娟,叶永安,陈兰羽,吕文良. 孟德尔随机化分析方法在非酒精性脂肪性肝病病因探索中的应用. 临床肝胆病杂志. 2024(03): 589-593 . 百度学术
    3. 阿衣古丽·阿布来提,辛莹,黄小荣. 基于两样本孟德尔随机化方法分析低密度脂蛋白胆固醇与哮喘的因果关系. 山西医科大学学报. 2024(03): 362-366 . 百度学术
    4. 隆丽芳,魏琳,王秋婷,谢嘉欣,朱鑫鑫,谢湘萁,林美珍. 体力活动、睡眠与衰老的关系:孟德尔随机化研究. 华西医学. 2024(05): 776-783 . 百度学术
    5. 柳怡敏,张丽娥,彭阳,李振宁,邹云锋. 基于孟德尔随机化的缺血性脑卒中和膜性肾病发病的因果关系研究. 中华疾病控制杂志. 2024(05): 561-565 . 本站查看
    6. 王子豪,李沛珊,夏欢,杜心雨,克力比奴尔·塞地尔丁,杨新玲. 遗传调控下免疫相关血浆蛋白对帕金森病的效应. 中华老年心脑血管病杂志. 2024(07): 806-810 . 百度学术
    7. 王兴斌,赵昌明,黄秋丽,王玲,张亚欣,杨得杰,王兆芬. 白细胞介素与肺结核因果关联的孟德尔随机化研究. 中华疾病控制杂志. 2024(07): 827-832+855 . 本站查看
    8. 何威,朱述可,李春雨,杜雪,李佳芮. 基于孟德尔随机化的肝功能和脂质代谢水平与睡眠障碍的因果关联分析. 临床肝胆病杂志. 2024(10): 2055-2061 . 百度学术
    9. 周琴,陈爱琴,吴金玉,王璨. 孟德尔随机化研究在衰弱病人病因探索中应用的研究进展. 护理研究. 2024(20): 3659-3662 . 百度学术
    10. 陈曦,杨玉平,何克林. 倾向性评分法在中医药研究中的应用概况. 中医杂志. 2024(21): 2269-2274+2280 . 百度学术
    11. 刘泽岩,周姝,张浩,程景林. 孟德尔随机化法探究TGF-β与AAMI后左室舒张末容积的关系. 安徽医学. 2023(05): 523-527 . 百度学术
    12. 孙春梅,张志强. 基于HIS系统真实世界数据熄风通脑胶囊治疗急性脑梗死疗效评价研究. 天津中医药. 2023(10): 1231-1236 . 百度学术
    13. 刘学伟,贾皇超,郭会军,许前磊,沈苹苹,李鹏宇,朱柯颖,姜琦,金艳涛. 后抗逆转录病毒联合疗法时期中医药防治艾滋病疗效评价思考. 中华中医药杂志. 2023(11): 5353-5356 . 百度学术
    14. 尚文茹,柯立鑫,王子怡,王志飞,杨克虎,卢存存. 牛奶、咖啡摄入与非酒精性脂肪性肝病的因果关联:两样本孟德尔随机化研究. 中国循证医学杂志. 2023(12): 1373-1377 . 百度学术

    其他类型引用(2)

  • 加载中
计量
  • 文章访问数:  1424
  • HTML全文浏览量:  676
  • PDF下载量:  232
  • 被引次数: 16
出版历程
  • 收稿日期:  2021-06-04
  • 修回日期:  2021-08-25
  • 网络出版日期:  2022-03-17
  • 刊出日期:  2022-03-10

目录

/

返回文章
返回