贝叶斯网络模型识别心脏手术后AKI高危患者
研究背景
心脏手术后急性肾损伤(Cardiac surgery associated acute kidney injury, CSA-AKI)的发生是多种内源性和围手术期相关外源性因素共同作用的结果,且因素间存在复杂的交互作用,单个因素的致病效应可能受到其他因素共存情况的影响。传统分析方法中Logistic回归需要以变量独立性为前提条件,在处理这种共线/高维数据时统计效能不佳,有必要开发能有效处理海量复杂数据的人工智能算法等优化统计方法。
贝叶斯网络分析(Bayesian networks)源自应用概率传播理论,兼具图形论的直观性和概率论的可传播性。它不仅可以描述变量间的复杂关系,还可以基于网络结构实现概不确定性信息的推理。在医学大数据挖掘中,贝叶斯网络分析可以提取出事先未知但又有潜在预测价值的有效信息,为全面识别发病危险因素和精准预测发病风险提供科学依据。
研究方法
我们以2009~2016年我院心脏手术患者队列人群为研究对象。其中2009~2014年数据作为训练集用于构建模型(n=3639),2015~2016年数据作为测试集用于外部验证(n=1894)。借助电子病历系统和自行设计问卷同步收集CSA-AKI术前、术中和术后相关危险因素。采用group LASSO方法筛选出可用于预测的相关变量,明确CSA-AKI发病危险因素集;通过贝叶斯网络分析进一步描述变量间相互作用并评价模型预测效能。
研究结果
1. 基于Group LASSO的CSA-AKI危险因素筛选
训练集3639名研究对象中有1364例患者被诊断为CSA-AKI(37.5%)。其中405例患者迅速发展为重度AKI(2-3期)。Group LASSO变量筛选进入CSA-AKI模型的变量包括年龄、性别、BMI、血肌酐(SCr)、血尿酸(SUA)、蛋白尿、左室射血分数(LVEF)、血小板、手术类型、主动脉夹闭时间(ACCT)、超滤量、术后中心静脉压(CVP)水平;纳入危重CSA-AKI模型的变量包括龄、BMI、SCr、SUA、心功能NYHA分级、LVEF、血小板、直接胆红素(DBiL)、蛋白尿、手术类型、ACCT、超滤体积、CVP水平。然后,我们将这些预测因子进行多元logistic回归,以量化CSA-AKI和严重AKI的关联强度(表1)。
2. CSA-AKI贝叶斯网络模型构建
贝叶斯网络分析结果显示:性别、LVEF、SCr、SUA、血小板和ACCT作为AKI的父节点。超滤量及术后CVP也与子节点CSA-AKI相关(图1a)。手术类型通过ACCT间接与CSA-AKI相关,而蛋白尿则是通过影响SCr水平与AKI相关。危重 AKI 网络中,大部分变量和关系与CSA-AKI模型相似。不同之处在于:年龄和蛋白尿与严重AKI直接相关;新节点NYHA分级与LVEF、手术类型有关,并通过SUA、ACCT与重度AKI形成关系;DBiL通过蛋白尿和SCr水平与重度AKI有间接关系(图1b)。
3. 贝叶斯网络模型推理和预测效能评价
在给定某些已知自变量状态的情况,我们可以利用贝叶斯网络模型已有的先验参数可以在数据缺失的情况下预测CSA-AKI概率。假定一名50岁男性患者在瓣膜手术中接受1.5小时ACCT和3500 mL超滤,术后维持CVP为9 mmHg,根据模型获得的先验信息,AKI的最大后验概率为71.6%(图2a)。而如果术中合理控制ACCT和超滤水平并及时纠正CVP,AKI的发生率显著降低到16.1%(图2b)。
在疾病预测方面,贝叶斯网络在预测 CSA-AKI和危重 AKI的 AUC值分别为 0.755和 0.845;10倍交叉验证和测试集外部验证下 AUC 仍保持较好分辨力水平(图3)。提示贝叶斯网络模型对CSA-AKI的预测具有较高的适用性。
研究结论
① 贝叶斯网络可以直观地描述CSA-AKI的自变量之间的相互作用以及其与因变量之间的复杂网络,这有助于全面探讨疾病因果联系和发现未知潜在危险因素。
② 贝叶斯网络具有良好的处理缺失数据能力,可以基于网络先验参数,利用有限的变量实现疾病发病风险个性化精准预测。
③ 考虑到CSA-AKI的复杂和动态病理,进行干预性临床试验在伦理上具有挑战性。贝叶斯网络模型的因果推论可以模拟干预的效果。避免血流动力学不稳定,谨慎控制术后CVP水平有助于减轻危险AKI。这些措施几乎是免费的,可以作为CSA-AKI二级预防战略在日常临床实践中实施。
原文可点击“阅读原文”下载