应用机器学习算法预测心脏搭桥术后急性肾损伤的多中心队列研究
2023年11月24日,施普林格出版集团(Springer)旗下杂志《BMC Medical Informatics and Decision Making》在线发表了来自上海交通大学医学院附属胸科医院心脏外科张杨杨主任医师团队的最新临床研究结果:"Machine-learning predictions for acute kidney injuries after coronary artery bypass grafting: A real-life muticenter retrospective cohort study"(机器学习模型预测冠状动脉旁路移植术后急性肾损伤:一项多中心回顾性队列研究)。https://doi.org/10.1186/s12911-023-02376-0
贾天晨硕士研究生、徐凯硕士研究生、白云硕士研究生为文章的共同第一作者,张杨杨主任医师、李明亮主治医师和赵鑫主任医师为文章的共同通讯作者。
主要内容
冠状动脉旁路移植(coronary artery bypass grafting,CABG)是目前临床上治疗严重 冠心病 (coronary heart disease,CHD)的主要外科方法,也是目前世界各地开展最多的心脏手术。CABG术后并发症包括围术期 心肌缺血 、 心律失常 、急性肾损伤(acute kidney injury,AKI)、神经系统并发症和出血。术后AKI是心脏手术后常见的并发症,发生率通常为 15%-30%。临床实践中,随着社会老年化程度的加重,手术患者基础疾病增多和器官储备能力下降,术后AKI的发生率在逐年增高, CABG 术后AKI可能发展为 慢性肾功能衰竭 甚至终末期肾病,增加术后近、远期死亡风险。术后AKI的高发病率和由此引起的高死亡率使其成为心脏外科手术风险管理的棘手问题。然而CABG 术后 AKI 的发病机制非常复杂,尚未完全研究明了。现有的心脏术后AKI预测模型仅有零星报道,且都是基于欧美人群建立的,不太适用于中国患者。因此,明确中国患者术后 AKI 的风险因素并探索 CABG 术后 AKI 的预测模型迫在眉睫。
机器学习(Machine-learning,ML)是人工智能的一个分支,已越来越多地应用于各个领域的海量数据分析。近年来,随着信息技术的发展,医院电子病历系统每年都会产生大量数据,这促使许多健康和生物医学研究人员应用机器学习从不断增长的生物医学数据库中提取有价值的信息,特别在疾病的预测模型方面有了长足的发展。应用机器学习算法预测 CABG术后AKI一直未有研究。
上海交通大学医学院附属胸科医院张杨杨主任医师研究团队长期致力于心脏手术围手术期风险研究,联合江苏省人民医院、山东大学齐鲁医院和宁夏医科大学总医院三家地区性的心脏中心共同进行该项研究。研究纳入华东地区两所心脏外科的2780例单纯CABG患者数据,按 8:2 的比例随机分配到模型训练组和验证组,对模型进行建立和验证,筛选出最优的模型。为进一步评估机器学习模型的外部适用性(泛化性能),研究团队选取了中国东部、西北部两家大型心脏中心的2051例单纯CABG患者进入外部验证组。研究建立了 LightGBM、SVM、Softmax 和 RF 等4个机器学习预测模型。研究团队使用AUC曲线、H-L拟合优度检验、NRI、IDI、Bland-Altman 图和DCA曲线分析等统计学方法对上述4个模型进行了多维度的评估。最终,LightGBM预测模型无论在内部验证中还是外部验证中均表现出优秀的预测能力,该模型有望成为中国CABG患者预测术后AKI的临床实用工具。
图1:直方图算法、策略和 LightGBM 构建过程
该研究团队还利用 SHAP 算法得出各纳入变量对机器学习模型预测结果的重要性,解释机器学习方法选取的变量,使机器学习过程不再是“黑箱过程”,为临床医师更好的理解AKI提供了理论支持。术后 24 小时内的血清肌酐(serum creatinine,Scr)在所有预测范围内都具有最强的预测价值,其次是术前最后一次 Scr 水平、体表面积、 肺动脉高压 和术前估计肾小球滤过率(estimated glomerular filtration rate,eGFR)。
图2.发生术后AKI和未发生术后AKI患者的SHAP分析
张杨杨主任研究团队提供了一种基于 LightGBM 的CABG术后AKI的预测模型,该模型可准确预测 CABG 手术后的 AKI发生,可以帮助心脏外科医生提前发现CABG术后发生AKI高风险的患者,进行及时干预和个性化治疗,以期减少术后相关并发症的发生。
摘要
背景 :冠状动脉旁路移植术(CABG)术后急性肾损伤(AKI)与不良预后有关。本研究旨在应用一种新的机器学习(ML)方法建立 CABG 术后急性肾损伤的预测模型。
研究方法 :从华东地区两家医学中心共招募了 2780 名首次接受单纯CABG 的患者。然后将数据集随机分为模型训练(80%)和模型测试(20%)。在 Python 上分别建立了基于 LightGBM、支持向量机(SVM)、Softmax 和随机森林(RF)算法的四种 ML 模型。来自另外两家医疗中心的共 2051 名患者被分配到外部验证组,以验证 ML 预测模型的性能。使用接收者操作特征曲线下面积(AUC)、Hosmer-Lemeshow 拟合度统计量、Bland-Altman 图和决策曲线分析对模型进行了评估。LightGBM 模型的结果使用 SHapley Additive exPlanations (SHAP) 进行解释。
结果 :建模组的术后 AKI 发生率为 13.4%。同样,外部验证组中两家医学中心的术后 AKI 发生率分别为 8.2% 和 13.6%。LightGBM 的预测效果最好,在内部验证组的 AUC 为 0.8027,在外部验证组的 AUC 为 0.8798 和 0.7801。SHAP显示了术后AKI的前20个预测因素,并根据重要性进行了排序,预测结果前三位的特征是术后24小时内的血清肌酐、术前最后一次Scr水平和体表面积。
结论 :本研究提供了一个 LightGBM 预测模型,可准确预测 CABG 手术后的 AKI。该 ML 模型在内部和外部验证中均显示出良好的预测能力。它可以帮助心脏外科医生识别 CABG 术后可能发生 AKI 的高危患者。
Abstract
Background : Acute kidney injury (AKI) after coronary artery bypass grafting (CABG) surgery is associated with poor outcomes. The objective of this study was to apply a new machine learning (ML) method to establish prediction models of AKI after CABG.
Methods : Totally 2780 patients from two medical centers in East China who underwent primary isolated CABG were enrolled. Then the dataset was randomly divided for model training (80%) and model testing (20%). Four ML models based on LightGBM, Support vector machine (SVM), Softmax and random forest (RF) algorithms respectively were established on Python. A total of 2051 patients from two other medical centers were assigned to an external validation group to verify the performances of the ML prediction models. The models were evaluated using the area under the receiver operating characteristics curve (AUC), Hosmer-Lemeshow goodness-of-fit statistic, Bland-Altman plots, and decision curve analysis. The outcome of the LightGBM model was interpreted using SHapley Additive exPlanations (SHAP).
Results : The incidence of postoperative AKI in the modeling group was 13.4%. Similarly, the incidence of postoperative AKI of the two medical centers in the external validation group was 8.2% and 13.6% respectively. LightGBM performed the best in predicting, with an AUC of 0.8027 in internal validation group and 0.8798 and 0.7801 in the external validation group. The SHAP revealed the top 20 predictors of postoperative AKI ranked according to the importance, and the top three features on prediction were the serum creatinine in the first 24h after operation, the last preoperative Scr level, and body surface area.
Conclusion : This study provides a LightGBM predictive model that can make accurate predictions for AKI after CABG surgery. This ML model shows good predictive ability in both internal and external validation. It can help cardiac surgeons identify high-risk patients who may experience AKI after CABG surgery.
共同第一作者