PG(平台电子)中国-官方网站

CSA2023丨易斌教授:围术期大数据研究的设计和注意点-PG电子集团

CSA2023丨易斌教授:围术期大数据研究的设计和注意点

  

CSA2023丨易斌教授:围术期大数据研究的设计和注意点

  集成学习(随机森林;自适应提升[Adaboost];梯度提升决策树[GBDT];极端梯度提升[XGBoost])

  目前基本上都是预警类研究,高质量数据集支撑下单用深度学习可以有效预测围术期各种危重症的发生,然而技术逐渐被掌握,基于深度学习的预警类研究越来越内卷:一投就中,一投就拒。主要瓶颈包括围术期大数据的质量、问题鲁棒性问题(外部验证问题)、算法问题等。增加投稿命中率有如下建议:

  一家医院建模,另外医院作为外部验证惨不忍睹:“灵敏度、精确率、召回率、AUC”。三家医院的离散度巨大,尤其华西医院。

  多中心/大样本的模型外部验证明显好于单中心模型:无论多中心外部融合验证、还是分别验证效果均佳,提示模型的“泛化性”更好。

  多团队的联合攻关:互为研究参与者,从合作方拿走二级数据(而非原始数据,可以有效避免数据壁垒问题)。

  可以预计AI的研究很快会代替RCT研究的同时,单中心的AI研究将被淘汰(内卷加深),而多中心/大样本建模、单/多中心验证是未来方向。多中心/大样本的模型外部验证明显好于单中心模型,目前本团队正在进行的一项利用术前指标预测术后呼吸并发症的研究,涉及的三家医院分别进行了单中心外部验证,效果较好,提示模型的“泛化性”良好。

  传统机器学习的算法:k近邻、线性模型、决策树、朴素贝叶斯、逻辑回归、支持向量机以及集成学习等

  强化学习(Reinforcement learning,RL)是机器学习的子领域,目前外科领域高度关注RL。只有强化学习框架下的深度学习,才能实现多目标优化的医疗决策研究。例如,把某项疾病(比如冠心病患者的围术期管理)的治疗用药过程、阶段效果以及最终结局告诉RL,达到一定的例数后,会返给你目前样本量下最优结局下的最优用药方案。

  强化学习常用贝叶斯网络(Bayesian networks,BNs)和马尔可夫决策过程(MDP)建模和解决,其中BNs主要用于处理简单低维的问题如病人情况良好的简单手术类型,而MDP的高维复杂数据有先天优势,可用于复杂手术类型和危重患者。我们团队开发了一种自我监督因果特征强化学习方法用于非侵入性血红蛋白预测。

  做正确的医疗决策难,围术期麻醉管理中动态、持续做正确决策更难。相比预测类研究,决策类研究难度急剧上升。

  强化学习(Reinforcement Learning,RL)是机器学习的子领域,目前外科领域开始高度关注RL。只有强化学习框架下的深度学习:才能实现多目标优化的医疗决策研究。例如,把某项疾病(比如冠心病患者的围术期管理)的治疗用药过程、阶段效果以及最终结局告诉RL,达到一定的例数后,会返给你目前样本量下最优结局下的最优用药方案。

  强化学习常用贝叶斯网络(Bayesian networks,BNs)和马尔可夫决策过程(MDP)建模和解决。其中BNs主要用于处理简单低维的问题如病人情况良好的简单手术类型,而MDP的高维复杂数据有先天优势,可用于复杂手术类型和危重患者。

  麻醉学的围术期管理必须关注多目标决策优化。自2021年起,外科学开始高度关注多目标优化,包括循环管理、容量管理、麻醉深度管理、手术方式、基础疾病管理、疼痛管理、心理管理等。单目标的优化,可能有不可控的结果(例如某项研究:阿片类药物为目标,对疼痛满意度提高6%,然而术后安全事件显著增加)。

  ERAS措施太多,有过度嫌疑:明显加重医护工作量、浪费资源;期望去除“无效”部分;

  ERAS的RCT研究都是单目标优化:传统RCT研究无PG电子法完成多目标优化(分组问题),需要新的研究方法;

  多目标优化研究可能有不同的结果;各ERAS措施之间,可能存在明显相互影响;

  合成谬误(Fallacy of Composition):由萨缪尔森提出,对局部说来是对的东西。仅仅由于它对局部而言是对的,便说它对总体而言也必然是对的,是一种谬误。在经济学领域中,十分肯定的是:微观上而言是对的东西,在宏观上并不总是对的;反之,在宏观上是对的东西,在微观上可能是十分错误的。

  利用贝叶斯网络优化ERAS麻醉决策,可能是第一篇麻醉决策多目标优化领域的文章,筛选可能有争议的18个ERAS相关麻醉决策,期望形成综合ERAS措施推荐,主要结局指标包括住院时间、住院费用等。

  科学问题:迄今无预防血栓、减少补体激活、减少炎性因子相关的指导性具体用药方案(依据指南和专家共识);

  数据来源(MIMIC IV)506例术后发生脓毒症ICU患者,120例死亡;

  研究结论:对于术后脓毒症患者,采用1.38-1.88ug/kg/h的肝素,可有效降低SPG电子OFA评分,利于患者的康复。该研究方法可以在复杂的不同病例、不同时段变化的治疗方案以及病情复杂变化中,有效找出最优化的个体化方案,常规RCT研究无法完成,因此具备较佳应用前景。

  全部参数实时动态的闭环,为麻醉用药机器人提供前期基础(目前的闭环(BIS+TCI)麻醉管理过于粗糙)(技术成熟;缺乏标注数据;专家知识替代是目前最好方法)

  ERAS研究新领域:某些有争议的围术期管理措施/药物,怎么组合才是达到患者最早出院/费用最低?(团队研究技术基本成熟,高质量数据集是难点,欢迎合作)

  基石模型(Foundation Models),也称大型语言预训练模型,是基于大数据打造的,具有庞大网络结构和大量参数的深度学习模型。基石模型起源于2017年Vaswani等人提出的Transformer模型:基于注意力机制,具有并行运算和高可扩展性;2018年Google Al语言团队在其基础上提出BER模型:上下文理解能力和记忆能力。

  通用模型还包括谷歌GLam和PaLM,国内的“悟道”、“文心一言”。通用模型上直接开展专业应用的报道,等于“有一个外行帮你使用百度,再给你写一个报告”。大模型和普通模型区别:

  常规模型需要标注,大模型的零样本学习不需要标注:目前只有大模型才能完成闭环麻醉管理;

  常规模型为单任务,大模型多任务之间的知识迁移和共享表示:只有大模型支持多种风险的同时评估、风险预警和决策支持;

  常规模型泛化性差;大模型零样本学习、多任务学习、分布式训练的方法(联邦学习):只有大模型能最终解决模型的推广性问题;

  麻醉学的科学问题借助围术期大数据研究是必然趋势:可以完成RCT无法应用的研究,建议尽早介入;

  随着研究的深入,围术期大数据研究越来越多,内卷严重,严谨的设计+多中心研究(工作量越来越大);

  研究的难点在于高质量数据集:要么来自于知名数据库,要么提供足够的佐证证明数据的质量(投稿的关键)。

  中华医学会麻醉学分会委员;全军麻醉青年委员会副主任委员;重庆市医学会麻醉学分会副主任委员;重庆市医师会麻醉学分会常委。

  重庆英才·创新领军人才,陆军科技英才,重庆医师协会“优秀麻醉医师奖”,陆军军医大学优秀研究生导师。

  主持国家自然科学基金项目 5 项,主持国家重点研发计划、国家科技支撑计划分课题各 1 项、主持重庆市教改重点课题 1 项以及中国学位与研究生教育委员会等教学课题 4 项;重庆市课题 4 项;第一/通讯作者发表SCI 40 篇(TOP 6 篇,最高分 17.649);参加了“北京小汤山抗击非典”、“汶川抗震救灾”、“2020年武汉抗疫”“2022年上海抗疫”等。