深度学习模型需要大量且多样性的数据“喂养”,但医疗领域对用户个人隐私保护有着极高的要求,这使得多样高质的医疗数据收集和医疗AI模型的开发迭代面临较大的挑战。联邦学习作为一种分布式的机器学习方法, 可以在不共享数据的情况下对多中心的数据进行联合建模,在保证数据安全的同时联合学习某一特定应用模型。
DSL框架由一个位于中央服务器的数据生成器和多个位于不同数据中心的数据鉴别器组成。在学习过程中,中央生成器负责生成“假”的图像数据,并发送给各个数据中心,各个数据中心用本地的真实数据和收到的“假”数据进行对比后将结果回传给中央服务器。中央生成器可以作为“数据生产工厂”,根据反馈结果及给定的约束条件(标注)生成高质量仿真图像数据,从而得到一个由生成数据组成的数据库。
该数据库可以替代真实数据,用于下游具体任务的学习,使下游模型的更新迭代不再受到真实数据可访问性的制约。同时,该方法通过分布式架构和联邦学习方式保证中央服务器无需接触数据中心的真实数据,也不需要同步各中心的鉴别器模型,有效保障了数据安全和隐私保护。
DSL框架已通过包括大脑多序列MRI图像生成及下游的大脑肿瘤分割任务等多个具体应用的验证,具有较强的可扩展性支持多模态数据中缺失模态数据的生成、持续学习等不同场景。
在瑞金医院的展区,SenseCare®肝脏手术智能规划系统凭借高效精准的病灶检出、三维重建、手术规划等功能,吸引不少观众驻足。从二维的肝脏CT影像,变为一目了然的三维立体模型,只需短短几分钟。轻轻拖动鼠标,就可在模型上自定义切面、角度、血管离断位置等,帮助医生几分钟内完成精准的肝脏手术规划。
DSL框架的构建,也有利于推动MaaS服务模式的发展。MaaS的医疗大模型在数据学习过程中,同样会遇到医疗数据隐私安全保护的问题,而基于DSL框架,可以有效地从多中心多样性数据中建立数据集仓库,通过生成数据,在保障数据安全和隐私的同时为大模型的开发迭代提供创新思路。细化到具体应用场景,DSL框架可助力医疗机构高效开展跨中心、跨地域模型训练工作。
随着DSL框架的推出,医疗大模型的训练将有望突破“数据孤岛”的桎梏,一定程度上降低了医疗大模型的训练门槛,有助于加速模型开发迭代,使医疗大模型的应用范围得以进一步延伸,覆盖更多临床医疗问题。
相关阅读 >>
易鑫车贷客户服务电话大全已更新2023(今日更新中)科技大公司上万人研究AI,为何比不上openAI小团
uiuc 李博:从技术角度实现 AI 可信,从博弈论、对抗攻击,到逻辑推理
苹果、amd、英伟达争抢台积电AI芯片订单,相关芯片将在4月后产出
同盾科技李晓林:可信AI生态系统,将成为下一代AI医疗的「基础设施」
更多相关阅读请进入《AI》频道 >>