霁彩华年,因梦同行—— 庆祝深圳霁因生物医药转化研究院成立十周年 情绪益生菌PS128助力孤独症治疗,权威研究显示可显著改善孤独症症状 PARP抑制剂氟唑帕利助力患者从维持治疗中获益,改写晚期卵巢癌治疗格局 新东方智慧教育发布“东方创科人工智能开发板2.0” 精准血型 守护生命 肠道超声可用于检测儿童炎症性肠病 迷走神经刺激对抑郁症有积极治疗作用 探索梅尼埃病中 MRI 描述符的性能和最佳组合 自闭症患者中痴呆症的患病率增加 超声波 3D 打印辅助神经源性膀胱的骶神经调节 胃食管反流病患者耳鸣风险增加 间质性膀胱炎和膀胱疼痛综合征的临床表现不同 研究表明 多语言能力可提高自闭症儿童的认知能力 科学家揭示人类与小鼠在主要癌症免疫治疗靶点上的惊人差异 利用正确的成像标准改善对脑癌结果的预测 地中海饮食通过肠道细菌变化改善记忆力 让你在 2025 年更健康的 7 种惊人方法 为什么有些人的头发和指甲比其他人长得快 物质的使用会改变大脑的结构吗 饮酒如何影响你的健康 20个月,3大平台,300倍!元育生物以全左旋虾青素引领合成生物新纪元 从技术困局到创新锚点,天与带来了一场属于养老的“情绪共振” “华润系”大动作落槌!昆药集团完成收购华润圣火 十七载“冬至滋补节”,东阿阿胶将品牌营销推向新高峰 150个国家承认巴勒斯坦国意味着什么 中国海警对非法闯仁爱礁海域菲船只采取管制措施 国家四级救灾应急响应启动 涉及福建、广东 女生查分查出608分后,上演取得理想成绩“三件套” 多吃红色的樱桃能补铁、补血? 中国代表三次回击美方攻击指责 探索精神健康前沿|情绪益生菌PS128闪耀宁波医学盛会,彰显科研实力 圣美生物:以科技之光,引领肺癌早筛早诊新时代 神经干细胞移植有望治疗慢性脊髓损伤 一种简单的血浆生物标志物可以预测患有肥胖症青少年的肝纤维化 婴儿的心跳可能是他们说出第一句话的关键 研究发现基因检测正成为主流 血液测试显示心脏存在排斥风险 无需提供组织样本 假体材料有助于减少静脉导管感染 研究发现团队运动对孩子的大脑有很大帮助 研究人员开发出诊断 治疗心肌炎的决策途径 两项研究评估了医疗保健领域人工智能工具的发展 利用女子篮球队探索足部生物力学 抑制前列腺癌细胞:雄激素受体可以改变前列腺的正常生长 肽抗原上的反应性半胱氨酸可能开启新的癌症免疫治疗可能性 研究人员发现新基因疗法可以缓解慢性疼痛 研究人员揭示 tisa-cel 疗法治疗复发或难治性 B 细胞淋巴瘤的风险 适量饮酒可降低高危人群罹患严重心血管疾病的风险 STIF科创节揭晓奖项,新东方智慧教育荣膺双料殊荣 中科美菱发布2025年产品战略布局!技术方向支撑产品生态纵深! 从雪域高原到用户口碑 —— 复方塞隆胶囊的品质之旅
您的位置:首页 >国内科研 >

特别报告列出了处理放射学 AI 偏差的最佳实践

根据发表在《放射学:人工智能》杂志上的一份特别报告,随着人工智能 (AI) 在放射学中的使用越来越多,在将机器学习系统用于现实世界的临床场景之前,最大限度地减少机器学习系统中的偏差至关重要。

该报告是三部分系列的第一篇,概述了机器学习系统开发的数据处理阶段使用的次优实践,并提出了缓解它们的策略。

“在开发机器学习系统的数据处理阶段,会发生 12 种次优实践,每一种都可能使系统产生偏见,”放射学教授兼医学博士 Bradley J. Erickson 说。明尼苏达州罗切斯特梅奥诊所的人工智能实验室。“如果这些系统性偏差未被识别或无法准确量化,则会出现次优结果,从而限制人工智能在现实世界中的应用。”

Erickson 博士表示,正确处理数据的话题越来越受到关注,但关于正确管理大数据的指南却很少。

“监管挑战和转化差距仍然阻碍了机器学习在现实世界临床场景中的实施。然而,我们预计放射学 AI 系统的指数增长将加速消除这些障碍,”埃里克森博士说。“为了准备机器学习系统以供采用和临床实施,我们必须尽量减少偏见。”

在报告中,Erickson 博士和他的团队针对机器学习系统开发的四个数据处理步骤(每个数据处理步骤三个)中出现的 12 种次优实践提出了缓解策略,包括:

数据收集——数据集识别不当、数据来源单一、数据来源不可靠

数据调查——探索性数据分析不充分,没有领域专业知识的探索性数据分析,未能观察到实际数据

数据拆分——数据集之间的泄漏、不具代表性的数据集、对超参数的过度拟合

数据工程——不正确的特征删除、不正确的特征重新缩放、缺失数据的管理不善

埃里克森博士说,医学数据通常远非理想地适合作为机器学习算法的输入。

“这些步骤中的每一个都可能容易出现系统性或随机性偏差,”他说。“开发人员有责任在数据采样、去识别、注释、标签和管理缺失值等具有挑战性的场景中准确处理数据。”

根据该报告,数据收集前的仔细规划应包括对临床和技术文献的深入审查以及与数据科学专家的合作。

“多学科机器学习团队应该拥有同时具备数据科学和领域(临床)专业知识的成员或领导者,”他说。

为了开发更加异构的训练数据集,Erickson 博士和他的合著者建议从不同地理位置的多个机构收集数据,使用来自不同供应商和不同时间的数据,或者包括公共数据集。

“创建一个强大的机器学习系统需要研究人员进行侦探工作并寻找数据可能欺骗你的方式,”他说。“在你将数据放入训练模块之前,你必须对其进行分析,以确保它反映你的目标人群。人工智能不会为你做这件事。”

Erickson 博士说,即使经过出色的数据处理,机器学习系统仍然容易出现明显的偏差。放射学:人工智能系列的第二和第三篇报告侧重于模型开发和模型评估和报告阶段出现的偏差。

“近年来,机器学习已在许多临床研究领域证明了它的实用性,从重建图像和假设检验到改进诊断、预后和监测工具,”埃里克森博士说。“这一系列报告旨在识别机器学习开发过程中的错误做法,并尽可能多地减少这些做法。”

标签:

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!