深度学习属于人工智能的一种,在医疗领域,它可以准确地利用CT扫描图像找到大脑供血动脉的阻塞,由于这种阻塞导致的中风占比很大,所以深度学习的使用,将有助于帮医生更快地诊断和治疗中风患者。
研究人员的目标是尽最大可能减少确诊时间,因为尽早治疗这种阻塞至关重要。
该研究项目负责人Matthew Stib是位于罗得岛州首府普罗维登斯的布朗大学沃伦·阿尔伯特医学院放射科的住院医生。他表示:“对于这种对时间非常敏感的诊断而言,几分钟都很重要。我们在(治疗)时间上减少一分钟都会令患者的无残障寿命延长一周。”
CT血管造影扫描是检测这些阻塞的标准方法,几分钟内就可以完成。但通常,只有那些经过训练的放射科医生才能识别出现的阻塞,而在医院繁忙或没有常驻专家的情况下,宝贵的时间可能就流失了。
为了减少治疗这些患者的时间,Stib及其同事与布朗大学的计算机科学系合作开发了一种开源深度学习算法系统,可以评估CT图像及识别大的血管阻塞。
研究人员首先用拍摄的疑似中风患者的数百张CT图像对系统进行训练,然后再做包含62位患者在内的测试模拟,目的是看这个系统是否可以正确识别出患有动脉阻塞的患者。
▲笔尖指处显示CT血管造影图里的冠状动脉形状(图:Getty)
据了解,他们还同时用了单相和多相CT血管造影技术,以确定哪种技术与深度学习系统的结合可以提供更好的效果。多相CT血管造影可在扫描过程的多个时间点上拍摄图像,因此与单相CT血管造影比能提供更详细的图像,单相CT血管造影则只取一个时间点。
上述的深度学习系统在分析单相图像时识别大血管阻塞时的精度仅为中等。但使用多相图像时,精度则会显着提高,可以100%地成功识别出阻塞,尽管也错误地将阴性对照组中的几个人(31位患者中的7位)归为有阻塞类。
Stib表示,“这些结果非常不错。我们其实就是想优化模型的敏感性,确保我们能够找到每一个阳性患者,因为漏掉一个会有非常可怕的后果。”他指出,深度学习之前也被用来评估CT血管造影图像,但用深度学习系统评估多相CT图像却是首次。据他所知,此次用到的算法也是首次开源,这意味着,其他研究人员也可以根据需要使用和开发这个系统。
未来,研究团队计划进一步验证该系统,他们将在自己的医院进行测试,目的是要看这个系统在紧急情况并且有较大数量患者群体时使用能否达到同样精度。如果系统的精度可以保持就可以将这个系统推广到其他医院和诊所,进而帮助快速诊断疑似中风的患者。
Stib解释说:“该算法并不能取代放射科医生的功能,而只是试图加快诊断时间……如果放射科医生不在周围或者工作流量太大,患者的检查结果无法及时处理,这时就会出现警报提示可能存在的阻塞,应该有人跟进。”他表示,“我认为未来的放射科医生需要接受这项新技术,要认识这项新技术在提高效率和准确性方面的潜在附加价值。”
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。