匹兹堡大学医学中心(UPMC)是一家价值230亿美元的非营利性医疗保健服务商兼保险机构,在宾夕法尼亚州、纽约州、马里兰州以及国外多地设有分支机构。作为宾夕法尼亚州规模最大的非政府组织,UPMC拥有92000多名员工、40家医院、800个医生办公室及门诊点,外加超过400万享受其保险服务的投保会员。
UPMC拥有多个世界一流医学专业,其中之一正是活体肝脏移植(LDLT)。从全美范围来看,活体肝脏移植只是一个小众门类,全部中心每年的移植案例总和也不过500例左右。但UPMC拥有全美最大的活体供体诊所,因此成为解决脏器来源不足难题的急先锋。与全球绝大部分国家一样,美国的肝移植患者们同样需要经历漫长的等待期,而很多病人也因为不熟悉相关流程而白白错过了能够与自己配型的宝贵器官。UPMC提倡推广活体肝脏移植方案,借此缩短患者等待遗体器官的周期。
UPMC的临床医生和管理人员最终得出结论,如果供应商能够有效将服务两端的人群联系起来,就能带来巨大的社会价值、拯救生命于危难。然而这部分群体规模极小,以往很难进行有针对性地追踪。相当一部分医生甚至根本不知道还有活体供体移植这种选项,因此推广服务的第一步就是开展广泛的意识培训。
UPMC与Squark
由营销情报总监Jake Collins领导的UPMC营销情报小组最擅长接触潜在患者。Collins拥有数据分析背景,知道该如何引领UPMC接触潜在患者,同时遵循HIPAA指南保护患者隐私。UPMC的营销情报小组维护有一套强大的全国受众数据库,其中包含关于每位患者的相关变量。他知道在典型的传统发现模式下,UPMC需要接触约一万人才能找到一位可能的移植候选者;不过在数据与统计分析等手段的支持下,这个数字完全可以被大大缩减。
但要利用这1500种不同变量识别UPMC传统方案以外的肝脏移植受众必须投入大量劳动力,因此Collins决定将“低代码预测分析工具”Squark引入营销智能流程。Squark采用易于上手的方法实现自动化机器学习(AutoML),大大缓解以往服务方案不够亲民的问题。部分AutoML供应商主要面向数据科学家群体,但Squark则专注于降低半自动预测的准入门槛,帮助更多业务用户在接受部分定量培训后即可学会使用。而且与大部分其他AutoML工具相比,Squark的使用成本也明显更低。
Collins解释道,Squark的介入极大降低了整个模型的运行成本,足以适应随处应用的实际需求。之前,除了更高的资金投入要求之外,至少还需要一名数据科学家投入六个月的时间才能对肝脏移植前景做出准确的分析。但现在,基于营销情报团队做出的初步成果,任何对统计学拥有基本了解的团队成员都可以设置并运行机器学习模型,而且分析速度也更快。在以定量分析著称的卡耐基梅隆大学研究生院,Collins曾经使用114个变量运行过一套回归模型。期间他需要编写代码、以高度手动的方式检查流程结果,前后花了几个月时间才最终完成。如今在Squark的帮助下,他可以用1000个变量建立模型,并在一小时内获得同等精度的分析结果。现在,团队已经能在几个月时间内完成数百种不同分析,灵活验证自己的各种猜测与思路。
Collins和他的团队运用定制化建模方法在AutoML模型中检查了不同地区及年龄组中的所有变量,并匹配与之对应的已知分组肝病结果。他还尝试找出对分析结果影响最大的变量,之后利用生成的模型结合每位受试者罹患疾病的具体可能性对不同地理区域内的全体对象进行评分。Collins取可靠性最高的十分位预测结果,再结合合作厂商的帮助“将数据库中的个体转化为数字空间个体”,而后通过各类平台定位并投放有针对性的信息广告。
良好的产出,让Collins对持续使用Squark等AutoML工具充满信心。他认为如此一来,UPMC的“公民数据科学家”们才能真正代表患者以更高准确度完成复杂分析。UPMC还聘用一位数据科学家,在每项活动开始之前“检查数学”细节,确保模型的正确运行并得到正确解释。
总体而言,Collins的团队已经在肝脏移植中获得了惊人的回报。UPMC如今只需要接触75名患者——而非以往的10000名患者——就能找到一位合适的潜在用户。呼叫中心反应热烈,也让UPMC在一系列业务拓展与策略的支撑下迎来了50%的外来肝脏移植患者增幅。
不止于肝脏移植
肝脏移植项目只是业务拓展计划中的首个测试案例。如今,Collins团队正着手将技术推广至更多其他领域。他们正在与一位UPMC医生合作开展胰腺癌项目,这位医生已经在自己的工作中运用大量先进统计分析方法。他们还考虑加入一些骨骼肌项目,希望能帮助到更多患者。
Collins提到,目前似乎还没有其他医疗保健服务商采取类似的策略,甚至还没有启动大规模的数据收集工作。但各级行政领导层、特别是医院体系内的首席营销官们,则对UPMC的方案非常关注、也有意愿支持将其推广到全美。Collins强调,“在医疗保健领域,很少有人会开展真正的全国性营销活动。但我们认为只要方案中的某些独特优势能够让患者们受益,就应该把它推广开。”
Collins总结道,“数据和模型帮助我们以最有效的方式在正确的时间和地点为正确的对象提供护理。我们不会使用患者的个人数据,也不会侵犯患者的神圣隐私。最重要的是,成功接受移植或其他治疗服务的患者都很庆幸能够与我们接洽合作。”
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。