人工智能和机器学习正在助力数字健康热潮,但在心理和行为健康方面仍处于起步阶段。事实上,这并不意外,因为理解人类的思想和感受可不仅仅是“分析血液测试数据或者医学扫描疾病迹象”,往往要比分析某个人是否会患上肾脏疾病难得多。提振某个人的情绪,或者个性化地治疗精神失常(特别是抑郁症)仍然是非常困难的。
根据世界卫生组织的统计,抑郁症是全球最主要的健康问题之一。抑郁症患者经常要经过大量乏味的试验和错误的过程来找到适合自己的抗抑郁药物。很多患者对初期健康服务感到不满,不愿意坚持治疗,甚至报告存在让人变得虚弱的副作用。最近有研究表明,2/3的患者在首次服用了抗抑郁药后未能好转,另有30%的患者放弃了一线治疗的机会。
为了解决抑郁和焦虑问题,有初创公司推出了一系列基于人工智能的工具,从而帮助精神科医生和家庭医生更快地优化护理措施。
比如,总部位于以色列特拉维夫的初创公司Taliaz,正在开发一种名为PREDICTIX以人工智能为驱动的决策支持工具,可以帮助医生找出适合患者的抗抑郁药物。PREDICTIX是根据迄今为止最大的抑郁症前瞻性临床试验——Sequenced Treatment Alternatives to Relieve Depression (STAR*D) Study——相关数据开发的。Taliaz称,在完成算法开发之后,该工具能够预测当前抗抑郁药物的疗效和不良反应,准确度高达75%。
Taliaz公司首席执行官、魏茨曼研究所神经科学博士Dekel Taliaz表示:“只有通过科学研究、遗传学、神经学、环境和临床数据的深度结合,我们才能理解这些复杂性并找出相关的标记,以建立能够为患者提供最佳结果的预测模型。我们通过简单的非侵入性测试,以在线调查问卷的形式收集了患者的DNA样本、人口统计信息和临床病史。然后,PREDICTIX提供有关抗抑郁药物的预测信息,并推荐最适合每位患者基因构成和健康记录的信息。”
今年3月,Taliaz携手英国领先的在线精神病学服务机构Psychiatry UK LLP(PUK),推出了号称是第一个针对抑郁症患者的在线AI基因检测服务。这个在线医疗管理版本的PREDICTIX服务,旨在通过帮助精神科医生更早、更好地找到适合的抗抑郁药物来减少患者的痛苦。
“我们有一位患者对四种抗抑郁药没有产生反应,他反馈说,从三周前开始服用Predictix测试推荐的药物之后,现在像是‘换了一个人,感觉已经好了80%’”,Psychiatry UK精神病学家Adil Jawad博士说。Psychiatry UK是英国领先的在线精神病学服务机构,为英国NHS公共机构和私人组织提供服务。
另一家希望提高抑郁症治疗效果的以色列科技公司是Elminda,该公司最近获得了欧盟委员会280万欧元奖励,用于提升其技术以帮助欧洲患者免受抑郁症的困扰。Elminda的BNA-PREDICT大脑分析产品可以预测患者对抗抑郁药物和神经刺激治疗的反应,帮助医生选择最有效的抗抑郁治疗手段,以及直接监测治疗对患者大脑的影响。
“我们为Elminda获得了欧委员会著名的Horizon 2020第二阶段中小企业项目授予的奖项感到自豪”,Elminda公司Roni Sharon博士这样表示。
健全的心理健康对于创造力、生产力和才智来说至关重要,这一点似乎比以往任何时候都更加明确。随着时间的推移,我们希望看到越来越多的初创公司和投资者联合起来,促进和改善人类的情绪、心理和社会福祉。在这种情况下,随着人工智能的不断升级,人工智能算法经过优化以创建更有用的支持机制,在最复杂和最容易出错的情况下开发出有用的专业技能。虽然我们不知道Taliaz和Elminda等初创公司未来会是怎样,但我们希望这些公司在患者使用和坚持正确疗法方面发挥关键的作用。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。