研究人员使用人工智能准确预测了圣迭戈县当地某高级住宅社区居民的孤独感问题。根据研究人员在《美国精神病学杂志》上发表的文章,他们使用的AI方案能够使用自然语言处理(NLP)与机器学习,对语音中表达的情绪与情感进行分类。
在新冠病毒疫情迫使人们保持社交隔离的背景下,来自加州大学、IBM及其他多家机构的研究人员,希望帮助整个社会评估并克服广泛存在的孤独感问题。尽管愈发强大的技术能够帮助我们更准确地发现孤独等社会问题,但技术工具能否将其解决仍然是个悬而未决的谜团。
出于研究目的,研究人员们采访了圣迭戈县某高级住宅社区中独自在家生活的80位居民。他们提出用于衡量孤独感的多个问题,对答案进行转录,而后使用IBM Watson NLU(自然语言理解)IV程序进行分析,借此“对情感与情绪表达加以量化”。
这些分析方法能够扫描回答当中所使用单词及短语的频率,并对情绪(从-1.0到1.0)及情感(从0.0到1.0)进行打分。最后,研究人员将人工智能打出的分数与手动评分进行比较,即可获得准确率结论。
在对结果的核查中,研究人员们发现,他们使用的机器学习模型拥有极高的准确率。这些模型能够以94%的准确率预测出定性孤独(基于访谈转录),并以76%的准确率预测出定量孤独(基于受访者的自我评分)。
换句话说,人工智能在预测孤独情绪与孤独感方面的表现,已经与合格的临床医生基本持平。正如作者们在结论中所指出,这可能对未来的心理诊疗工作产生重大影响。
他们在文章中写道,“自然语言处理与机器学习技术,能够以规模化方式快速处理成百上千份采访材料,并提供人类评分者无法实现的统一评分效率。”
作者们还设想了未来的情况,即基于人工智能的服务有望在无需人类直接参与的情况下,为民众提供帮助。
他们表示,“最终,复杂的AI系统将能够进行实时干预,通过积极认知、社交焦虑管理以及有意义的社交活动推荐来帮助个人减少孤独感。”
但是,虽然人工智能在大规模检测个人与人群孤独感(乃至其他情绪状态)方面极具发展前景,但其能否真正为治疗过程做出贡献仍然无法确定。
这份研究论文也指出,受访者感到孤独的总体比例为45%,其中很多人表示缺乏情感与工具支持。这种缺失显然不是基于AI的系统所能轻松解决。确实,孤独从根本上讲是一种社会问题,只有通过社会性的解决方案及变革才能缓解。
从理论上讲,AI技术能够识别出美国甚至整个地球上每一个感到孤独或受到孤立的个人,但技术本身能够帮助他们解决这种孤独或孤立问题吗?恐怕没人能对此给出确切的答案。
需要强调的是,我们经常看到精神健康诊断或生理健康诊断领域出现前所未有的技术创新,但出现创新和能够实际治愈疾病完全是两个概念。我们必须记住,大多数无法克服的问题,并不是由于缺少技术方案。
相反,我们面对的大多数问题源自复杂的原因与因素网络。这些原因与因素普遍来自社会、经济与政治领域,因此只能通过社会、经济及政治层面的方案加以解决。
孤独感也是同理,这种负面感受的普遍性不断一路上升,而且越来越个性化、甚至成为21世纪时代下的全新生活常态。如果我们真的打算严肃对待这个问题,那么显然还需要深入研究时代特征与孤独感之间的关系,并相应做出调整。否则,仅靠人工智能方法检测及诊断孤独感,除了进一步增加民众焦虑之外,将毫无用处。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。