2021年初,斯坦福大学虚拟人类互动实验室进行了一项关于长时间的视频会议和虚拟会议的心理后果的研究。流行术语 “Zoom fatigue”(Zoom视频会议疲劳症)指的就是认知负荷最大化甚至效率的降低导致的结果。高层管理人员认为所有这些在远程工作科技方面投资的回报颇小。
北卡罗来纳大学以问卷形式调查了182名高级管理人员,其中65%的人认为会议让他们无法完成自己的工作,71%的人认为会议效率低及办不了实事,64%的人认为会议削弱了深度思考。
随着依赖科技的远程工作者的激增,新的解决方案正在出现,这些解决方案可能会令现场会议和虚拟会议成效更高些。
会议空间的创新愿景
会议的目的是展示、交流和沟通信息。无论是人在现场还是在看视频,大多数人都只能得到一小部分内容。大多数信息都丢失了或很快被遗忘。
人工智能(AI)系统可以模仿人脑对信息进行分类和优先排序的功能。来自会议的数据可以用类似的方式进行分析,解析出高度重要的一些点及过滤掉那些不重要的内容。
UMT咨询集团(现为EY)前首席执行官Gil Makleff和Visual Trading Systems前首席技术官Artem Koren是这个领域的行业领头人,他们推出Sembly旨在改善此问题。他们在技术创新方面的背景使得他们在会议领域的人工智能有这样的愿景:“我们创办Sembly是为了利用会议内容帮助企业跨过昂贵的失败前行,为他们提供机会洞察力,这在复杂的自然语言理解出现之前是不可能的。而现在这些都包含在SnowPiercer和Kodama里,SnowPiercer和Kodama是我们为现代企业提供的专有人工智能技术。”
他们的方法基于改善员工的体验:“有些组织希望增加跨团队信息流并在越来越多的远程工作环境里推出成果,人工智能技术对这些组织来说是至关重要的。”
改善员工体验
在过去的一年半里,有些组织必须采用远程或混合工作环境。然后就对新的沟通方式有了需求,因此即使那些能熟练地运用科技的公司也会出现失调的情况。出现这种大规模工作方式的转变时,要确保员工队伍的参与度及生产力的稳定,就需要聚焦员工体验,这一点至关重要。
在线会议科技起初是为了弥合物理距离的限制,现在转变为了一种知识和生产力工具。Makleff和Koren一起创建了一些专有算法,可以记录、处理和分析业务会议,得到的数据能够提供可操作的见解。Sembly的SaaS平台利用人工智能的力量提取重要的时刻,使得与会者能够从会议中更多地受益。
随着人工智能的发展,诸如Sembly一类的平台可以利用自然语言理解捕捉和精准地总结会议内容。例如,Sembly人工智能的“Glance”(快读)技术可以提供一个会议的专题摘要,因此可以提高与会者获取会议精髓的能力,他们可以砍掉杂乱的内容,只保留最重要的内容。
利用会议科技实现模式转变
开会就有做会议记录的人,一直都是这样。音像整理技术和语音人工智能为这个行业带来了巨大的变化。从广义上讲,音像整理技术涉及三个过程:捕获音像资料的音频并将模拟信号转换为数字信号以及将转换后的音频分为对话段落,或称日记式段落化,最后是自动识别说话者的声音,或称语音识别。
技术人员认识到,放之四海而皆准的语音引擎并不存在。一个房间的声学特性、人的口音甚至讨论话题的领域等等都有影响,本来可以辨别发言人的系统用在最基本的会议时都需要高级微调。而且,还有个不争的事实,会议本身也已经发生了巨大的变化。
Sembly是个一个有能力在专业环境中有效地理解和整理语音的平台,Sembly可以创造持久的会议数字物品,进而存储在会议云里。因此,会议内容成了可搜索、可共享的资料,而且还可以随时进行复查、同步及跟进等工作,也能有力地控制资料的访问。
可以看到,这项技术实现了从二元会议到连续信息流的转变,是一个强大的范式转变。会议结束后的对话是未来的趋势,在这种情景下,即使那些没有参加会议的人也可以访问会议内容并参与对话。
少参加:多生产——合作悖论?
辞职潮是一个特别深刻的例子,说明了雇主提高员工参与度的重要性。无休止、耗时的会议肯定不为员工喜好,也与生产力相悖。而在虚拟或混合环境里,参与度就更具挑战性了。人工智能可以帮助雇主克服这里的一些挑战,新技术可用于跟踪一次会议和一系列会议的情绪和参与度。这个数据集可以提供组织绩效的洞察,还可以让领导者掌握整个组织的趋势和合作的脉搏。
人工智能可以做笔记、组织笔记、提炼后续任务及缩短整个会议的长度,使会议更加有效。我们日常使用各种各样的技术,人工智能成了商业团队的延伸,成了记笔记、分配任务、管理会议的机器,可以接管琐碎的任务并精确而优雅地完成这些任务。
人工智能促进了协作智能,进而又增加了一层支持,并且可以最大限度地提高洞察力,企业领导人因此可以做出更明智的决定。人类与人工智能之间的协作可以实现最佳的结果。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。