3月22日,钉钉在“科技向实·万物生长”发布会上推出了业界第一款单机实现10米高清音视频体验的视频会议一体机——F2。钉钉F2采用了行业领先的高通高性能物联网芯片,带来强大的计算和AI性能,进一步支持协作办公体验和企业生产力的提升。
随着云会议的兴起,音视频与计算机视觉、图像处理、人工智能等技术的融合趋势也愈发明显,共同带来高清实时的协同办公体验。钉钉F2具备单机10米清晰拾音、智能导播、4K画质等特点。
在音频方面,钉钉F2采用麦克风阵列技术,首次将麦克风声学特性和差分波束理论的优势进行结合,实现了单机10米清晰拾音的突破;在视觉方面,钉钉F2采用多模态智能导播与视觉智能算法,结合顶级高通物联网芯片先进的CPU架构、高通AI引擎和图像信号处理器(ISP)带来顶级性能,可支持最高4K、120帧/秒的视频处理,实现对全空间任意位置的细节捕捉,为企业和个人用户提供实时高清画质。此外,钉钉F2还充分利用高通物联网芯片的计算性能,为发言人跟踪、多画面自动导播等边缘侧计算密集型AI功能提供全新的神经处理单元,带来更具沉浸感的智能会议体验。
在满足大中型会议室高清音视频体验的同时,如何应对设备部署、布线繁琐等难题,成为行业亟待解决的痛点。以往要满足高端会议设备的音视频性能要求,通常要采用2到3颗主控级联;此次钉钉F2采用了突破性的一体机形态,仅通过一颗高通高性能物联网芯片即可实现兼具高质量图像接入及处理能力、强劲的编解码性能、AI算力以及支持丰富的通用接口等特性,让All in One的设计成为可能,在减少会议设备部署的同时极大地简化了设计和成本。
钉钉F2视频会议一体机是行业最新的技术合作成果,利用前沿的高性能、低功耗计算技术创新,更好地服务于组织数字化和业务数字化。钉钉F2不仅为用户提供了音视频远程协同沟通的能力,还通过专用的会议室硬件终端设备,打造会议室与个人端之间一致的优质会议体验,并通过音视频算法及模组的集成,引领行业创新并对生态进行技术赋能,助力更多组织加速迈入数字化时代。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。