近日,专注于计算机视觉和视频大数据分析的人工智能企业——银河水滴宣布,公司成功研发了全球首款步态边缘计算机芯,该产品可以广泛应用于智能家居、智慧医疗及智能安防等诸多领域。
目前,银河水滴正与智能家居厂商及医疗康复机构合作推进该产品的快速落地。
随着移动互联网的普及,人工智能技术的纵深发展,5G通信和物联网技术的逐渐落地,边缘计算技术受到越来越多技术厂商的重视。
在这种技术浪潮背景下,基于ARM技术架构,历时近一年时间的研发,银河水滴研发的全球首款步态边缘计算机芯于近期问世,该机芯是独创的支持深度学习算法的嵌入式高性能ARM平台,将硬件、算法、软件高度集成为一体,支持外接摄像机进行视频流分析。
据了解,该“智能机芯”同时也是国内首个步态识别硬件模组,尺寸仅为86mm*56mm*18mm,功耗3W。该机芯模组具有如下功能:完整的人体生物识别方案;可集成完整的步态、人脸、防摔倒、跌倒检测等算法;可以作为独立的人体信息采集终端;拥有独立的计算能力,可以作为大型系统的子运算节点,并支持任务分配,作为独立采集终端上传结果,可以广泛应用于智能家居、智慧医疗、智能安防等诸多领域。
2018年10月底,银河水滴还正式发布了多款拥有独立自主知识产权的重磅产品:通过步态识别技术在海量视频中快速进行目标人物检索和身份识别的银河水滴步态检索智能一体机“水滴神鉴”,这是全球首款步态识别商用产品;可替代工人对地铁轨道与隧道等完成智能化巡检的银河水滴轨道交通综合智能检测车“水滴智检”,这是中国首台小型化轨道交通综合智能检测车。
其中,水滴神鉴是集算法、软件和硬件为一体的便携式安防专用设备,以人的步态特征作为注册对象、通过步态识别技术在海量视频中快速进行人物检索和身份识别、快速实现目标人物查找。该产品依托于银河水滴全球领先的步态识别技术:全球最高的步态识别精度94%、全球最大的步态数据库、可实现普通2K摄像机下最远50米的远距离、跨视角识别,且无需识别对象主动配合。
据了解,水滴神鉴可替代人工从海量监控视频中快速查找目标人物,并且大幅提升了检索的效率和准确度;当出现远距离、非配合、全视角(如只有侧面和背面身形)、弱光线、人脸隐蔽/遮挡、目标人物多次换装等一种或多种情况时,用步态识别技术搜检目标人物,则成了最优或唯一的选择。
水滴智检则可对地铁轨道、隧道等完成智能化巡检。该检测车以AI为核心,基于中科院自动化所二十年的技术积累,打破国外技术垄断,拥有完全自主知识产权,集成钢轨及锁扣缺陷检测、钢轨内部缺陷检测、车辆限界检测、隧道环境异常检测、接触网缺陷检测、轨距检测六大功能模块。该检测车采用灵活的产品设计方案,既可整车售卖,也可分功能按模块售卖。
另据了解,银河水滴已开发工业视觉开放平台(IndustryAI)配套的线下检测生产线,集成各种常用的成像设备和自动化执行机构,配合开放的视觉检测算法,为制造行业提供先进的软硬件一体化视觉检测方案。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。