近日,专注于计算机视觉和视频大数据分析的人工智能企业——银河水滴宣布,公司成功研发了全球首款步态边缘计算机芯,该产品可以广泛应用于智能家居、智慧医疗及智能安防等诸多领域。
目前,银河水滴正与智能家居厂商及医疗康复机构合作推进该产品的快速落地。
随着移动互联网的普及,人工智能技术的纵深发展,5G通信和物联网技术的逐渐落地,边缘计算技术受到越来越多技术厂商的重视。
在这种技术浪潮背景下,基于ARM技术架构,历时近一年时间的研发,银河水滴研发的全球首款步态边缘计算机芯于近期问世,该机芯是独创的支持深度学习算法的嵌入式高性能ARM平台,将硬件、算法、软件高度集成为一体,支持外接摄像机进行视频流分析。
据了解,该“智能机芯”同时也是国内首个步态识别硬件模组,尺寸仅为86mm*56mm*18mm,功耗3W。该机芯模组具有如下功能:完整的人体生物识别方案;可集成完整的步态、人脸、防摔倒、跌倒检测等算法;可以作为独立的人体信息采集终端;拥有独立的计算能力,可以作为大型系统的子运算节点,并支持任务分配,作为独立采集终端上传结果,可以广泛应用于智能家居、智慧医疗、智能安防等诸多领域。
2018年10月底,银河水滴还正式发布了多款拥有独立自主知识产权的重磅产品:通过步态识别技术在海量视频中快速进行目标人物检索和身份识别的银河水滴步态检索智能一体机“水滴神鉴”,这是全球首款步态识别商用产品;可替代工人对地铁轨道与隧道等完成智能化巡检的银河水滴轨道交通综合智能检测车“水滴智检”,这是中国首台小型化轨道交通综合智能检测车。
其中,水滴神鉴是集算法、软件和硬件为一体的便携式安防专用设备,以人的步态特征作为注册对象、通过步态识别技术在海量视频中快速进行人物检索和身份识别、快速实现目标人物查找。该产品依托于银河水滴全球领先的步态识别技术:全球最高的步态识别精度94%、全球最大的步态数据库、可实现普通2K摄像机下最远50米的远距离、跨视角识别,且无需识别对象主动配合。
据了解,水滴神鉴可替代人工从海量监控视频中快速查找目标人物,并且大幅提升了检索的效率和准确度;当出现远距离、非配合、全视角(如只有侧面和背面身形)、弱光线、人脸隐蔽/遮挡、目标人物多次换装等一种或多种情况时,用步态识别技术搜检目标人物,则成了最优或唯一的选择。
水滴智检则可对地铁轨道、隧道等完成智能化巡检。该检测车以AI为核心,基于中科院自动化所二十年的技术积累,打破国外技术垄断,拥有完全自主知识产权,集成钢轨及锁扣缺陷检测、钢轨内部缺陷检测、车辆限界检测、隧道环境异常检测、接触网缺陷检测、轨距检测六大功能模块。该检测车采用灵活的产品设计方案,既可整车售卖,也可分功能按模块售卖。
另据了解,银河水滴已开发工业视觉开放平台(IndustryAI)配套的线下检测生产线,集成各种常用的成像设备和自动化执行机构,配合开放的视觉检测算法,为制造行业提供先进的软硬件一体化视觉检测方案。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。