近日,专注于计算机视觉和视频大数据分析的人工智能企业——银河水滴宣布,公司成功研发了全球首款步态边缘计算机芯,该产品可以广泛应用于智能家居、智慧医疗及智能安防等诸多领域。
目前,银河水滴正与智能家居厂商及医疗康复机构合作推进该产品的快速落地。
随着移动互联网的普及,人工智能技术的纵深发展,5G通信和物联网技术的逐渐落地,边缘计算技术受到越来越多技术厂商的重视。
在这种技术浪潮背景下,基于ARM技术架构,历时近一年时间的研发,银河水滴研发的全球首款步态边缘计算机芯于近期问世,该机芯是独创的支持深度学习算法的嵌入式高性能ARM平台,将硬件、算法、软件高度集成为一体,支持外接摄像机进行视频流分析。
据了解,该“智能机芯”同时也是国内首个步态识别硬件模组,尺寸仅为86mm*56mm*18mm,功耗3W。该机芯模组具有如下功能:完整的人体生物识别方案;可集成完整的步态、人脸、防摔倒、跌倒检测等算法;可以作为独立的人体信息采集终端;拥有独立的计算能力,可以作为大型系统的子运算节点,并支持任务分配,作为独立采集终端上传结果,可以广泛应用于智能家居、智慧医疗、智能安防等诸多领域。
2018年10月底,银河水滴还正式发布了多款拥有独立自主知识产权的重磅产品:通过步态识别技术在海量视频中快速进行目标人物检索和身份识别的银河水滴步态检索智能一体机“水滴神鉴”,这是全球首款步态识别商用产品;可替代工人对地铁轨道与隧道等完成智能化巡检的银河水滴轨道交通综合智能检测车“水滴智检”,这是中国首台小型化轨道交通综合智能检测车。
其中,水滴神鉴是集算法、软件和硬件为一体的便携式安防专用设备,以人的步态特征作为注册对象、通过步态识别技术在海量视频中快速进行人物检索和身份识别、快速实现目标人物查找。该产品依托于银河水滴全球领先的步态识别技术:全球最高的步态识别精度94%、全球最大的步态数据库、可实现普通2K摄像机下最远50米的远距离、跨视角识别,且无需识别对象主动配合。
据了解,水滴神鉴可替代人工从海量监控视频中快速查找目标人物,并且大幅提升了检索的效率和准确度;当出现远距离、非配合、全视角(如只有侧面和背面身形)、弱光线、人脸隐蔽/遮挡、目标人物多次换装等一种或多种情况时,用步态识别技术搜检目标人物,则成了最优或唯一的选择。
水滴智检则可对地铁轨道、隧道等完成智能化巡检。该检测车以AI为核心,基于中科院自动化所二十年的技术积累,打破国外技术垄断,拥有完全自主知识产权,集成钢轨及锁扣缺陷检测、钢轨内部缺陷检测、车辆限界检测、隧道环境异常检测、接触网缺陷检测、轨距检测六大功能模块。该检测车采用灵活的产品设计方案,既可整车售卖,也可分功能按模块售卖。
另据了解,银河水滴已开发工业视觉开放平台(IndustryAI)配套的线下检测生产线,集成各种常用的成像设备和自动化执行机构,配合开放的视觉检测算法,为制造行业提供先进的软硬件一体化视觉检测方案。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。