上海,中国 – 2021年1月19日- 在国际权威的多目标跟踪挑战(Multiple Object Tracking Challenge,MOT)MOT20榜单上,紫光展锐多媒体算法的mota指标超过70分,拿下全球冠军。这也是MOT20 Challenge榜单上唯一一家超过70分的企业,彰显了紫光展锐在多目标跟踪领域的业界领先水平。
MOT Challenge是多目标跟踪领域最权威的国际测评平台,由慕尼黑工业大学、阿德莱德大学、苏黎世联邦理工学院以及达姆施塔特工业大学联合创办。MOT Challenge 提供了非常准确的标注数据和全面的评估指标,用以评估跟踪算法、行人检测器的性能。
其中,MOT 20 benchmark包含8份新的视频序列、密集且极具挑战性的场景。这份数据集在4th BMTT MOT Challenge Workshop,CVPR 2019上首次发布,平均每帧高达246个行人,相比之前的挑战赛数据集增加了夜晚数据集,对现有SOTA的MOT算法在解决极端稠密场景、算法泛化性等方面提出了艰巨挑战。
紫光展锐在多媒体算法中针对网络结构设计、损失函数、训练数据处理等方面进行了大量的创新和探索。针对竞赛中训练集没有涉及到的场景,紫光展锐创新性的采用端到端同时检测、行人识别策略,保障了算法在实际落地时的实时性,同时针对不同的端侧算力灵活调整网络大小,可灵活配套多种芯片方案的部署。
同时参与本次竞赛的还包括牛津大学、卡耐基梅隆大学、清华大学、慕尼黑工业大学、中科院、微软等多家企业、大学和科研机构的相关团队。
多目标追踪技术作为承载监控、车载、无人机、赛事直播等应用的关键技术,可准确捕捉视频中的关键信息,为进一步的信息提取提供支持,将在智慧城市、物联网等领域得到越来越广泛的应用。
在智能监控场景中,算法可实现复杂场景下的目标自动提取、跟踪、识别,理解目标的活动状态,进而实现场景状态监测、识别等。多目标追踪技术的应用可大幅减少人工重复劳动、提高工作效率和监控系统的智能性、安全性;在赛事直播场景中,算法可自动提取运动员的运动状态,从而实现数据统计、自动导播等功能,挖掘更多的数据价值;在智能车载场景中,算法可获取道路中车辆、行人的运动信息,为自动驾驶、安全辅助等应用提供必要的决策数据支持。
图像算法正在深度融合到越来越多的垂直行业,形成乘法效应,衍生出创新的业务和应用,让人们的生活更加美好和便捷。
MOT challenge榜单官网:https://motchallenge.net/results/MOT20/?det=All
好文章,需要你的鼓励
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。
ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手,能够通过观看屏幕并用鼠标键盘操作电脑,就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法,在多项测试中表现出色,游戏水平达到人类的60%左右,在某些电脑操作测试中甚至超越了知名AI产品,展现了AI从对话工具向真正智能助手演进的巨大潜力。