
CNET科技资讯网 8月15日 北京消息: 昨天,小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一,随后小米科技董事长兼CEO雷军也第一时间转发了这条微博,指出FDDB是由马萨诸塞大学计算机系维护的全世界最具权威的人脸检测评测平台,并恭喜小米研发人员取得全球第一成绩。
这项以万韶华博士为首的小米团队研发的新算法基于深度卷积检测网络(Faster RCNN Bootstrapped by Hard Negative Mining),它的作用简单说就是,利用深度卷积检测网络,同时学习人脸和非人脸特征,从而准确识别出人脸的位置和大小。下图是FDDB官网上最新公布的人脸检测准确率召回率曲线图,横轴表示误检人脸数,纵轴表示检出率。曲线越陡峭,曲线上的点越接近(0,1),表示检测器性能越好。从离散情况来看,小米团队在人脸识别检出率上明显高于其他研究团队。
FDDB (Face Detection Data Set and Benchmark),是由马萨诸塞大学计算机系维护的一套公开数据库,为来自全世界的研究者提供一个标准的人脸检测评测平台,其中涵盖在自然环境下的各种姿态的人脸。像百度、腾讯、360等国内互联网大公司也都建立了人脸检测算法团队,积极参与FDDB平台的评测。小米的研发团队能够在众多的国内外团队中脱颖而出,取得全球排行榜第一,标志着小米在人脸检测评测方面取得了突破性的进展。
目前小米云相册服务每天存储量已达1.2亿张,总量超过500亿张。未来小米人脸检测新算法会在优化及测试后替代老的算法,会有助于小米手机用户使用相册服务时检测到更多的人脸。
2015年6月5日,MIUI发布了一个新功能——面孔相册。小米云相册利用图像分析技术,可以自动地对云相册照片内容按照面孔进行分类整理。凭借此项技术实现,小米成为国内首家在手机系统层面发布该功能的手机厂商,极大地提高了用户在茫茫手机相册中找人的效率。
小米的早期员工都是来自于谷歌、微软、金山等国内外优秀的高科技公司,这次取得世界领先水平的研究成果,也首次将其从事人脸算法研发的团队曝光,通过领英网站上可以查询到这一新算法项目的带头人万韶华博士毕业于美国得克萨斯州立大学奥斯汀分校计算机视觉专业,由此可见小米已经吸引到不少高水平的计算机视觉领域科研人员。
人脸检测技术是很多技术与应用的基础,既需要大量数据,也需要强大的算法与其匹配。小米本来已经在大数据+云服务方面走在各国产手机厂商的前面,这次在人脸检测算法上达到世界第一的水平,也预示着小米在人脸识别、图像理解和分类等方面正在逐渐积累自己的科技创新成果,未来有助于形成新的产品竞争力。
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。