
CNET科技资讯网 8月15日 北京消息: 昨天,小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一,随后小米科技董事长兼CEO雷军也第一时间转发了这条微博,指出FDDB是由马萨诸塞大学计算机系维护的全世界最具权威的人脸检测评测平台,并恭喜小米研发人员取得全球第一成绩。
这项以万韶华博士为首的小米团队研发的新算法基于深度卷积检测网络(Faster RCNN Bootstrapped by Hard Negative Mining),它的作用简单说就是,利用深度卷积检测网络,同时学习人脸和非人脸特征,从而准确识别出人脸的位置和大小。下图是FDDB官网上最新公布的人脸检测准确率召回率曲线图,横轴表示误检人脸数,纵轴表示检出率。曲线越陡峭,曲线上的点越接近(0,1),表示检测器性能越好。从离散情况来看,小米团队在人脸识别检出率上明显高于其他研究团队。
FDDB (Face Detection Data Set and Benchmark),是由马萨诸塞大学计算机系维护的一套公开数据库,为来自全世界的研究者提供一个标准的人脸检测评测平台,其中涵盖在自然环境下的各种姿态的人脸。像百度、腾讯、360等国内互联网大公司也都建立了人脸检测算法团队,积极参与FDDB平台的评测。小米的研发团队能够在众多的国内外团队中脱颖而出,取得全球排行榜第一,标志着小米在人脸检测评测方面取得了突破性的进展。
目前小米云相册服务每天存储量已达1.2亿张,总量超过500亿张。未来小米人脸检测新算法会在优化及测试后替代老的算法,会有助于小米手机用户使用相册服务时检测到更多的人脸。
2015年6月5日,MIUI发布了一个新功能——面孔相册。小米云相册利用图像分析技术,可以自动地对云相册照片内容按照面孔进行分类整理。凭借此项技术实现,小米成为国内首家在手机系统层面发布该功能的手机厂商,极大地提高了用户在茫茫手机相册中找人的效率。
小米的早期员工都是来自于谷歌、微软、金山等国内外优秀的高科技公司,这次取得世界领先水平的研究成果,也首次将其从事人脸算法研发的团队曝光,通过领英网站上可以查询到这一新算法项目的带头人万韶华博士毕业于美国得克萨斯州立大学奥斯汀分校计算机视觉专业,由此可见小米已经吸引到不少高水平的计算机视觉领域科研人员。
人脸检测技术是很多技术与应用的基础,既需要大量数据,也需要强大的算法与其匹配。小米本来已经在大数据+云服务方面走在各国产手机厂商的前面,这次在人脸检测算法上达到世界第一的水平,也预示着小米在人脸识别、图像理解和分类等方面正在逐渐积累自己的科技创新成果,未来有助于形成新的产品竞争力。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。