微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

面孔相册按脸给照片分类这是靠小米人脸检测技术实现的

小米人脸识别

面孔相册按脸给照片分类这是靠小米人脸检测技术实现的

作者：CNET科技资讯网

2016-08-15 15:54

分享至：

昨天，小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2016-08-15 15:54 • CNET科技资讯网

CNET科技资讯网 8月15日北京消息：昨天，小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一，随后小米科技董事长兼CEO雷军也第一时间转发了这条微博，指出FDDB是由马萨诸塞大学计算机系维护的全世界最具权威的人脸检测评测平台，并恭喜小米研发人员取得全球第一成绩。

这项以万韶华博士为首的小米团队研发的新算法基于深度卷积检测网络（Faster RCNN Bootstrapped by Hard Negative Mining），它的作用简单说就是，利用深度卷积检测网络，同时学习人脸和非人脸特征，从而准确识别出人脸的位置和大小。下图是FDDB官网上最新公布的人脸检测准确率召回率曲线图，横轴表示误检人脸数，纵轴表示检出率。曲线越陡峭，曲线上的点越接近（0,1），表示检测器性能越好。从离散情况来看，小米团队在人脸识别检出率上明显高于其他研究团队。

FDDB (Face Detection Data Set and Benchmark)，是由马萨诸塞大学计算机系维护的一套公开数据库，为来自全世界的研究者提供一个标准的人脸检测评测平台，其中涵盖在自然环境下的各种姿态的人脸。像百度、腾讯、360等国内互联网大公司也都建立了人脸检测算法团队，积极参与FDDB平台的评测。小米的研发团队能够在众多的国内外团队中脱颖而出，取得全球排行榜第一，标志着小米在人脸检测评测方面取得了突破性的进展。

目前小米云相册服务每天存储量已达1.2亿张，总量超过500亿张。未来小米人脸检测新算法会在优化及测试后替代老的算法，会有助于小米手机用户使用相册服务时检测到更多的人脸。

2015年6月5日，MIUI发布了一个新功能——面孔相册。小米云相册利用图像分析技术，可以自动地对云相册照片内容按照面孔进行分类整理。凭借此项技术实现，小米成为国内首家在手机系统层面发布该功能的手机厂商，极大地提高了用户在茫茫手机相册中找人的效率。

小米的早期员工都是来自于谷歌、微软、金山等国内外优秀的高科技公司，这次取得世界领先水平的研究成果，也首次将其从事人脸算法研发的团队曝光，通过领英网站上可以查询到这一新算法项目的带头人万韶华博士毕业于美国得克萨斯州立大学奥斯汀分校计算机视觉专业，由此可见小米已经吸引到不少高水平的计算机视觉领域科研人员。

人脸检测技术是很多技术与应用的基础，既需要大量数据，也需要强大的算法与其匹配。小米本来已经在大数据＋云服务方面走在各国产手机厂商的前面，这次在人脸检测算法上达到世界第一的水平，也预示着小米在人脸识别、图像理解和分类等方面正在逐渐积累自己的科技创新成果，未来有助于形成新的产品竞争力。

小米人脸识别

分享至

0赞

好文章，需要你的鼓励

推荐文章

自对弈训练
推理能力提升
零和游戏学习

2025-07-02 14:26

AI玩游戏能让推理变聪明？新加坡国立大学发现自对弈训练的神奇效果

新加坡国立大学研究团队开发了SPIRAL框架，通过让AI与自己对弈零和游戏来提升推理能力。实验显示，仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%，通用推理提升8.4%，且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中，为AI训练提供了新思路。
计算机视觉
图像降噪
3D相机技术

2025-07-02 14:26

同济大学突破性研究：让3D相机告别"噪点困扰"的智能降噪新技术

同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息，创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系，结合深度学习和数学优化方法，在合成数据集上实现37.9%的精度提升，并在真实设备上展现出色泛化能力，为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。
人工智能
视觉语言模型
强化学习

2025-07-02 14:26

AI视觉推理模型的"顿悟时刻"真的存在吗？伊利诺伊大学研究揭示令人意外的真相

伊利诺伊大学研究团队通过对比实验发现，经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象，但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距"，即生成答案的能力强于验证答案质量的能力，且模型在自我验证时无法有效利用视觉信息，为AI多模态推理发展提供了重要启示。
大语言模型
稀疏性训练
计算效率优化

2025-07-02 14:25

MIT团队发明"智能减肥法"让AI训练快1.6倍：只需要一半的算力就能教会大模型新技能

MIT等顶尖机构联合提出SparseLoRA技术，通过动态稀疏性实现大语言模型训练加速1.6倍，计算成本降低2.2倍。该方法使用SVD稀疏性估计器智能选择重要计算部分，在保持模型性能的同时显著提升训练效率，已在多个任务上验证有效性。