科技行者 8月15日 北京消息: 8月15日,小米官方宣布截止7月底,小爱同学月活跃设备超过3000万,今年7月小爱同学唤醒超过10亿次,累计唤醒已超过50亿次。凭借小米强大的AI实力和产品快速落地能力,从去年3月发布至今,小爱同学迎来爆发期,已成为国内最活跃的人工智能语音交互平台。小米强大的AI实力已见成效。
小米集团创始人、董事长兼CEO雷军说,“小米很早就意识到,人工智能是未来十年最重要的技术革命,会像互联网一样成为一个基本元素。小米建成了全球最大的消费级IoT物联网平台,能够为人工智能提供丰富的应用场景、用户、流量和数据,同时人工智能又能为小米的产品和互联网服务全面赋能。人工智能将帮助小米捕捉下一个十年的风口,对小米在未来成长为一家伟大的公司有着战略级的意义。”
小爱同学赋能小米全系列产品,成AI时代爆品
小米人工智能与云平台副总裁崔宝秋多次提及小米做AI技术的三大优势,分别是硬件产品的优势,大数据的优势,以及生态链的广深布局的优势。小米目前推出的一些AI技术,比如语音识别、AI相机的场景识别、智能美颜等,获得了用户的一致好评。就在前不久,小米还开源了自研的移动端深度学习框架Mobile AI Compute Engine(简称MACE)。业界开发者可以利用MACE强大的人工智能加速技术,在AI拍照、AI图像处理、智能物体识别、智能交互、机器翻译等方面获得更有趣、更强大的应用。为中国人工智能产业赋能,推动AI技术在中国业界的落地与应用。
在小米公司,AI技术有大量的应用场景,从语音识别、NLP(自然语言处理),到视觉、知识图谱等技术,都有着广阔的发展空间。AI在小米无处不在。以小爱同学为核心,小米AI已经全面赋能小米各系列产品。小爱同学已支持小米手机、小米电视、小爱音箱、儿童手表、儿童故事机、翻译机、车载后视镜、智能手表等小米和小米生态链数百款产品。
2017年3月,全球首款人工智能语音电视-小米电视4A发布,小爱同学正式问世。截止至2018年7月底,小爱同学月活跃设备已经超过了3000万,每月唤醒超过10亿次,累计唤醒已超过50亿次。小爱同学可以控制电视、扫地机器人、电饭煲、台灯、空调等智能家居;可以听音乐、查天气、翻译、闲聊等日常应用;手机里的小爱同学还可以打电话、信息搜索、打开APP、导航、语音设置日程提醒等专属应用。小爱同学已经成为生活中不可缺少的一部分。随着小爱同学在技能方面的不断开发,还会拥有点咖啡、买电影票、寄快递、点歌等成千上万种技能。
小爱同学的能力已经已经覆盖了内容、工具、互动等近百个细分领域。第三方开发者也可以通过小爱开放平台轻松开发各种应用场景下的语音技能和语音服务,为小爱同学带来更多实用的技能,使小爱同学变得更丰富、更有趣。同时,该平台还能让开发者接入智能硬件设备。小米希望能融合各家所长,让更多的开发者接入进来,一起把人工智能服务真正做起来。未来的小爱同学,将会无处不在,无所不能,如影随形。
小米快速推进AI技术落地,赋能中国人工智能产业
不论是普通用户还是业内人士,小爱同学凭借良好的体验赢得了广泛好评。在今年5月贵阳中国国际大数据产业博览会上,小爱同学获得了“2018领先科技成果奖·黑科技”和“2018领先科技成果奖·新产品”双料大奖,得到了权威领域的认可。小爱同学广受好评,背后体现了小米强大的AI技术。
近年来,凭借小米在“CBA”(云计算-大数据-人工智能)领域充实的技术积累,小米AI技术实力正在快速成长。小爱同学的蓬勃发展得益于小米强大的AI实力:首先是语音技术,包括语音唤醒、语音识别、语音合成;其次是自然语言处理、自然语言理解,以及背后的搜索与推荐、智能问答、闲聊等;最后是知识图谱、内容的获取与理解,小爱同学能够解答各种问题,正是源自对各种知识的掌握。
据了解,短短8年时间,小米已经成为全球第四大的智能手机制造商,建成了全球最大的消费类IoT平台,连接超过1亿台智能设备。随着AI技术的迅速落地,越来越多智能设备中将会有小爱同学的身影。
小爱同学成小米移动互联网业务新增长极
移动互联网时代流量为王。硬件、互联网服务、新零售是小米独创的“铁人三项”商业模式,作为互联网公司,通过价格厚道、感动人心的产品,小米有低成本获取流量的优势。目前小米MIUI已有超过3亿用户,月活跃用户超过1.9亿,成为小米互联网收入的主要来源。小爱同学月活跃设备超过3000万,成长小米移动互联网业务新的增长极,未来想象空间无限。
目前全球人工智能产业方兴未艾,技术积累、产品实践均还处于爆发前夕,无论是行业新秀,还是大型企业,均在跑马圈地。小米作为新兴互联网公司,以用户体验为王,以产品推动技术创新和落地,背靠亿万用户和领先的商业模式,势必成为中国人工智能产业的创新实践代表,推动人工智能产业发展。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。