当地时间本周四,在旧金山举办的谷歌年度I/O开发者大会上,谷歌正式推出了新一代移动操作系统Android M。
类似于2014年发布的Android L预览版,谷歌尚未用甜品或版本号为Android M冠名。不过待今年晚些时候,当其在各大设备上亮相时,我们才能得知相关细节。目前这还只是一款开发者预览版系统。
新系统中的Google Now最有趣之处在于,用户长按Home键便可启动Google Search应用,而无需从设备屏幕底部刷出。
而最激动人心的是,Google Now将更加智能,它能够理解用户所阅读的邮件,标注你正在播放的音乐,并可在调用时将与其相关的有用信息显示出来。谷歌将这项功能称为Now on Tap。
例如:在听一首歌时,只需问:“你好Google,她来自哪里?”便可获知详细信息,而不需要说出歌曲演唱者的名字。
Android M正式引入Android Pay移动支付系统。谷歌在2015年全球移动大会上曾谈到过该支付平台,它不仅允许第三方应用通过应用内支付服务处理款项,还支持近场通讯(NFC)店内支付。此外“谷歌钱包”(Google Wallet)服务也不会就此消失,不过它也将支持Android Pay。
除此之外,类似于苹果Apple Pay,Android Pay也将支持指纹读取器,用户可通过指纹验证支付。
目前美国有70万家商店支持用户使用Android Pay,例如沃尔格林、梅西百货和百思买,等等。
充电方面,未来Android设备将可支持最新USB Type C接口,不仅是该设备的充电端口,也可通过该端口为其他设备充电。而且该端口上下两面形状一致,用户无需辨别正反。
节能方面,Android M还加入一项Doze节能功能,可保证设备在待机模式下更节电。如果设备长时间不移动的话,系统将自动进入休眠状态节电。此时用户仍可接收到重要提醒和短信,但其功耗至少仅有原先的一半。
新系统中,谷歌对应用权限做了一定的更新调整,允许用户对应用权限进行高度管理。
过去,用户每安装一个应用基本上意味着整个安装包需要获得全面认可的权限。而现在,应用程序会在必要时询问是否可以访问设备的某位置或账户。例如,只有当你尝试通过短信应用发送照片时,系统才会发出权限请求,询问是否允许该应用访问你的相机应用,这与iOS设备在授权处理方面相类似。
谷歌在I/O大会上表示:“在新的许可模式下,用户应用将实现无缝化更新。”
谷歌为Android M加强了软件、应用之间的关联,使得其相互之间的转换更为流畅。这一特性将在今年第三季度面向用户推出。
Android M预览版目前仅供开发人员在谷歌Nexus设备上运行,在登陆其他设备前,该系统应该会先登陆Nexus设备。
我们推测,谷歌或许会用Android 5.2或6.0作为Android M的代号,并选取一种甜点命名。不过其代号目前仍悬而未决,棉花糖(Marshmallow)、小松饼(Muffin)、杏仁糖(Marzipan)等绰号均为人们所津津乐道。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。