当地时间本周一,苹果在其于旧金山召开的2014年度全球开发者大会(WWDC)上一推出了最新版本的iOS移动操作系统。苹果已将这次iOS 8移动操作系统的推出称为是“自App Store推出以来最大的一次发布”,不过对Android粉丝们而言,他们没什么需要担心的。他们认为模仿是最真诚的恭维方式,因为苹果推出的许多“新”功能已存在于谷歌的Android操作系统中,并已经存在了很长一段时间。
在iOS 8中,苹果改进了云照片和视频存储功能。此前,用户存储照片数量仅限于1000张,且存储时间长达30天。而在新的iCloud照片库中,照片会自动存储在云端,用户可从任一设备访存取这些照片。
而Android用户拥有的Google+ Photos照片应用,也会将用户所有图片自动同步至云中。与苹果不同的是,苹果仅为用户提供5GB免费存储空间,而谷歌为用户的图片和视频提供了无限的存储空间。
苹果宣布的另一项iCloud改进功能为iCloud Drive,一款类似于Dropbox应用的服务,可在云中存储文件。而除了Dropbox以外,Android和苹果用户均已拥有Google云端硬碟(Google Drive)。此外,iCloud仅为用户提供5GB的免费存储空间,而Google云端硬碟则为用户免费提供15GB,Dropbox最初免费提供给用户2GB的存储空间,用户可通过将其推荐给其他人可扩展存储空间至20GB。
iCloud Drive在iPhone、iPad、Mac和PC中均可用,而Google云端硬碟和Dropbox也支持Android系统。
苹果为其全新的QuickType输入法耗费了不少精力。这项全新输入法支持预判联想功能,能够根据你的打字习惯了解预测输入内容。除了QuickType输入法外,iOS 8还引入了对第三方输入法的支持。这一切听起来都不错,不过Android用户多年来一直能使用这些功能。
在众多输入法中,无论是谷歌官方输入法还是另一种流行的第三方输入法SwiftKey,均具有预测功能、手势输入等其他功能。
苹果用户终于能够在iOS 8上使用基本的小工具了。然而不同于Android系统,Android用户可在主屏幕放置小工具和锁定屏幕,但iOS 8用户的小工具将仅限于iPhone和iPad的下拉通知中心。
iOS 8的更新也对Siri进行了改进。苹果Siri语音助理新增了22种新命令语言,而且将能使用Shazam进行歌曲识别,购买iTunes音乐或视频,以及流媒体语音识别。此外,Siri应用最大的变化之一便是,当用户将手机插入一辆汽车时,用户能通过说“Hey Siri”来启动Siri语音助手。
这听起来是不是很熟悉?Android 4.4用户能够通过手机主屏幕上的“OK,Google”语音命令启动Google Now应用,而Moto X用户还可以通过“OK,Google”激活手机。
如今,iPhone和iPad用户能够在不进入应用界面的情况下即可回复应用通知。用户只需将通知拉下来便可快速回复短信或是Facebook帖子之类的信息。
这一功能同样也存在于Android系统。例如,在通知菜单可以将一条Gmail通知快速存档,不过在你试图回应信息时,Gmail应用将会被打开。作为一款流行的第三方Android界面,CyanogenMod添加了能够快速访问或回复短信通知的功能。
TestFlight是苹果在今年早些时候收购的一项技术,有了这项技术,一款应用正式在App Store上发布前,iPhone和iPad用户便可进行测试应用。这其实不足为奇,毕竟谷歌很长时间以来一直都允许Android用户测试应用。
苹果App Store的另一项改进功能便是苹果所谓的“应用程序预览”,这项功能允许用户在下载某一应用前观看这款应用的视频演示。而Android开发者一直能够在Google Play上添加他们的应用视频演示。
在全新的iOS 8中,苹果iMessage应用也得以更新。iMessage用户可以发送音频和视频信息,并可与他人分享自己的位置。此外,用户还可以设置在指定时间后自动销毁音频和视频信息,正如在Android和iOS系统上都很有名的Snapchat(阅后即焚)功能。而另一款流行的跨平台消息传递应用WhatsApp同样允许用户与联系人分享自己的位置,并支持用户发送音频和视频信息。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。