作者|高飞
操作系统和数字体验的关系是最直接和紧密的。
举个例子来看,20年前,1992年微软发布了划时代的操作系统,可以流畅支持鼠标操作的Windows 3.1。这就意味着,即使一个用户的电脑的硬件没有任何升级变化,假设还是286或386,也依然可以通过一个叫“扫雷”的游戏体验到用鼠标操作电脑的乐趣。
这个例子,也可以直接套用到鸿蒙(HarmonyOS)操作系统的一项特性——分布式能力上。
鸿蒙强调了它的八项创新能力,包括分布式能力、原子化服务、AI、地图、音视频、隐私安全等,「分布式」是第一个创新特征。
当时被强调最多的特性,也是分布式,即支撑鸿蒙作为面向万物互联的操作系统最核心能力。
消费者的手机即使是硬件没有任何的变化,也能够通过鸿蒙的分布式软总线、端云协同等能力,获得以前没有感受过的跨设备应用和数据流转体验。
而对开发者来说,他们也得到了“一次开发,多端部署”的编程体验,更容易开发出“终端可分可合,数据自由流转”的应用场景。
因此,鸿蒙做的事儿,虽然初衷是替代,但是,是更有意义的替代,也是鸿蒙区别于同行,在发展理念上的第一个发展抓手。
当然,只有新特性,还不足以吸引开发者的目光。
几十年前,IBM的OS/2 操作系统,有很多Windows 没有的特性,但是因为装机量不够多,所以缺乏开发者新的应用支持,所以还是没能赢过微软。
鸿蒙的第二个抓手就是装机量。
华为不能再用谷歌GMS的时候,正值智能手机业务发展的高峰,不仅在中国,甚至在欧洲市场也塑造了高端品牌形象。
但是对于开发者来说,更重要的是,华为手机的既有的巨大的存量市场。
有了数亿现有设备的支持,和后续虽然没有5G、但是依然得到国内消费者追捧的新机,让鸿蒙平台的开发者更容易、更快速的获得市场回报,而不是像早期Linux系统的发展一样,要经历一个漫长的爬坡期。
或许是鸿蒙系统本来是为物联网系统打造的,所以鸿蒙从一开始,就非常注重非手机终端的支持。
我们一直在说“万物互联,万物智能”。鸿蒙应该是这八个字的坚定践行者。
拿业界最关心的产品「汽车」来说。
虽然对于汽车的评价有多样化的指标,消费者也有多元化的口味,但是目前来看,鸿蒙赋能的车机体验,确实有比较一致的好口碑。
所以,余承东就曾经毫不客气的说,鸿蒙座舱是“车机天花板”,特别是,有像“手机”一样流畅丝滑的车机。
不过,还有一些非常值得关注的,也是比较容易被忽视的行业场景。
比如在医疗健康领域,华为和301医院、北京大学第一医院合作,做到基于华为手表检测到的HRV、呼吸率、血氧、异常咳嗽音等生理参数,进行肺功能评估,实现慢阻肺风险筛查。
实际上,相对消费电子这样对AI等新技术使用的非常靠前的领域,传统行业有许多场景是落后于技术发展的。甚至,如果用技术用的不好,还不如没有技术。
无疑,以后的房屋装修,除了传统的水电墙面木工,必然会增加一项以网络为核心的数字化、智能化。
其实严格来说,汽车也属于这个范畴。如果没有新能源和智能化两个新引擎,百年汽车工业的市场版图,一定不会是现在的面貌。
把智能手机上已经用的非常纯熟的AI等能力,正如同将元气释放到传统行业中实现数字化转型,这是鸿蒙作为新OS的第三个抓手,应该也是最有潜力的抓手。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。