生成式AI的创新和发展速度前所未有,而这仅仅是一个开始。人们使用这项技术的方式、场景和原因将会非常广泛,甚至超乎想象。初步估计显示,生成式AI市场规模将达到1万亿美元。
生成式AI不仅有望改变人们搜索和创作内容的方式,还能够改善日常生活。借助生成式AI,智能手机能够成为真正的数字助手,让用户自然地沟通交流,并获得贴切的回答。PC用户可以利用这项技术阅读或撰写电子邮件、起草文档和自动创建演示文稿。在驾乘汽车时,对话式车内助手可以对汽车充电、购买停车券或在回家途中预订晚餐提供建议。商店的AI服务台和智能购物车能够根据每周特惠、预算金额和家庭偏好,帮助消费者拟定食谱。
为了释放这项技术的全部潜能并满足日益增长的需求,生成式AI既需要云,也需要数十亿能够以低功耗进行高性能AI计算的网联终端,如智能手机、PC和汽车。这就是混合AI。混合AI计算架构在云端和终端进行分布式处理,能够优化效率并提升整体用户体验。
生成式AI处理可以直接在终端侧运行,也可以按需发送到云端,或者将两者相结合——无论采取何种方式,对用户而言都是无缝实现的。
用户期望拥有与传统搜索类似的体验,那就是能够瞬间显示搜索结果。要满足这样的期望,还要保证服务质量,仅利用云端处理的成本太高,尤其是在需求高峰期,因此难以实现规模化。
数据中心能耗高且价格昂贵。据估计,每一次基于生成式AI的网络搜索查询(query),其成本是传统搜索的10倍。以每天超过100亿次查询计算,每年的增量成本可能达到数十亿美元。网络搜索只是生成式AI变革多个行业的众多方式之一。
除成本外,在云端进行全部推理处理还面临隐私、可靠性和性能方面的挑战。当请求进入云端、数据离开终端时,就会产生潜在的安全问题。事实上,由于收集和存储个人数据等监管和合规问题导致模型被禁用或暂时禁用的情况已经出现。
混合AI势不可挡。随着人们不断探寻使用生成式AI的新方式,对云基础设施的需求将激增。混合AI处理将是计算的下一次转型,正如我们所看到的从大型主机演进到台式机,再到今天云和我们手中的终端相结合的模式一样。
利用高性能、低功耗终端的处理能力,将能够高效推动生成式AI的规模化扩展。云端和终端将协同工作,通过强大、高效且高度优化的AI功能,打造下一代用户体验。
本文原载于Fortune.com:https://fortune.com/2023/05/15/qualcomm-ceo-ai-is-going-to-touch-every-corner-of-our-lives-devices-tech-cristiano-amon/
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。