生成式AI的创新和发展速度前所未有,而这仅仅是一个开始。人们使用这项技术的方式、场景和原因将会非常广泛,甚至超乎想象。初步估计显示,生成式AI市场规模将达到1万亿美元。
生成式AI不仅有望改变人们搜索和创作内容的方式,还能够改善日常生活。借助生成式AI,智能手机能够成为真正的数字助手,让用户自然地沟通交流,并获得贴切的回答。PC用户可以利用这项技术阅读或撰写电子邮件、起草文档和自动创建演示文稿。在驾乘汽车时,对话式车内助手可以对汽车充电、购买停车券或在回家途中预订晚餐提供建议。商店的AI服务台和智能购物车能够根据每周特惠、预算金额和家庭偏好,帮助消费者拟定食谱。
为了释放这项技术的全部潜能并满足日益增长的需求,生成式AI既需要云,也需要数十亿能够以低功耗进行高性能AI计算的网联终端,如智能手机、PC和汽车。这就是混合AI。混合AI计算架构在云端和终端进行分布式处理,能够优化效率并提升整体用户体验。
生成式AI处理可以直接在终端侧运行,也可以按需发送到云端,或者将两者相结合——无论采取何种方式,对用户而言都是无缝实现的。
用户期望拥有与传统搜索类似的体验,那就是能够瞬间显示搜索结果。要满足这样的期望,还要保证服务质量,仅利用云端处理的成本太高,尤其是在需求高峰期,因此难以实现规模化。
数据中心能耗高且价格昂贵。据估计,每一次基于生成式AI的网络搜索查询(query),其成本是传统搜索的10倍。以每天超过100亿次查询计算,每年的增量成本可能达到数十亿美元。网络搜索只是生成式AI变革多个行业的众多方式之一。
除成本外,在云端进行全部推理处理还面临隐私、可靠性和性能方面的挑战。当请求进入云端、数据离开终端时,就会产生潜在的安全问题。事实上,由于收集和存储个人数据等监管和合规问题导致模型被禁用或暂时禁用的情况已经出现。
混合AI势不可挡。随着人们不断探寻使用生成式AI的新方式,对云基础设施的需求将激增。混合AI处理将是计算的下一次转型,正如我们所看到的从大型主机演进到台式机,再到今天云和我们手中的终端相结合的模式一样。
利用高性能、低功耗终端的处理能力,将能够高效推动生成式AI的规模化扩展。云端和终端将协同工作,通过强大、高效且高度优化的AI功能,打造下一代用户体验。
本文原载于Fortune.com:https://fortune.com/2023/05/15/qualcomm-ceo-ai-is-going-to-touch-every-corner-of-our-lives-devices-tech-cristiano-amon/
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。