据悉,语音识别技术公司Novauris成立于2002年,总部设在英国,该公司十多年来一直致力于提高语音识别技术的研究,而苹果可能现已将这家公司收入麾下。
据科技博客网站TechCrunch于当地时间本周四报道称,苹果去年收购了语音识别技术公司Novauris,但无论是苹果还是Novauris,双方当时都未对外披露这笔交易。不过TechCrunch称其周四已向Novauris办公室致电确认并证实了这一消息。
苹果一直非常积极地致力于Siri的研究改良,希望能使得这个iOS移动操作系统中的虚拟个人助理更加有效地理解用户命令并执行。而自2011年Siri首次在苹果iPhone 4S上推出以来,这款应用就一直面临着来自其他虚拟助手应用的激烈竞争,如谷歌推出的Google Now和微软最新发布的Cortana。
Nouvaris擅长为设备提供自动语音识别技术,能够访问存储在本地设备或远程服务器上的信息,迅速进行查询回复。苹果目前的Siri主要是通过设备获取查询信息,然后将其传递到苹果远程服务器上,最终找到答案后再返回用户设备中。当然,我们现在还尚不清楚Novauris的语音识别技术将会从哪个方向帮助苹果改良Siri。
据TechCrunch表示,Novauris员工已于去年秋季加盟Siri团队。当TechCrunch致电Novauris办公室时,该公司回应称“苹果”,并证实苹果已于去年收购了这家公司。
正如过去一样,苹果不会证实它是否真的收购了Novauris,该科技巨头仅仅向TechCrunch表示,苹果会定期收购一些“小型技术公司”,但并不披露其“目的或计划”。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。