CNET科技行者 10月20日 北京消息:高通与商汤科技今日宣布,计划围绕移动终端和物联网(IoT)领域产品,在人工智能(AI)和机器学习(ML)方面展开合作。此次合作将发挥两家公司在人工智能领域的技术专长,包括商汤科技的机器学习模型与算法,以及能够为客户端人工智能提供先进异构计算能力的骁龙顶级和高端系列平台。双方希望由此推动终端侧人工智能的普及和发展,其中包括在创新视觉和基于摄像头的图形处理等领域。
智能手机和联网摄像头等终端正伴随着人工智能的发展而变得更加智能。相较于仅在云端部署人工智能,在终端侧部署人工智能,具备诸多优势,尤其是可支持终端在有无网络连接的情况下都能实现可靠运行。终端侧人工智能的其他优势还包括即时响应、隐私保护,以及增强的可靠性。
图:高通高级副总裁兼QCT中国区总裁武商杰(右)与商汤科技联合创始人、CEO徐立博士(左)
商汤科技联合创始人、CEO徐立博士表示:“AI商业生态的大规模爆发,仅靠单方面的力量难以实现,多厂商联手合作结盟势在必行。商汤科技与高通的战略合作,将充分发挥算法+芯片融合的优势,打造推动终端智能化的内核,成为撬动整个AI生态的新支点,推动终端产业的升级,为终端用户带来更多便利。”
高通产品管理高级副总裁Keith Kressin表示:“高通已在人工智能领域进行了十余年的基础性研究。事实上,许多目前正在出货的、搭载骁龙移动平台的终端都已经利用了终端侧的人工智能。我们期待此次与商汤科技的合作成果,能为成千上万使用移动终端的客户,进一步加速全新的、令人激动的终端侧人工智能功能的发展。”
目前,高通正专注于优化骁龙移动平台,面向智能手机、物联网(IoT)和汽车行业,加速计算机视觉和自然语言处理领域中诸多人工智能用例的发展,并在无线连接、电源管理和摄影等领域进行更广泛的研究。商汤科技是人工智能领军企业,在深度学习算法创新领域扮演着重要的角色,并搭建了自主原创的深度学习平台Parrots,使得其可以快速、低成本地研发各种丰富多样的AI算法,进行算法创新。商汤科技在算法模型小型化上取得了突破性技术进展,其与高通的战略合作,将极大提升算法与芯片结合的速度和效能,让商汤的AI算法迅速得到普及推广。
双方合作的首次公开演示将于2017年10月29日-11月1日在深圳举行的中国国际社会公共安全博览会(CPSE 2017)期间,在丽思卡尔顿酒店的高通会议室(#23-26)进行独家展示。
关于商汤科技
商汤科技专注于计算机视觉和深度学习的原创技术,是中国最大的新锐人工智能公司。作为全球领先的深度学习平台开发者,商汤科技致力于引领人工智能核心“深度学习”的技术突破,构建人工智能、大数据分析行业解决方案。以“坚持原创,让AI引领人类进步”为使命,商汤科技建立了国内最大的、也是唯一自主研发的深度学习超算中心,并成为中国最大的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦属行业最高,在多个垂直领域的市场占有率位居首位。目前,商汤科技已与众多知名战略合作伙伴和大客户建立合作,赋能AI于多个行业,迅速落地包括人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等各类应用技术。商汤目前已服务超过400家客户,包括高通、英伟达、中国移动、银联、华为、小米、OPPO、vivo、微博等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、机器人等多个行业。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。