7月5日,由莫斯科国立大学举办的MSU2022世界编码器大赛硬件编码器成绩全部揭晓。快手StreamLake首款自研智能视频处理芯片StreamLake-200(SL200)夺得4K和1080P赛道24项指标中的16项第一。
据悉,这是快手StreamLake首次参加MSU世界编码器大赛,在全部6个子赛道中斩获5个“最佳ASIC编码器”称号,标志着SL200芯片在高密度、高质量及超高质量下均达到业界领先水平。
MSU大赛在视频压缩领域极具影响力,至今已连续举办了十七届,吸引了国内外多家知名科技企业和组织参赛。本次MSU2022世界编码器大赛硬件编码器赛道共有14个国内外企业参赛,包括腾讯、字节跳动、Intel、英伟达、AMD等。比赛分为4K30fps、4K60fps、4K120fps、1080P60fps、1080P120fps、1080P240fps共6个子赛道,快手StreamLake参加了全部硬件赛道比赛。
随着视频行业的发展,4K超高清在短视频、长视频、广电、高质量监控等领域的应用越来越广泛。在多年积累的基础上,SL200芯片采用了多项快手自主创新技术,对4K/8K超高清视频进行了针对性的优化,实现了业界领先的清晰度和流畅度,并达到极高的编解码密度。本届MSU比赛中,SL200芯片在1080P和4K两个赛道都斩获佳绩,显示了该芯片广泛的实用范围,将对我国未来智能视频行业的发展起到基石的作用。
该SoC芯片集成了快手领先的视频编解码、图像处理、AI推理、内容自适应编码等关键技术,具备高质量、高密度、智能化的特点。SL200芯片于2022年6月流片成功之后,快手团队设计研发了基于该芯片的板卡和服务器系统,并完成了数月的大规模灰度和压力测试,目前正逐步全面应用于快手短视频和直播业务,并已对外开放测试,联合多家合作伙伴共同探索更为广阔的应用场景。
目前,直播和短视频已经成为了视频消费中的重要部分,意味着视频流量迎来快速增长以及带宽成本不断增加。SL200芯片具有“高编码质量+高密度”的特性,可极大限度降低带宽成本,同时提供行业领先的编码质量。其中,高编码质量相比x265 medium节省约30%码率,另外支持画质增强;高转码密度方面,单卡(2颗芯片)支持8路4K60fps编码,还支持“一进多出”的转码模式。
随着4K/8K超高清视频被广泛应用于大型赛事、重要活动的直播/转播之中,为了提供更好的用户体验,广电行业在质量、稳定性、密度方面都对视频转码方案提出了更高的要求。SL200芯片凭借"AI+高质量视频编码"特性,相比国内某头部广电编码器厂商可以节省约40%的码率。另外SL200芯片提供了ABR、CBR、CRF三种码控方案以应对有线电视、IPTV、OTT和新媒体场景对于码率控制的诉求。
而在云游戏场景下,对延时有着极高要求,例如射击类游戏,对操作精准度有很高要求,通常需要将游戏响应延迟控制在50ms以内;VR等肢体配合类游戏,整个游戏链路延迟需要低于25ms。在整个云游戏的延迟通路中,通常对视频编码延迟的要求是控制在6ms内。SL200芯片具有“低延迟+更好的编码质量”的特性,在4ms的超低延时下,可以获得1080P超清画质,并且相比某主流GPU在可节省约14%的码率。
此外,快手StreamLake搭建了基于SL200芯片的视频基础设施,正式发布StreamLake硬件编码器产品,利用快手领先的视频编解码及增强和修复算法,帮助客户提升多媒体处理环节的质量与效率,可应用于IPTV、OTT、广电、智能监控、互联网视频直播等多个领域的超高清直播平台建设及视频压缩编码。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。