8月31日由七牛云存储主办的系列技术沙龙“开发者最佳实践日·第1期-流媒体技术专场沙龙”在广州创新谷咖啡厅成功举办。
移动互联网成为新一轮浪潮后,手机作为外界感官链接的重要性已愈发明显,之前手机碎片化时间消费的是偏文字偏图片类似信息流的,从去年开始,用手机拍视频和直播的产品也越来越多,这种短视频的应用如美拍、微拍、秒视就是载体转向音视频的应用,开发者最佳实践日第一场就请来了流媒体领域专业的Sewise矽伟智科技,中国最大的原创视频社区爱拍及国内第一支从事Google Glass开发的团队Glass X给开发者讲述流媒体实践的经验、应用场景、遇到的技术问题及解决方法。
沙龙开场,首先由七牛首席布道师徐立带来《快速开发移动应用》 ,在移动互联网时代,用户量起来的速度是非常快,当到一定规模比如用户激活数六七个亿之后,可访问性有保证吗?你怎么样快速照顾到所有的终端客户,当体量成长起来以后,如何快速分发,用户分散在全国甚至全球各地,富媒体消息如何保证高质量的可访问性和到达率?作为流媒体应用场景产生的一个视频是几个兆,支持分块上传和断点上传的程序逻辑更复杂如何解决,在一个产品必须快速迭代的时代需要开发者更多地“善假于物”,徐立针对这些问题给出了答案。
(七牛云存储首席布道师 徐立)
在流媒体领域有专业处理经验的Sewise矽伟智科技CTO 李立欣详细讲解了流媒体包含的编码、分发、和播放的关键技术,包括如何选择合适的编解码器,如何实现多屏支持的播放器,流媒体分发主要技术分发的渐进式下载、实时流式传输技术、自适应流媒体技术的优缺点及影响,这些流媒体技术的选择会直接影响运营成本,处理文件的效率和访问用户的体验。例如,采用切片转码的方式,可以把利用率提高到90%,换来的转码时间是原来的一半。
(矽伟智科技 CTO 李立欣)
作为国内最大的原创视频社区的爱拍,爱拍CTO邹光先在现场给大家讲述了爱拍作为一个大型视频网站在完成闭环积累用户的过程中,如何详细配置视频服务器及性能,完成内容分发的。爱拍作为一个视频网站,视频流量很多,前期运营成本也非常高,因此也在实践中摸索出了降低成本的方法:一是选择合适的编码方式,码率降低10%成本就能降低10%,其次做动态的限速,根据视频文件的码流分布成本又可以降低20-30%,其三做差异化服务。作为做了七年视频服务的爱拍,尤其提到了七牛云的断点续传功能给爱拍网站带来优化的节省用户流量的用户体验。
(爱拍联合创始人&CTO 邹光先)
会议的最后环节是最佳实践环节,Glass X的CTO 林满佳用他们亲身案例来说明了作为国内第一支关注并基于Google Glass 开发的团队是如何部署网络、服务端、客户端的。并给出了一系列在创业初期应该注意到的问题,比如上线初期在测试和代码审核的基础上再去堆代码,比如自建成本太高一定要选择云服务云存储。
(Glass-X CTO 林满佳)
提问环节,开发者踊跃提问中。
围观3D打印机。
“开发者最佳实践日”是由七牛云存储发起并联合各方小伙伴为开发者举办的系列技术沙龙,关注开发者在实际应用中可能遇到的技术问题,致力于为勇于创新的开发者们提供行业内最前沿最热门的技术干货,以技术驱动应用创新,让更多的开发者享受技术带来的生活乐趣。敬请期待9.21日北京车库咖啡,开发者最佳实践日·第2期-在线教育技术专场!
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。