5月26日下午消息,2015贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会(以下简称“数博会”)今天上午在贵阳正式拉开帷幕。国务院总理李克强发来贺信,副总理马凯出席开幕式并致辞。
小米科技CEO雷军出席了本次峰会并致辞,雷军介绍了小米云服务发展情况,阐述了行业发展的困境。
雷军称,“小米云服务的客户已经达到9700万人,我们已经为用户存储405亿张照片,504亿视频,存储量超过100个P,其实100个P在今天看来还不是特别大的数字,但是每年增长6倍,每个月新增加都在3、4个P的话,其实这个压力是空前的。”
雷军介绍,小米去年定义了翱义云服务这个计划,在这个计划里面,小米的重心放在应用层,金山软件中心放在开放云服务,去年金山的董事会也批准了这项计划,从自有的资金里面拿10亿美金投资云服务,今年在云服务收入大概会增长4到5倍。
虽然云服务的前景非常可观,投入也非常大,但是雷军认为,但是整个市场还在初期阶段,如果没有配套的商业模式的话,其实发展压力还是非常大。在雷军看来,全行业的关键点是怎么探索数据的价值,怎么挖掘大数据时代的商业模式,是我们今天当务之急。
以下为雷军演讲全文:
各位领导、各位来宾大家好!
站在小米这个角度,我们充分感受到了大数据的浪潮扑面而来。为什么呢?因为小米的主业是做智能手机,今天的手机不是单纯的通讯工具,它其实是一个随身携带的电脑,更重要的是,它也是随身携带的相机。正因为这个特点,它无时无刻不在产生着海量的数据。
两年前我们意识到这个需求之后,所以我们开始做云服务,每年数据量增长多达6倍。 我简单跟大家分享一下我们的数据,现在在使用我们云服务的客户已经达到9700万人,我们已经为用户存储405亿张照片,504亿视频,存储量超过100个P,其实100个P在今天看来还不是特别大的数字,但是每年增长6倍,每个月新增加都在3、4个P的话,其实这个压力是空前的。而且两年前小米进入了智能设备领域,这个领域增长也是非常迅猛,比如说我们空气净化器每个月销量过10万台,我们监控头和运动相机每个月销量也是10万台。像手环这种便携穿戴式设备,我们每个月的销量过了100万台。
这么多设备无时无刻不再产生数据,所以我们对大数据感受非常深刻,所以在去年我们定义了翱义云服务这个计划,在这个计划里面,小米的重心放在应用层,金山软件中心放在开放云服务,去年金山的董事会也批准了这项计划,我们从自有的资金里面拿10亿美金投资云服务,经过过去一年努力,我们预计今年在云服务收入大概会增长4到5倍,所以随着整个大规模的推进,我自己的感受到今天最大的困难是什么呢?今天最大困难是大数据时代的投入也非常大,但是整个市场还在初期阶段,如果没有配套的商业模式的话,其实发展压力还是非常大。那么怎么保证大数据能够持续的发展?我觉得全行业的关键点是怎么探索数据的价值,怎么挖掘大数据时代的商业模式,是我们今天当务之急,谢谢。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。