CNET科技资讯网 4月6日 北京消息:根据最新研究预测,2025年全球的数据量将是现在的10倍,存储解决方案提供商希捷科技公司建议,全球企业的领导者更加注重未来几年推动数据增长的宏观趋势,同时评估业务流程,从产生、存储、使用和管理数据方面来挖掘数据未来的价值。
国际数据公司(IDC)白皮书《数据时代2025》(希捷赞助)预测,2025年,全球的数据信息总量将会升至163ZB,这表明注重数据价值的时代已经来临,并逐渐取代了从模拟数据向数字化转变的时期;产生、使用和管理对生活产生重要影响的数据信息,对于消费者、政府和企业的正常生活和运转必不可少。消费者和企业将持续在不同设备和云之间产生、分享和访问数据,增长速度也将超出此前的预期。
此外,《数据时代2025》还预测,2025年全球数据量产生的第一大主体将由消费者转移到企业,届时企业产生的数据量将占到全球数据总量的60%。企业领导者将可以从这些海量数据信息和其价值中获得新的商业机遇,但同时也需要对收集、使用和存储数据的策略进行详细规划。
根据IDC白皮书显示,目前数据驱动的趋势已经开始影响每一个企业,数据产生的主体正在由消费者转变为企业,其主要驱动因素如下:
由商业数据向生活关键型数据的转化——到2025年,全球数据总量的近20%将成为影响日常生活的关键数据,近10%将变为超关键数据。
Ÿ嵌入式系统和物联网(IoT)——2025年,全球每天每个人与联网设备互动的次数将近4800次,平均每18秒将产生一次互动。
Ÿ机器学习改变产业布局——IDC预测在2025年,全球数据的数据分析总量将增至5.2ZB,是原来的50倍。
Ÿ移动和实时数据——2025年,超过25%的数据将成为实时数据,物联网实时数据将占其中的95%。
Ÿ自动化和机器对机器技术将改变从传统途径产生数据的形式——娱乐内容的增长成为过去十年产生数据的主要动力。未来十年,生产力推动型和嵌入式数据,以及非娱乐性图片及视频(如监控和广告等)将成为推动数据量增长的新动力。
希捷科技首席执行官Steve Luczo表示:“新的研究表明大数据时代已经来临,但目前我们远远低估了数据蕴含的巨大潜在价值。机器人、机器学习等行业产生的分析、新业务、新想法以及新的生态系统非常振奋人心,同时其深远的社会和经济效应也在影响着我们的社会。对目前的企业以及未来的企业家而言,这将拥有巨大的挖掘数据价值的机遇,而全球企业的领导者将在未来数十年不断发掘这些机遇。”
IDC高级副总裁Dave Reinsel表示:“从无人驾驶汽车到智能化的个人辅助设备,数据已成为了快速增长的数字化生活的命脉,也为企业创造了前所未有的机遇。科技创新对评估、甄别和充分处理庞大数据信息量中包含的繁琐因素非常重要,而为这些新兴技术提供服务的存储技术将发挥日益关键的作用。”
欲了解IDC白皮书《数据时代2025》详细内容,请访问www.DataAge2025.com
关于希捷
通过创新数据的存储、共享和使用的方式,希捷致力于为人类体验创造空间。详情请浏览希捷官方网站www.seagate.com,www.seagate.com/cn/zh,希捷官方微博http://weibo.com/seagatecn,希捷官方优酷频道http://i.youku.com/seagatetechnology,或希捷官方YouTube频道https://www.youtube.com/user/SeagateTechnology。
# # #
© 2017年希捷科技有限公司。保留所有权利。于美国印制。Seagate、Seagate Technology和Seagate标记是希捷科技有限公司或其附属公司在美国和/或其它国家的商标或注册商标。所有其他商标或注册商标归各自所有者拥有。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。