在当今时代,企业数据增长速度之快毋庸置疑,大数据时代可谓真正的来临。当大家都在绞尽脑汁考虑如何通过对现有数据的分析、挖掘来指导企业决策和创新时,可能忽略了一些事实:企业的数据存在哪里了?管理起来方便吗?想找数据容易吗?这些数据都被很好的保护了吗?
这让笔者想起一个形象的比喻,如果把数据存储的各种设备比喻为一间屋子,你是愿意走进来发现从地板到天花板堆满了杂乱无章的数据,还是愿意走近屋子发现有一个个文件柜,每个文件柜都把数据分门别类的放好了?
对于很多企业来说,不仅对数据的管理缺乏章法和有效手段,而且对待数据就像“守财奴”一样,舍不得扔。对于这点,CommVault公司产品管理总监Don Foster深有感触:“几乎没有人在管理数据的时候愿意点击删除键,因为他们不知道这个数据应该保存多长时间?它是否还有残余的业务价值?”他把企业一股脑地把数据存起来的做法称为“放进了数据保险柜”,看上去数据放在保险柜里边很安全,但是这些数据没法被寻找。
CommVault公司产品管理总监Don Foster
面对以上这些企业在进行数据管理时面临的挑战,CommVault所提供的数据管理平台,可以做到对数据的感知,细化来看,包括内容感知、应用感知、计算感知、存储感知。也就是可以知道数据由谁编制、创造;这个数据处于自身生命周期哪个部分;这个数据的年龄;这个数据存储在什么地方;应该以什么方式进行访问;还可以确定数据是云端数据、驻地数据或还是是虚机上的数据。
这一数据感知特征可以做到对数据的360度捕捉,从而为分门别类的管理数据奠定基础。而且这一数据感知特征是可以跨平台进行的,这也就规避了数据各自为政、信息孤岛的风险。
CommVault不久前委托IDC对亚太地区500多位IT高管进行了一项关于数据管理的调查,结果显示,50%以上的企业没有对数据进行有效的保护。造成这一结果的原因,除了以上提及的因素之外,企业面临着复杂的数据存储环境也是一个不争的实时。这一复杂性,不仅包括移动设备的快速增长、BYOD的普及,也包括企业存储介质从本地逐渐向虚拟环境、云端迁移。这种种的纷繁复杂,让企业面对数据管理问题一筹莫展。
对于这些困扰,CommVault中国区技术总监蔡报永告诉记者:“无论亚太还是中国的企业客户,大家都希望打破原来传统的分离独立式的管理模式,采用单一的平台。对所有的数据类型,无论对结构化数据、非结构化数据或者半结构化数据,从单一的平台入手进行管理,不仅让管理数据更加容易,也让企业可以更好地进行数据管理发展趋势的预测,也可以方便地访问到想要的访问数据。”
左:中国区技术总监蔡报永 右:亚太区高级市场营销总监Daniel CF Ng
这时候CommVault的Simpana就体现出优势了,它借助一个模块化的通用代码平台,提供数据的备份、恢复、归档、复制、报告和搜索功能。
统一平台的好处在于:第一防止数据丢失,原来分离的系统很难界定哪些数据可以被保护;另外当有灾难出现的时候,可以把结构化数据、非结构化数据快速恢复;当然对于存储节约、网络优化也很重要,因为采用单一结构节约物理成本、人员成本和管理成本。
针对企业不同规模,无论大型企业还是中小型企业;针对企业数据存储现状,无论结构化数据占据主要还是非结构化数据占据主要;抑或是企业数据主要存在PC中、本地数据中心或云端,CommVault Simpana的统一平台的功能都是通用的、标准化的,使用起来没有任何不同。而蔡报永表示:“其差别可能就在于定价方式和价格策略,比如你可以选择不同的价格套餐,所享用的服务的时间长短不同。”
他特别强调:对于中小企业或者当前数据量还不大的企业来说,其实他们同样需要一个好的数据管理解决方案,这就像盖房子打地基的道理一样,是确保房屋质量的关键。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。