亿次。”

阿里巴巴高级技术专家 罗金鹏
4月20日, UBDC全域大数据峰会·2016上,阿里巴巴公共数据平台负责人罗金鹏首次对外披露了在阿里中台战略下,如何推动数据中台落地的个中细节。
据悉,中台战略是阿里巴巴于2015年底首次提出。作为阿里中台战略的核心之一——数据中台旨在对内提供数据基础建设和统一的数据服务,对外提供服务商家的数据产品。
OneData是阿里数据中台的核心,罗金鹏介绍,OneData体系建立的集团数据公共层,从设计、开发、部署和使用上保障了数据口径的规范和统一,实现数据资产全链路管理,提供标准数据输出。
统一数据标准是一项非常复杂的工作,譬如,针对UV这一相同的指标,在统一之前阿里内部竟然有10多种数据定义。据介绍,OneData数据公共层总共对30000多个数据指标进行了口径的规范和统一,梳理后缩减为3000余个。
尽管工程浩大,但是此举却为阿里带来了显著的收效。借助于OneData平台实时数据分析能力,在2015年双11当天,淘宝搜索排序中引入实时数据影响因子,实现增收数十亿元,罗金鹏表示。
在DT时代,数据暴增对存储计算成本带来很大的挑战。据罗金鹏介绍在没有建设统一的数据公共层时,阿里内部服务器需求量会在5年之后达到现在的100倍之多。而经过数据公共层的统一建设,5年后的服务器需求量相对会节约90%。
此外,阿里基于数据中台孵化了一个内部名叫“GProfile”全域用户档案的标签服务。“GProfile”根据用户行为,打上不同的标签,再推荐与买家消费能力和喜好匹配的商品。基于此每个用户在手机淘宝上搜索“连衣裙”,每个人看到的搜索结果都是不一样。
千人千面的个性化服务背后的数据基础就是“GProfile”。据罗金鹏的介绍,目前标签有300多种,如此多的标签,都是为了更精准地定位用户,从而实现更好的用户体验与精准营销。
除对内挖掘数据的价值,用技术驱动和创新内部的业务,阿里数据同时也将数据能力通过产品对外服务。而这一产品即是“生意参谋”,为商家提供多维度的数据服务,帮助商家通过数据分析来进行商业决策。
罗金鹏告诉记者,生意参谋可以用数据化来贯穿到企业管理的整体链路中,包括了,品类管理数据化、营销数据化、品牌数据化以及服务数据化。
据悉到目前为止,生意参谋已经为千万商家服务,月成交额30万元以上的商家中,逾90%在使用生意参谋;月成交金额100万元以上的商家中,逾90%每月登录生意参谋天次达20次以上。
在DT时代,数据已经成为推动商业发展的新能源,而数据中台的建设成为新能源能否在阿里巴巴生态中发挥价值的关键。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。