
在今天的全球CDN2014会上,蓝汛ChinaCache副总裁付亮在谈到蓝汛在大数据下的愿景时表示:“马云先生一个人在天上飞太久,肯定会孤独的。”
言下之意可能在意指蓝汛希望将来在大数据下的作为与阿里并驾齐驱。
图为蓝汛ChinaCache副总裁付亮
付亮指出,关于数据,蓝汛ChinaCache 绝对有话语权。ChinaCache 每天拥有30亿次页面访问量、10亿次视频点播量、日志每天访问流量超过35tb。由此产生的数据将为其在大数据下的研究占优。
不过,在大数据领域,互联网各行各业都在做这种事情。付亮称,与其他企业不同的是,ChinaCache 做大数据主要在于客户,帮助客户降低进入互联网的产业门槛,为其提供一整套从海量日志分析服务平台(CDA)到海量引擎(CME)的大数据服务。
该大数据服务主要适用于互联网、企业的日常运营数据分析、用户行为画像、提升IT运营敏捷度,以及海量数据下实时分析和全文检索的解决方案。
在这一点上,蓝汛在政府媒体、企业和运营商的案例中都有相关建树。
在政府媒体方面,蓝汛早在两年前就与工信部以及工信部研究院有合作,其解决之道在于通过内容感知网络服务平台,帮助客户网站内容的及时推送、应对各种潜在性恶意攻击和突发事件不可预知的访问流量。
对于企业,蓝汛为中国工商银行无故障服务多年,通过对网站访客行为和网站运行数据分析,使其不仅在访问量得到提升,在经济效益也有收益。
在运营商的优化上,蓝汛从2012年开始与上海电信和运营商合作,提供从内容引入到推送到优化一整套解决方案。
付亮最后表示,蓝汛也正在向运动数据、健康数据、人工智能等新兴领域抛橄榄枝。
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。