以“智联世界、元生无界”为主题的2022 世界人工智能大会(WAIC)于9月3日在上海圆满落幕。WAIC作为全球人工智能的“科技风向标、应用展示台、产业加速器、治理议事厅”,是全球人工智能领域最具影响力的行业盛会。
「WAIC 2022 · AI 开发者日」作为WAIC大会最重要的技术论坛之一,以“AI开发者所真正关注的”为主题,汇聚了2021 年图灵奖得主、中外院士、世界级技术专家与科技企业创始人等 15 位学术界和产业界重磅嘉宾。九章云极DataCanvas公司开源技术副总裁、D-Lab主任杨健受邀出席论坛,并围绕如何运用完整的、综合性、端到端因果学习工具包解决“因果发现、因果量识别、因果效应估计、反事实推断和策略学习”五大关键问题,发表了《YLearn:因果学习,从预测到决策》的精彩主题演讲。
因果学习:人工智能发展的技术突破口
随着机器学习和深度学习在发展过程中遇到技术瓶颈,人工智能发展速度逐渐放缓,究其原因,一方面是机器学习存在着泛化能力较弱、解释性不强、决策支持能力不足的关键性问题;另一方面政府和企业提出“智能决策”的需求,即以数据驱动的方式实现自动化决策来提高整体运营效率。
随着机器学习建模越来越多的应用,人工智能技术从预测性分析向指导性分析升级转移,自动化“决策”成为政府和企业在数智化时代的核心需求,决策者需要一个可理解的AI决策逻辑以及具有可信度、可解释的决策结果。而当前机器学习主要是完成预测性任务,难以满足政府和企业自动化决策的需求。
Gartner发布的《2022年新兴技术成熟度曲线》中提到,因果人工智能是加速AI自动化的关键技术之一。因果学习成为补充机器学习问题的关键技术,人工智能发展极具潜力的技术突破口,引发业界的广泛关注和热点研究。
YLearn:因果学习,从预测到决策
2019年图灵奖得主Yoshua Bengio先生曾提到,“因果关系对于机器学习的下一步进展非常重要”。从2019年开始,因果学习的学术研究新成果不断出现,发表的相关论文数量每年都在翻倍增长。目前,从国内外关于因果学习的研发来看,出现了很多因果学习的工具,例如DoWhy、围绕解决因果效应评估类问题的EconML,用来完成uplift建模的CausalML以及专注解决因果发现问题的Causal Learn。但这些工具都只能解决因果学习中的部分问题,又因为不同的工具所依赖的理论框架和结构体系不同,导致工具包之间也难以融合使用。因果学习领域则是缺少系统、完整的、综合性、端到端的工具包。
九章云极DataCanvas公司自主研发的一站式处理因果学习完整流程的开源算法工具包YLearn,是目前首款端到端、较完整、较系统的因果学习算法工具包,率先解决了因果学习中“因果发现、因果量识别、因果效应估计、反事实推断和策略学习”五大关键问题,降低“决策者”使用门槛,不断满足政府和企业自动化“决策”的需求。
GitHub 地址:https://github.com/DataCanvasIO/YLearn
YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy、Interpreter、Whatif等部件组成,各部件支持独立使用,也支持统一封装。为帮助用户更直观地理解数据、调整策略,YLearn提供了因果图、因果效应解释、决策树等重要模块的可视化输出。
与国内外因果学习工具相比,九章云极DataCanvas公司的YLearn具有一站式、新而全、用途广的特点。
结合政府和企业在决策任务上的需求,YLearn将与九章云极DataCanvas公司的自动机器学习平台相结合,通过与AutoML技术的融合,提高机器学习的鲁棒性、泛化能力和解释性,实现因果学习的自动调参和优化,进一步降低使用门槛。同时,YLearn解决了市场上缺失功能强大且完整的因果学习工具包这一“卡脖子”难题,将技术回归业务,支持决策类业务场景,为客户提供多种决策方案。
因果学习助力人工智能迈向新阶段
人工智能技术作为新一轮科技革命和产业变革的核心力量,正处于从预测迈向决策的新发展阶段。因果学习在这一阶段发挥着重要作用,弥补机器学习的理论缺陷,逐步解决从“是什么”到“为什么”的问题,从政府和企业的需求出发,提升“AI决策”的可信度和可用度,将AI能力更进一步交为业务所用。
为了更好的带动国内因果学习领域的发展,推动因果学习的多元化发展,九章云极DataCanvas公司联合世界人工智能大会组委会办公室、机器之心、上海市人工智能行业协会、天池共同举办黑客松「因果学习和决策优化挑战赛」,为全球各路开发者精英们提供同台竞技的平台。挑战赛以“如何优化干预方案能使因果效应最大”为主题,将因果学习中的普适性问题具化,旨在考察选手使用因果推断在决策方案制定问题上的估计能力。
作为业界首个面向「因果推断全流程」的赛事,收到来自全国各地包括运用人工智能相关技术赋能数智化升级的企业、结合人工智能技术进行创新探索的科研单位、高等院校的团队及专业开发者等近四千支队伍报名参赛。参赛队伍经过23天的同台竞技,不断探索因果学习领域的技术高峰,刷新成绩纪录,角逐出TOP18具有雄厚的AI技术实力以及富有创造力的优胜队伍。
未来,九章云极DataCanvas公司将不断创新研发开源工具,将政府和企业的业务需求与技术实践相结合,助力政府和企业数智化升级,推动人工智能向新阶段。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。