CNET科技资讯网 3月30日 深圳消息: 距离人工智能被确立为一门独立学科已经过去60年,它终于要走入每个人的生活。3月29日,阿里云在云栖大会·深圳峰会上发布ET医疗大脑和ET工业大脑,同期发布的还有用可视化的拖拽方式让开发者使用人工智能技术的机器学习平台PAI2.0。
阿里云总裁胡晓明现场介绍了ET医疗大脑如何辅助医生判断甲状腺结节点,大屏上投出的视频演示显示ET通过计算机视觉技术,在甲状腺B超影像上圈出结节点,并给出良性或者恶性的判断。
“机器要做人类的助手,而不是竞争者。”胡晓明表示,不论是ET进入医疗和制造领域,还是机器学习平台PAI2.0的推出,都是为了让人工智能这门复杂而前沿的科学变得更加通用,为“万物智能”提供基础设施和智能引擎。
在中国云计算市场遥遥领先的阿里云,正在开启新的征途:通往智能之路。
医疗影像越来越多以数字化的模式呈现,这让医学科学家们想到是否可以用机器来帮助医生分担一些工作负荷。阿里云的人工智能ET“应聘上岗”,开始成为各个领域的“实习医生”,它在那里全天无休,保持24小时在线,跟医生学习如何“看”B超结果,圈出结节区域,并且给出初步的良性或者恶性判断。
用大量医学数据来训练机器是人工智能的核心,深度学习技术已经让机器在“看”、“听”、“说”等方面的准确率大幅提升。云计算的普及成为这些技术突破的关键性因素。在6年前,IBM用一间屋子大小的计算机才能在一档问答节目中取胜,现在只需一根网线就可以获得训练海量数据的计算能力。
ET的“实习总结”让医生们感到惊讶,它不单为医生分担了工作负荷,诊断的准确率也超出了人类医生的平均水平。数据显示,人类医生的平均准确率为60%-70%,而当下算法的准确率已经达到85%。
不过,这并不意味着人工智能将取代医生,ET做出的初步诊断会由医生再做核查,医生也可为ET注入新的知识,把ET“调教”成全能助手。
这也是阿里云总裁胡晓明在发布会现场为ET医疗大脑下的定义,这是一个开放的人工智能系统,除了阿里云的人工智能科学家,也将吸收外部的精良算法和医学经验,让ET可在患者虚拟助理、医学影像、药效挖掘、新药研发、健康管理等领域承担医生助手的角色。
大会上,阿里云宣布联合英特尔、linkdoc启动天池医疗AI系列赛,在这个汇集了6万多名AI算法科学家的平台上,寻找早期肺癌诊断的智能化判断最优算法,让机器可以通过原始CT影像图片协助医生进行诊断。
如果制造业能够整体提升1%的良品率,按2016年全国工业总产值计算,这将为中国制造总体提升上万亿的利润空间。阿里云为工厂提供的方案更有数字上的经济价值,当日发布的ET工业大脑首先瞄准的就是中国工厂的良品率目标。
胡晓明在现场提出“中国智造1%”的概念,希望让工业生产线上的机器拥有智能大脑,“中国制造业如果提升1%的良品率,意味着一年可以增加上万亿的利润。”
以单个案例看来,阿里云人工智能技术已经使用到了中国的工厂里,并为位于江苏的光伏生产商协鑫在一年内节省了上亿成本,这一数字来自1%的良品率提升。ET工业大脑在协鑫的工厂里,通过分析上千个参数,来优化光伏切片的精密工艺。
让机器能够感知、传递和自我诊断问题,ET工业大脑通过分析工业生产中收集的数据,优化机器的产出和减少废品成本。通过并不昂贵的传感器、智能算法和强大的计算能力,ET工业大脑解决的是制造业的核心问题。
据了解,徐工集团、中策橡胶、吉利等制造领域的标杆企业都在积极引入ET工业大脑,投入智能制造的浪潮之中。
“目前ET工业大脑已经在流程制造的数据化控制、生产线的升级换代、工艺改良、设备故障预测等方面开展工作。”阿里云人工智能科学家闵万里表示,ET的目标是成为一个不断吸收专业知识的 “大脑”,可以指挥各种类型的工业躯体。“我们希望用21世纪的机器智能,帮助人类更好地指挥20世纪的机器”。
“人工智能要想真正成为普惠科技,需要一款更加通用的生产工具。”阿里云首席科学家周靖人在现场表示,在过去的一年时间阿里云协助用户在医疗、工业领域落地了多项重大的人工智能应用,但如果要把人工智能技术走入每个人的生活,需要更加平台化的人工智能产品。
大会上,阿里云正式发布机器学习平台PAI2.0,以更丰富的算法库、更大规模的数据训练和全面兼容开源的平台化产品,让人工智能这门综合多门学科的技术,变成开发者只需要托拉拽就能可视化完成开发的普惠性技术。
不久前,阿里巴巴董事局主席马云在内部启动代号为“NASA”的计划,面向未来20年储备核心科技,机器学习、IoT、生物识别等领域智能化领域被放在突出位置。据了解,阿里“NASA”计划的研发成果都将通过阿里云对外输出,成为创新者的强大技术后盾。
23日马云在马来西亚谈及“NASA”计划时表示,科技是创造未来的关键,投入技术研发是希望让科技更加普惠,能让更多的人收益,“我们对一些很奇特但无法持久的技术不感兴趣。我们希望投资在那些能让人更有创造力的技术上。我们认为技术是要为人所使用,而不是人为技术而工作。”
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。