科技行者 2月27日 北京消息 吴恩达是全球范围内人工智能(AI)领域最具影响力的专家之一。他目前担任在线学习平台Coursera(是一个教育平台,它与全世界最顶尖的大学和机构合作,提供任何人可学习的免费在线课程)的联合主席兼联合创始人,亦在斯坦福大学计算机科学系出任兼职教授。他曾担任百度公司首席科学家,同时是谷歌Brain团队的创始人。
近期,在印度海德拉巴召开的2018年印度领导论坛(简称NILF)的采访当中,吴恩达表示终身学习( life-long learning)已经成为当今数字化世界中的新常态。他还分享了自己对于人工智能发展潜力的观点以及对这项技术的担忧。以下为经过编辑的摘录内容:
Q:您目前运营着Coursera、landing.ai、deeplearning.ai等企业,甚至还管理着一家AI基金会。您的目标是什么?
吴恩达:如今,我们将谷歌视为一家优秀的人工智能企业,而谷歌Brain在这一转型当中发挥着重要的作用。同样的,百度也是中国一家出色的AI企业——我曾经领导的百度AI事业部也在其中扮演着关键性角色。但于我而言,大型企业的转型工作已经不再具有挑战。为了实现其全部潜力,人工智能技术必须触及其它领域中的公司。
在Coursera、deeplearning.ai以及landing.ai,我们致力于帮助成千上万受众学习AI技术,而他们反过来将成为所在企业转型的重要助力。Landing.ai正在帮助各类大型企业,特别是制造业企业。AI基金(截至目前已经筹得1.75亿美元)专注于从零开始建立人工智能初创企业。由于主流企业已经无比强大,如今人们已经很难建立起新的云计算或者手机公司。从这个角度来看,人工智能领域的发展空间要比手机或者云计算大得多。
Q:您常常将人工智能比作新时代的电力,那么您如何评价这项技术的发展势头?
吴恩达:我们还处于AI转型的早期阶段。举例来说,假设你拥有一台注塑机,那么使用时必须面对着发热与冷却温度、压力以及种种其它指标。人工智能可以更为系统地根据这些指标作出决策。在医疗卫生方面,我们也看到人工智能方案能够比大多数放射科医师更好地读取造影图像。在教育方面,我们则拥有大量数据——像Coursera这样的公司在网络上提供极为丰富的内容。虽然还有很多相关工作要做,但其增长轨迹已经显示出人工智能具有光明的发展前景。
Q:在您看来,良好的人工智能策略应该是怎样的?
吴恩达:我曾经听不少CEO说到:给我们三年时间来建立IT体系,到时候我们将积累到大量可用于人工智能方案的数据。这是一种非常糟糕的策略。每家企业都掌握着规模庞大但却极为混乱的数据——即使是全球最卓越的人工智能企业也不可能对自己的数据感到完全满意。如果大家掌握着数据,那么最好是将其出示给人工智能团队并聆听其反馈意见。通过这种方式,任何企业中的IT与AI团队都能够建立起理想的良性反馈循环。
Q:您认为“紧凑型AI”(立足设备)是否有助于人工智能技术的未来发展?
吴恩达:是的。目前正有大量计算资源转移到边缘位置——例如智能手机、内置微型芯片的灯泡等等,我认为边缘领域也将展开新的市场竞争。考虑到语音识别(Alexa以及Google Home等)以及自动驾驶车辆的快速兴起,这一切都将进一步推动边缘计算的创新活动。
Q:如果可能的话,AI智能的智慧水平什么时候才会达到甚至超越人类?
吴恩达:我当然希望这一目标能够实现,也希望其能够尽快实现。但目前很难和出准确预测,因为其可能在50年后实现,也可能要到500年后才实现。
Q:那么您并不认同人工智能会在不久的未来取代人类的观点喽?
吴恩达:我认为担心人工智能产生自我意识,就像是担心我们的火星殖民地存在人口过剩问题一样——很明显,目前我们甚至还无力登陆这颗星球。当然,有一部分研究人员对此抱有谨慎态度肯定是好的。我们正在投入更多资源来解决由人工智能技术引起的工作岗位流失与变化问题。但过度关注人工智能的自我意识,则会分散解决前一个更为实际问题的相关研究者群体的规模。
Q:自动化与人工智能技术会对工作岗位造成怎样的影响?
吴恩达:许多工作岗位都会受到影响,例如服务中心的接听人员、司机(无人驾驶汽车)以及放射科医师。然而,在一切关于潜在失业这一可怕后果的另一面,则是由人工智能带来的更多理想的新岗位(与自动化及人工智能相关)。我们需要找到适合这些岗位的技能组合。
Q:您是否已经看到了政府在出台相关政策并解决此类问题方面作出的努力?
吴恩达:面对这些问题,不同的国家面临着不同的解决复杂度。具体来讲,印度在这方面拥有着相当不错的起步高度——因为拥有根深蒂固教育体系的国家往往更难以建立新的教育制度。因此,印度可能会比其它国家更快迎接数字化时代。当然,这对印度的国家领导层而言也是作出深远决策的重要时刻。
硅谷与北京是人工智能的主要研究中心,其次则是英国与加拿大。在印度,我看到很多充满热情的学习者,他们在Coursera人工智能课程当中占据相当可观的比例(总计190万学习者中的30万)。印度民众最偏爱机器学习课程。就特定时间周期之内来看,印度确实更有机会在人工智能的发展当中获得优势。当然,这种优势不可能永远存在。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。