CNET科技资讯网 9月18日 北京消息(文/孙封蕾): 全球科技巨变,人工智能历经了近60年的蹉跎岁月,如今即将迎来质的飞跃。基于互联网技术的高速发展以及大数据的量的积累,人工智能技术已经具备了引发质变所需的基础条件。现在,我们已经站在新一轮产业革命的大门前,跨过这道门槛将进入以智能技术为核心的崭新科技时代。与此同时,全球科技巨擘纷纷展开人工智能战略布局抢滩中国,微软作为人工智能领域的引领者也悄然在苏州建立了全新的创新基地。
统观全球,人工智能是时下炙手可热的科技前沿。积跬步,以至千里,人类在人工智能领域逾60年点滴累积的经验以及研发成果,为人工智能蓬勃发展奠定了坚实基础。结合当下百花齐放的科技创新,人工智能正迎来自身发展的激发奇点。
作为时代发展的前驱者,科技界各巨头顺势而为,纷纷展开布局。在人工智能领域早有布局的IBM,斥资10亿美元成立了包括语音、语言理解、图像识别和情绪分析等研究的Watson项目。前不久,谷歌AlphaGo战胜人类,再次燃起人工智能的话题热度。而恰在此时,微软苏州大厦悄然屹立,看似简单的动作背后是否另有深意?
微软苏州大厦鸟瞰实景
微软(亚洲)互联网工程院,作为微软苏州的“母体”,早已投身一场产品与技术,甚至组织与文化的创新,有力地支持着微软人工智能的探索,从研发项目的开发,到人才的留用,乃至推动组织动态变革,并相继发布了小娜、小冰,一时间让中国乃至全球用户看到了微软在情感计算领域的技术积淀,以及创新行动。2013年微软在苏州开辟一块“实验田”,创立微软苏州团队,成为微软全球研发体系的一支新力量。
经过三年的发展,微软苏州团队从一支小规模的研发尖兵,已发展成几百人的中坚力量,而未来更将目标瞄准为规模千人以上的科技新军。如今,苏州工业园内拔地而起的崭新大楼,正是标志微软苏州这股科技创新力量走向新阶段的里程碑。
三年来,微软苏州在人工智能、机器学习、神经网络、自然语言处理、语音识别、图像识别、自然人机交互、云计算、大数据等十多个研发领域均有建树,并深度参与了微软人工智能、Office365、必应搜索引擎等核心产品的开发和运营。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。