微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

阿里巴巴团队发布GUI-Owl：让AI像人类一样操作电脑和手机的智能助手

人工智能GUI自动化多智能体框架

阿里巴巴团队发布GUI-Owl：让AI像人类一样操作电脑和手机的智能助手

作者：科技行者

2025-08-29 09:31

分享至：

阿里巴巴团队发布了GUI-Owl智能助手，这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练，在多项测试中超越现有模型，配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率，为GUI自动化领域带来重大突破。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-08-29 09:31 • 科技行者

这项由阿里巴巴集团通义实验室的叶家博、张希、徐海洋等研究人员领导的研究于2025年8月发表，论文全名为《Mobile-Agent-v3: Foundamental Agents for GUI Automation》。感兴趣的读者可以通过GitHub仓库（https://github.com/X-PLUG/MobileAgent）获取相关代码和模型。

把你的电脑或手机交给一个智能助手，它能够像你一样看懂屏幕上的内容，知道该点击哪个按钮，该在哪里输入文字，甚至能帮你完成复杂的任务，比如订酒店、写报告或者处理邮件。听起来像科幻电影的情节，但阿里巴巴的研究团队已经让这个梦想变成了现实。他们开发出了一个名为GUI-Owl的AI系统，这个系统就像是一个数字世界的全能管家，能够自主操作各种电子设备的图形界面。

要理解这项技术的重要性，我们可以这样想象：现在的AI大多像是聪明的盲人，虽然能够理解和生成文字，但看不见屏幕上的按钮、菜单和图标。而GUI-Owl就像是给AI装上了一双眼睛和一双手，不仅能看懂屏幕上的所有元素，还能像人类一样进行精确的操作。这种能力被称为GUI自动化，GUI是图形用户界面的缩写，也就是我们平时看到的那些窗口、按钮和菜单。

传统的自动化工具就像是按照固定食谱做菜的机器人，只能按照预先编好的程序执行特定任务。一旦遇到界面发生变化或者需要处理新的情况，这些工具就会束手无策。相比之下，GUI-Owl更像是一位经验丰富的厨师，能够根据现场情况灵活调整，即使面对从未见过的菜谱也能举一反三。

研究团队面临的最大挑战是如何让AI理解复杂的视觉界面。当你看到一个网页时，你的大脑能够自动识别出哪里是搜索框、哪里是菜单、哪里是按钮，但对AI来说，这些都只是像素点的集合。为了解决这个问题，团队开发了一套完整的训练体系，就像是为AI开办了一所专门的"操作学校"。

一、自进化数据生产：让AI自己学会更好地操作界面

传统的AI训练需要大量人工标注的数据，就像老师需要一笔一划地教学生写字。但GUI-Owl采用了一种更加智能的方法——自进化数据生产。这个过程就像是让AI成为自己的老师，通过不断的实践和总结来提高自己的能力。

整个过程可以比作一个不断改进的烹饪学习循环。首先，系统会生成各种各样的"食谱"，也就是用户可能提出的操作请求，比如"帮我在这个购物网站上找到一双红色的运动鞋"。接着，GUI-Owl会尝试按照这个"食谱"进行操作，就像新手厨师第一次尝试做菜一样。

在操作过程中，系统会记录下每一个步骤：点击了哪个按钮、在哪里输入了文字、屏幕发生了什么变化。这就像是在拍摄烹饪过程的慢动作视频，记录下每一个动作和结果。然后，系统会对这些操作进行评判，判断每个步骤是成功的、中性的，还是有害的。

为了确保评判的准确性，研究团队设计了一个双层评估机制。第一层是步骤级评估，就像品尝师在烹饪过程中不断品尝，确认每个步骤是否正确。第二层是整体评估，就像最终品尝完成的菜品，判断整个任务是否成功完成。

当系统发现某些操作特别困难时，就会启动"特别指导"模式。研究团队会提供标准的操作示例，就像经验丰富的厨师给新手展示正确的切菜手法。系统会分析这些示例，提取出关键的操作要点，然后将这些知识整合到自己的"经验库"中。

这种自进化的方法最大的优势在于，它能够持续不断地改进。每次操作都会让系统变得更加聪明，就像厨师通过不断练习而技艺精进。更重要的是，这种方法大大减少了对人工标注的依赖，让AI训练变得更加高效和经济。

二、多样化基础能力构建：让AI掌握操作界面的各项技能

就像一个全能的个人助理需要掌握多种技能一样，GUI-Owl也需要具备多方面的基础能力。研究团队为它设计了一套完整的能力体系，包括定位能力、规划能力和动作理解能力。

定位能力就像是AI的"眼睛"，它需要能够准确识别屏幕上的各种元素。这个过程分为两个层次：粗粒度定位和细粒度定位。粗粒度定位就像是在地图上找到某个城市，比如识别出"这里有一个搜索框"、"那里有一个提交按钮"。细粒度定位则像是在城市里找到具体的街道和门牌号，能够精确到文字中的某个字符或某个小图标。

为了训练这种定位能力，研究团队收集了大量不同类型的界面数据。他们不仅使用了现有的公开数据集，还开发了专门的数据生成工具。对于手机和电脑界面，系统会通过无障碍功能树来获取界面元素的位置和功能信息。对于网页，他们使用了一种叫做SAM的图像分割工具，就像用智能剪刀将复杂的网页切分成一个个独立的区块，然后让AI分别理解每个区块的功能。

规划能力则像是AI的"大脑"，负责制定完成任务的策略。当用户提出一个复杂的请求时，比如"帮我预订从北京到上海的高铁票"，AI需要将这个大任务分解成若干个小步骤：打开铁路官网、选择出发地和目的地、选择时间、查看车次、选择座位、填写乘客信息、支付等等。

为了培养这种规划能力，研究团队采用了两种方法。第一种是从历史成功案例中学习，就像学生通过研究优秀作业来提高自己的水平。系统会分析那些成功完成的操作序列，总结出其中的规律和策略。第二种是利用大型语言模型的知识，就像请教经验丰富的老师。系统会向这些模型询问如何完成特定任务，然后将得到的建议整理成可执行的操作步骤。

动作理解能力就像是AI的"身体协调性"，它需要明白每个操作会产生什么结果。比如，点击"确定"按钮后页面会跳转到哪里，在搜索框中输入文字后会显示什么内容。这种能力对于AI来说至关重要，因为只有理解了动作和结果之间的关系，才能在出现问题时及时调整策略。

为了训练这种能力，系统会收集大量的"动作-结果"配对数据。每当执行一个操作时，系统都会拍摄操作前后的屏幕截图，然后学习这种变化的模式。通过这种方式，AI逐渐学会了预测自己的操作会产生什么影响，就像经验丰富的司机能够预判转弯时车子的轨迹一样。

三、增强推理能力：让AI像人类一样思考

单纯的模仿并不能造就真正智能的AI助手，就像鹦鹉学舌并不等于理解语言。研究团队认识到，要让GUI-Owl真正强大，必须让它具备推理能力，能够在面对新情况时独立思考并做出正确决策。

推理能力的培养就像是训练一个侦探的思维过程。当面对一个复杂案件时，优秀的侦探不会盲目行动，而是会仔细观察线索、分析情况、制定推理过程，然后再采取行动。GUI-Owl也是如此，它在执行每个操作之前都会进行"思考"，分析当前情况，推断最佳行动方案。

为了让AI学会这种推理过程，研究团队设计了三种不同的训练方法。第一种叫做"离线提示引导拒绝采样"，这个过程就像是让学生在考试前先看一下题目类型和解题思路。系统会根据不同的提示风格生成推理内容，比如有时要求它使用简洁明了的思路，有时要求它进行详细的分析。如果生成的推理过程能够导出正确的操作，那么这个推理过程就会被保存下来作为学习材料。

第二种方法叫做"多智能体框架蒸馏"，这就像是让几个专家围在一起讨论同一个问题，然后将他们的集体智慧传授给学生。在实际操作中，系统会运行一个叫做Mobile-Agent-v3的多智能体框架，其中不同的智能体分别负责不同的任务：有的负责制定计划，有的负责执行操作，有的负责反思和评估。这些智能体的讨论过程被记录下来，然后用来训练GUI-Owl的推理能力。

第三种方法是"迭代在线拒绝采样"，这就像是让学生不断练习和改进。系统会定期使用最新版本的模型来生成新的操作轨迹，然后从中筛选出高质量的推理过程。随着模型能力的提升，它能够解决越来越多的任务，产生的训练数据也越来越丰富多样。

这种推理能力训练的效果是显著的。训练后的GUI-Owl不再是一个简单的动作执行器，而是一个能够独立思考的智能助手。当面对复杂或模糊的指令时，它会先分析用户的真实意图，然后制定合理的执行策略。即使在执行过程中遇到意外情况，它也能够灵活调整，找到替代方案。

四、可扩展强化学习：让AI在实战中不断进步

光有理论知识还不够，就像学会了驾驶理论但从未上路的新手司机一样，AI也需要在真实环境中不断练习才能变得熟练。为了让GUI-Owl在实际操作中不断改进，研究团队开发了一套可扩展的强化学习框架。

这个框架的设计理念就像是一个高度自动化的驾校。传统的强化学习就像是一对一的驾驶培训，教练需要时刻陪伴在学员身边，效率相对较低。而这个新框架则像是一个现代化的大型驾校，能够同时培训多名学员，并且每个学员都能根据自己的进度和特点进行个性化训练。

框架的核心创新在于将"体验生成"和"策略更新"完全分离，就像将"练习开车"和"总结经验"分开进行。在传统方法中，AI必须先完成一次操作，立即分析结果并更新策略，然后才能进行下一次操作，这种同步方式效率很低。新框架允许多个AI同时在不同的虚拟环境中练习，而另一个专门的"教练"系统则负责分析所有的练习结果，总结经验并更新训练策略。

为了应对GUI操作任务的特殊挑战，团队开发了一种叫做"轨迹感知相对策略优化"（TRPO）的新方法。GUI操作的一个难点是，成功往往需要完成一整串操作，而不是单个动作。就像做菜一样，你不能说切菜这一步是好的，炒菜这一步是坏的，只有最终做出的菜好吃才算成功。

TRPO方法的巧妙之处在于，它不试图给每个单独的操作打分，而是根据整个任务的成功与否来评价所有步骤。当一个操作序列成功完成任务时，这个序列中的所有步骤都会得到正面评价；当失败时，所有步骤都会得到负面反馈。这种方法避免了传统方法中"功过分配"的难题，让AI能够更好地学习复杂的多步骤任务。

为了保证训练的稳定性，系统还设计了一个"成功经验回放"机制。由于GUI操作的成功率通常不高，特别是在学习初期，如果只从失败案例中学习，AI可能会陷入困境。回放机制就像是在训练中适当回顾成功案例，让AI不会忘记什么是正确的操作方式。当系统发现某个任务的所有尝试都失败时，它会从历史成功案例中随机选择一个，确保每次训练都有正面样本。

这套强化学习框架的实际效果令人印象深刻。在OSWorld这个复杂的桌面操作测试中，使用TRPO训练的GUI-Owl从最初的27.1%成功率稳步提升到34.9%，这个提升过程持续而稳定，没有出现传统强化学习中常见的性能波动问题。更重要的是，训练过程完全自动化，不需要人工干预，大大提高了训练效率。

五、Mobile-Agent-v3多智能体框架：团队协作的智能助手

虽然GUI-Owl本身已经很强大，但面对真正复杂的任务时，单打独斗往往不如团队协作。就像一个成功的公司需要不同部门的员工各司其职、相互配合一样，研究团队还开发了一个叫做Mobile-Agent-v3的多智能体框架，让多个专门化的AI智能体协同工作。

这个框架的设计就像是组建一个高效的工作团队。团队中有四个核心成员，每个都有自己的专长和职责。经理智能体就像是项目经理，负责总体规划和协调。当用户提出一个复杂任务时，比如"帮我安排下周的商务旅行，包括机票、酒店和会议室预订"，经理智能体会将这个大任务分解成若干个子任务，并安排执行顺序。

工作智能体就像是执行员，负责具体的操作工作。它会根据经理的安排，一个接一个地完成子任务。比如，它会先打开订票网站，搜索合适的航班，然后切换到酒店预订网站，寻找住宿地点。工作智能体的特点是行动力强，能够准确执行各种具体操作。

反思智能体就像是质量检查员，负责监督和评估工作成果。每当工作智能体完成一个操作后，反思智能体会检查结果是否符合预期。如果发现问题，它会及时向经理智能体报告，并提供具体的问题分析。比如，如果点击某个按钮后页面没有按预期跳转，反思智能体会指出"操作失败，可能是网络延迟或按钮失效"。

记录智能体就像是团队的记忆管理员，专门负责保存重要信息。在执行任务过程中，可能会出现一些重要的临时信息，比如订单号、确认码、密码等。这些信息在当前步骤中可能不重要，但在后续步骤中可能必不可少。记录智能体会自动识别并保存这些关键信息，确保团队在需要时能够及时调用。

整个团队的工作流程就像是一个精心编排的舞蹈。首先，经理智能体会根据用户指令制定初步计划，并从外部知识库中获取相关信息，比如当前的机票价格、酒店信息等。然后，工作智能体开始执行第一个子任务，每完成一个操作都会由反思智能体进行评估。如果操作成功，记录智能体会保存相关信息，经理智能体会更新任务进度；如果操作失败，经理智能体会根据反思智能体的分析调整计划。

这种多智能体协作的优势在于，不同智能体可以专注于自己最擅长的领域，避免了单一智能体需要"样样精通"的困难。更重要的是，这种设计具有很强的容错能力。即使某个环节出现问题，团队也能够及时发现并调整，避免了错误的累积和扩散。

在实际测试中，Mobile-Agent-v3框架展现出了卓越的性能。在AndroidWorld测试中，它达到了73.3%的成功率，在OSWorld测试中达到了37.7%的成功率，都明显超过了现有的其他系统。这些数字背后反映的是这种团队协作模式的强大威力。

六、全面基准测试：在各种挑战中证明实力

为了验证GUI-Owl的真实能力，研究团队进行了一系列全面的测试，就像让一个全能运动员参加各种不同的比赛项目来证明实力。这些测试涵盖了从基础的界面理解到复杂的任务执行等各个方面。

在界面定位能力测试中，GUI-Owl表现出了令人印象深刻的精确度。在ScreenSpot-Pro这个专门测试高分辨率界面定位的项目中，GUI-Owl-7B达到了54.9分，显著超过了其他同等规模的模型。这就像是在一个巨大的图书馆中准确找到指定的某一页某一行，需要极其精确的"视力"和判断力。

更令人惊讶的是GUI-Owl-32B在MMBench-GUI测试中的表现。这个测试专门评估AI对图形界面的综合理解能力，包括识别界面元素、理解操作逻辑、预测操作结果等多个方面。GUI-Owl-32B不仅在这项测试中取得了最高分，甚至超过了GPT-4o和Claude 3.7这些知名的商业AI系统。这相当于一个学生在全国统考中不仅拿了第一名，还超过了以往被认为是"学霸"的同学。

在单步操作决策测试中，GUI-Owl展现出了出色的判断能力。Android Control测试要求AI在给定的界面截图中做出最合适的下一步操作。GUI-Owl-7B在这项测试中达到了72.8分，在同等规模的模型中排名第一。这就像是在棋局中准确判断下一步最佳走法，需要综合考虑当前局面和长远策略。

最具挑战性的是真实环境操作测试。与前面的测试不同，这些测试要求AI在真实的操作系统环境中完成完整的任务，就像让一个机器人真正走进厨房做菜，而不是在纸上谈论烹饪理论。在AndroidWorld测试中，GUI-Owl需要在真实的安卓设备上完成各种日常任务，比如发送消息、设置提醒、查找信息等。GUI-Owl-7B在这项测试中达到了66.4%的成功率，而配合Mobile-Agent-v3框架后，成功率提升到了73.3%。

OSWorld测试更加苛刻，它要求AI在完整的桌面操作系统中完成复杂的办公任务。这就像让AI真正坐在办公桌前，使用各种软件完成实际工作。在这项测试中，GUI-Owl-7B单独作战时达到了34.9%的成功率，而在Mobile-Agent-v3框架的协助下提升到了37.7%。虽然这个数字看起来不算很高，但考虑到任务的复杂性，这已经是相当不错的成绩了。

为了更好地理解这些数字的含义，我们可以做个类比。如果把使用电脑比作驾驶汽车，那么界面定位能力就像是视力测试，单步决策能力就像是交规考试，而真实环境操作测试就像是实际路考。GUI-Owl不仅在"视力测试"和"交规考试"中表现优异，在"实际路考"中也取得了不错的成绩，这说明它确实具备了实用的"驾驶"能力。

研究团队还特别测试了GUI-Owl与其他智能体框架的兼容性。他们将GUI-Owl作为"大脑"集成到其他研究团队开发的智能体框架中，结果显示GUI-Owl能够很好地适应不同的工作模式，在各种框架中都能发挥出色的性能。这就像一个优秀的演员能够在不同的剧组中都表现出色，展现了很强的适应性和专业素养。

七、技术创新的深层影响：从自动化到智能化的跨越

GUI-Owl的出现标志着人机交互领域的一个重要转折点。传统的自动化工具就像是按照固定路线行驶的有轨电车，只能在预设的轨道上运行，一旦遇到轨道变更或障碍物就会停止工作。而GUI-Owl更像是一辆智能汽车，能够根据实时路况调整路线，即使面对从未见过的道路也能找到通往目的地的方法。

这种从自动化到智能化的跨越带来了深远的影响。对于普通用户来说，这意味着他们可以用自然语言向计算机表达需求，而不需要学习复杂的操作步骤。比如，用户可以简单地说"帮我把上个月的销售数据整理成图表并发送给团队成员"，AI就能自动完成从数据提取、图表制作到邮件发送的整个流程。

对于企业来说，GUI-Owl提供了一种全新的数字化转型方案。传统的企业自动化需要针对每个特定软件开发专门的接口和脚本，成本高昂且维护困难。而基于GUI-Owl的解决方案可以直接操作现有软件的用户界面，就像雇佣了一个能够使用任何软件的虚拟员工。

更重要的是，GUI-Owl的多模态学习能力为AI发展提供了新的思路。传统的AI系统往往专注于单一类型的输入，比如只处理文字或只处理图像。而GUI-Owl需要同时理解视觉信息、文字信息和交互逻辑，这种综合能力的培养方法可能为其他AI应用提供借鉴。

研究团队在论文中特别强调了开源的重要性。与许多商业AI系统不同，GUI-Owl的完整代码和模型都已经开源，任何研究者或开发者都可以基于这个基础进行进一步的创新。这就像是把一个成功的食谱完整地分享给所有人，让更多的厨师能够在此基础上创造出新的美味。

当然，任何技术创新都会带来新的挑战和问题。GUI-Owl虽然能力强大，但它的决策过程对普通用户来说仍然是个"黑盒子"。用户可能很难理解为什么AI选择了某个特定的操作路径，这在某些需要高度透明度的场景中可能成为问题。此外，虽然GUI-Owl在测试中表现优异，但在面对全新的界面和任务时，它的泛化能力仍然有待进一步验证。

八、未来展望：智能助手的无限可能

当我们站在GUI-Owl这项技术成果面前展望未来时，可以看到一个充满可能性的世界正在向我们招手。就像互联网刚刚兴起时人们难以预料社交媒体、电子商务和在线教育的蓬勃发展一样，GUI自动化技术的潜在应用可能远超我们目前的想象。

在教育领域，GUI-Owl可能会成为个性化学习的强大助手。想象一下，当学生在学习如何使用复杂软件时，AI助手可以实时观察学生的操作，发现错误并给出指导。它不仅能够演示正确的操作步骤，还能根据学生的学习进度调整教学策略，就像一个永远不会疲倦、永远有耐心的私人教师。

在医疗健康领域，这项技术可能会帮助医生更高效地处理电子病历和医疗系统。医生可以用自然语言描述患者情况，AI助手自动在各种医疗软件中录入信息、查询相关资料、生成报告。这不仅能减轻医生的行政负担，还能降低因操作失误导致的医疗事故风险。

对于老年人和残障人士来说，GUI-Owl可能成为数字世界的"导盲犬"。它可以帮助视力障碍者浏览网页、操作手机应用，帮助行动不便的老人进行在线购物、缴费等日常操作。通过语音交互，这些用户可以享受到与健康人士同等的数字化便利。

在软件开发领域，GUI-Owl的技术可能会催生新一代的智能开发工具。程序员可以用自然语言描述软件需求，AI助手自动生成界面原型、编写代码、进行测试。这将大大降低软件开发的门槛，让更多的创意能够快速转化为实用的应用程序。

然而，技术的发展也带来了需要深思的问题。当AI能够像人类一样操作各种软件时，我们需要重新思考数字隐私和安全的边界。如何确保AI助手只在授权范围内操作？如何防止恶意使用这种技术？这些都是需要技术界和社会共同面对的挑战。

另一个值得关注的是就业市场的变化。虽然GUI-Owl主要是作为助手存在，帮助人类提高工作效率，但它确实可能会影响某些重复性的办公工作。不过，历史经验告诉我们，技术进步往往会创造新的就业机会，关键是如何帮助人们适应这种变化。

研究团队在论文中也指出了当前技术的局限性。GUI-Owl虽然在多个测试中表现优异，但距离真正的通用智能助手还有很长的路要走。它目前主要擅长执行相对标准化的任务，面对需要创造性思维或复杂推理的工作时仍然力不从心。

此外，不同文化和语言背景下的界面设计差异也是一个挑战。GUI-Owl主要在英文和中文界面上进行训练，对于其他语言的界面处理能力还需要进一步验证和改进。要真正实现全球化应用，还需要更多的多语言和跨文化训练数据。

尽管存在这些挑战，GUI-Owl代表的技术方向无疑是正确的。随着计算能力的持续提升、训练数据的不断丰富以及算法的继续优化，我们有理由相信，未来的AI助手会变得更加智能、更加实用、更加人性化。

说到底，GUI-Owl的真正价值不在于替代人类，而在于解放人类。它让我们从重复性的操作中脱身，有更多时间去思考、创造和享受生活。就像洗衣机解放了我们的双手、汽车扩展了我们的活动范围一样，智能GUI助手可能会成为我们数字生活中不可或缺的伙伴，帮助我们在信息时代更好地实现自己的价值。

当我们回顾整个研究时，最令人印象深刻的不仅是技术本身的突破，更是研究团队开放合作的态度。通过开源代码和开放数据，他们为整个AI社区提供了宝贵的资源，这种精神值得我们学习和传承。正是这种开放合作的文化，推动着人工智能技术不断向前发展，最终惠及全人类。

有兴趣深入了解技术细节的读者，可以通过GitHub仓库（https://github.com/X-PLUG/MobileAgent）获取完整的代码和模型文件，也可以关注阿里巴巴通义实验室的后续研究成果。这项技术的故事才刚刚开始，未来必定会有更多精彩的章节等待我们去书写。

Q&A

Q1：GUI-Owl是什么？它和普通的自动化工具有什么区别？

A：GUI-Owl是阿里巴巴开发的智能界面操作助手，能够像人类一样看懂屏幕并操作电脑和手机。与传统自动化工具不同，它不需要预先编程，可以根据用户的自然语言指令灵活完成各种任务，即使面对从未见过的界面也能举一反三。

Q2：Mobile-Agent-v3框架是如何工作的？

A：Mobile-Agent-v3是一个多智能体协作框架，包含四个专门化的AI：经理智能体负责规划任务，工作智能体执行具体操作，反思智能体监督检查结果，记录智能体保存重要信息。它们像团队一样分工合作，能够处理比单个AI更复杂的任务。

Q3：GUI-Owl的实际应用效果如何？普通人能使用吗？

A：在测试中，GUI-Owl在安卓设备操作中达到73.3%成功率，在桌面操作中达到37.7%成功率，已经具备实用价值。不过目前它主要是研究阶段的开源项目，普通用户需要等待基于这项技术的商业产品推出。感兴趣的开发者可以通过GitHub获取代码进行体验。

人工智能GUI自动化多智能体框架

分享至

0赞

好文章，需要你的鼓励

友情链接

京ICP证15039648号京ICP备15039648号-9 京公网安备 11010802021500号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱: jubao@zhiding.cn 　网上有害信息举报专区：https://www.12377.cn

微信扫一扫，关注公众号

见证连接与计算的「力量」

阿里巴巴团队发布GUI-Owl：让AI像人类一样操作电脑和手机的智能助手

至顶头条

科技行者

码客人生

奇客Solidot

高飞的电子替身

奇客情报站

文化

移动计算

大数据

创新创业

物联网

商业

社交新媒体

智能硬件

移动设备

人工智能

汽车

5G

量子计算

云计算

科学

对话科技行者

机器人新纪元

友情链接