大模子从Chat走向Act，智谱公布Agent新进展：支援跨App、跨修复等玩法

发布日期：2024-12-26 05:56 点击次数：117

起头：猎云网

东谈主类与机器的互动步地正在发生范式转化。这是由于唯有对话功能的Chatbot，正在进化为“有手、有脑、有眼睛”的自主Agent。

11月29日，动作最早探索Agent的大模子企业之一，智谱带来了多个新进展：

AutoGLM不错自主践诺进步50步的长形貌操作，也不错跨APP践诺任务；

AutoGLM开启“全自动”上网新体验，支援等数十个网站的无东谈主驾驶；

像东谈主一样操作计较机的GLM-PC启动内测，基于视觉多模态模子杀青通用Agent的本事探索。

在Agent OpenDay现场，智谱CEO张鹏下达了一个简便语音领导，AutoGLM便给在场数百位嘉宾发送了“一个来自 AI 的微信红包”。此外，AutoGLM还不错通过手机，而已不异电脑自动发送文献。

AutoGLM新升级：挑战更复杂

新升级的AutoGLM不错挑战完成复杂任务：

1. 超长任务：相接超长领导，践诺超长任务。举例，在采购暖锅食材的例子中，AutoGLM自主践诺了54步无打断操作。况且，在这种多步、轮回任务中，AutoGLM的速率线路进步东谈主手动操作。

2. 跨App：AutoGLM支援跨App来践诺任务。用户将民俗于AI自动解决，而不是在多个App间来去切换。由于面前AutoGLM形态更像是用户和期骗间的App践诺的诊疗层，因此跨App才略是内部相当枢纽的一步。

3. 短口令：AutoGLM好像支援长任务的自界说短语。今天，你毋庸再给AutoGLM说：“帮我买一杯瑞幸咖啡，生椰拿铁，五谈口店，大杯、热、微糖” 这类超长领导，只需要说“点咖啡”。

4. 璷黫模式：咱们齐会堕入遴荐懦弱，AutoGLM今天不错主动帮你作念出方案。璷黫模式下总计形貌齐让AI方案，带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡口味？

同期，AutoGLM启动大范围内测，并将尽快上线成为面向C端用户的产物。 AutoGLM同期秘书启动“10个亿级App免费Auto升级”的筹办，邀请App伙伴荟萃探索我方的Auto新场景。

支援中枢场景和中枢期骗的AutoGLM标品API，会在两周内上线到智谱maas灵通平台（bigmodel.cn）试用。

Web端开启“全自动”上网新体验：即日起智谱清言插件上线AutoGLM功能，支援搜索、微博、知乎、Github等数十个网站的无东谈主驾驶。在现场demo里，智谱清言插件自动完成了“搜索芒果tv，掀开冷巷东谈主家，播放最新一集，发弹幕结局打卡”。全程莫得东谈主的侵扰。

GLM-PC邀测：面向“无东谈主驾驶”电脑的一次本事探索

不单是基于手机和浏览器，今天智谱还带来基于PC的自主Agent。GLM-PC是GLM团队面向“无东谈主驾驶”PC的一次本事探索，基于智谱的多模态模子 CogAgent。面前灵通第一阶段的内测场景，包括：

1. 会议替身：帮用户预定和参与会议，发送会议记忆。

2. 文档解决：支援文档下载、文档发送、相接和记忆文档。

3. 网页搜索与记忆：在指定平台（如微信公众号、知乎、小红书等）搜索指定枢纽词，完成阅读、记忆。

4. 而已和定时操作：而已手机发领导，GLM-PC不错自主完成电脑操作；设定一个畴当年辰，在开机情景下定时践诺任务。

5. 隐形屏幕：在用户使命时，GLM-PC不错在隐形屏幕上自主完成使命，开脱屏幕使用权。

东谈主用电脑的过程——用眼看图形及笔墨，用脑缱绻，再用手践诺单击双击、输入等操作。GLM-PC用电脑的步地简直透顶和东谈主一样。也正因如斯，表面上只如果为东谈主类瞎想的期骗，在GLM-PC学习之后它齐好像践诺。这是一种系统级、跨平台的才略，不依赖于HTML、API，具备更高的才略上限。

不外，由于PC的复杂进程，以及大家在PC完成的简直齐是复杂任务，坦率的说，今天大模子的才略距离果真代替大家办公还有一定距离。GLM-PC在刻下版块下，用户仍需要输入相当精确的领导。

面前，GLM-PC“邀请体验”已开启。智谱方面默示，会在产物完善后尽快上线供所灵验户使用，同期也但愿和更多厂商荟萃共创共同探索。

AutoGLM和GLM-PC是智谱迈向AI智能操作系统的进军尝试。它们的出现源于智谱在大言语模子、多模态模子、逻辑推理和器具使用等方面的本事积存。从2023年4月的AgentBench开动，到8月的CogAgent模子，智谱针对AutoGLM，和GLM-PC的模子CogAgent的研发使命进行了一年半的时辰。

与OpenAI有所不同，智谱界说了大模子发展的五个阶段：L1言语才略、L2逻辑才略（多模态才略）、L3使用器具的才略、 L4自我学习才略、 L5谈判科学法例。

发展于今，大模子还是初步具备了东谈主类与推行物理全国互动的部分才略。“Agent将极地面普及L3使用器具才略，同期开启对L4自我学习才略的探索。” 张鹏说。

张鹏默示，畴昔GLM团队将络续加快agent模子产物的研发，期待着一句话操作电脑和手机的范式尽快到来。

大模子从Chat走向Act

如今，大模子本事正在改革机器和东谈主的互动步地，基于相接需求、缱绻与方案、践诺行动和自我反念念，Agent将带来合适直观的东谈主机交互——从东谈主适合机器，到让机器适合东谈主。

苹果（Apple Intelligence）、Anthropic（Computer Use）、谷歌（Jarvis）和OpenAI（Operator）等企业也还是把Agent动作2025年的主要关爱点。业内多半觉得，2025年将是Agent爆发之年。Gartner近期将agentic AI列为2025年十大本事趋势之一，并预测2028年至少有15%的平淡使命方案将由agentic AI自主完成，而这一数字在2024年为0。

与GenAI不同，Agent是看法驱动型的，好像透顶践诺使命经过，适合、学习、迭代、与其他系统和东谈主类联接，并端到端地完成任务。在张鹏看来，Agent不错看作是大模子通用操作系统LLM-OS的雏形。

“现阶段，AutoGLM特地于在东谈主与期骗之间添加一个践诺的诊疗层，很猛进程上改革东谈主机的交互步地。更进军的是，咱们看到了LLM-OS的可能，基于大模子智能才略（从L1到L4乃至更高），畴昔有契机杀青原生的东谈主机交互。将东谈主机交互范式带向新的阶段。”

AI时期智能修复新范式

跟着大模子才略的束缚进化，AI徐徐长出了我方的脑、眼和手。不单是是智能在捏续增强，感知才略和交互带宽也在束缚丰富和拓展，还有面前的Agent带来了践诺力的加快普及。

智谱COO张帆默示，智能修复在大模子的加捏下，将会本心出新的契机。手机+AI会造成随身个东谈主智能助理，PC+AI将会成为全新分娩力器具，汽车+AI将会让车成为东谈主们的智能第三生存空间。虽然，大模子不单是会为手机、PC和汽车带来契机，而是会惠及多样种种的智能修复。大模子的束缚进化还是为Agent变革东谈主车交互体验奠定了巨大的基础。

跟着端侧性能及算力捏续普及、为AI原生修复适配的模子和端云同源的协同架构出现，Agent不仅在操作系统OS和期骗上杀青用户体验变革，还能将其推行到各种智能修复上，从手机到电脑，再到汽车、眼镜、家居和多样edge side修复，多样AI原生修复正在争相自满。

终末，荣耀AI本事总监王作建、华硕AIPC智能生态崇拜东谈主钟怀圣、小鹏汽车座舱智能语音/智能化业务崇拜东谈主廉磊、高通AI产物本事中国区崇拜东谈主万卫星、英特尔中国区本事部总司理高宇，动作智谱的客户及合作伙伴，分辨从不同的场景启航，共享了他们对智能结尾的实践及瞻望。

上一篇：联思魏东：百应智能体已可处分80%的复杂IT问题

下一篇：性价比“机皇”出身，6550mAh+骁龙8Gen3+2K屏，仅2499元