2025年，AI能替我们工作了吗？

2025-03-04

斯坦福大学曾做过一项智能体超级实验：在名为Smallville的小镇中，有 25 个基于生成式智能体技术构建的虚拟人物自由生活。这些智能体都有独特的个性、身份、性格以及社交关系等设定，并且拥有自己的记忆流管理系统。

不仅如此，它们能够像人类一样进行日常活动，甚至是“自发”组织社交活动、讨论当地政治话题、甚至自主产生竞选市长等想法。而最重要的是，这些复杂的行为，皆是未经设计，完全由智能体的“意志”所驱使。

Smallville小镇试验刷新了人们对智能体的认知。区别于CHAT的对话模式，智能体展示了生成式智能体在模拟人类行为方面的强大能力，为人工智能在复杂场景下的应用提供了新思路。

AI替人类打工的时代，真的要来了吗？

大模型驱动智能体

大致分析Smallville小镇背后的智能体架构，我们能划分出感知、记忆和活动三大模块。

智能体能够感知周边环境并获取信息，将信息存储在记忆流系统中，基于检索到的历史记忆决定下一次行为，还能基于记忆形成长期的计划和反思，且反思和规划的结果可重新存储回记忆流以供未来使用。

Smallville小镇的居民们似乎拥有了模拟人类的“大脑”，这颗“大脑”由LLM大模型驱动，它们的行为皆由这颗“大脑”决定。那如果将小镇智能体的LLM大模型替换为某种职业工作者的LLM大模型，那智能体是否就能够从事专业工作了？

在Smallville小镇演示后的数月，清华大学的AI团队就为智能体们装上了医生的“大脑”。

在清华团队开发的一款名为“Agent Hospital”的AI医院小镇中，设计了14名医生和4名护士的智能体，这些医护角色能够从成功和失败的病例中不断学习、自我进化，从而在极短的时间内准确、高效的处理大量病例。

richText_image

智能体医生可以在几天内完成对1万名患者的诊疗，相当于一位医生2年的接诊数。并且，在呼吸疾病诊断方面，智能体医生的准确率高达了惊人的93.06%。（注：该数据为“Agent Hospital”特定场景下产生的数据）

团队认为，随着LLM大模型的进一步升级，智能体医生的诊疗准确率还能进一步提升，甚至超越人类医生诊断水平。

凭借一颗专业的“大脑”，清华团队在场景复杂且数据庞大的就医流程中取得成效。目前，无数企业都在开发其所属垂直领域的LLM大模型，而在我国，LLM大模型的建设更是受到了空前的重视，成为了央企的任务与使命。

央企牵头大模型建设

2023年以来，国资委多次对中央企业发展人工智能提出要求。

国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务：在通用大模型的研发方面，三大通信运营商承担主力军；行业大模型和细分领域专用大模型是大部分央企的投入重点。

截至今年8月，已有超20%的国资央企发布自研/合作建设大模型，更多央企的大模型也在紧锣密鼓地筹建当中。

沙丘智库《2024国资央企大模型市场跟踪报告》

大模型建设并非目的，而是过程。不妨将大模型粗略地比作蒸汽机，与车头结合，就有了蒸汽火车，与船结合，便有了蒸汽轮船。大模型同样需要结合。

在2024年2月的中央企业人工智能专题推进会上，提出中央企业要“开展AI+专项行动，强化需求牵引，加快重点行业赋能，构建一批产业多模态优质数据集，打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态”。

richText_image

沙丘智库《2024国资央企大模型市场跟踪报告》

北京迅速响应，于7月发布《北京市推动“人工智能+”行动计划（2024-2025年）》（下称《行动计划》）。《行动计划》中提及了五个“标杆应用工程”，包括人工智能+机器人、人工智能+教育、人工智能+文化、人工智能+交通，要求“促进大模型核心理论与技术突破，增强人工智能工程化能力”。

你是否注意到，《行动计划》称大模型为技术，而人工智能在专业领域上的应用则称为工程。想要AI为人类打工，不仅是技术上的问题，同时也是一项工程问题。这两个概念极易混淆。

同样以蒸汽机举例。蒸汽机的发明是一项新技术，而车头及船则是当时早已存在之物。将蒸汽机装到车头和船上，则是工程范畴。

换句话来说，人工智能与已有技术或应用经由工程结合，就能实现“AI为人类打工”。

大模型 ✕ RPA

事实上，在AI Agent概念席卷全世界之前，另一个词也一度火爆全球：数字员工。

麦肯锡发布的《数字化劳动力白皮书》指出，数字员工是打破人与机器边界，以数字化技术赋予“活力”的第四种企业用工模式。其实现的方式是人工智能+机器学习+机器人流程自动化（RPA）等技术的有机结合。

richText_image

麦肯锡《数字化劳动力白皮书》

数字员工流行之时，大模型的概念尚在襁褓，Open AI名不见经传，更无从谈及AI Agent。

然而，如今LLM大模型日益成熟，人工智能、机器学习、记忆能力、规划能力等技术已集合到大模型中，数字员工已经能够被视为大模型与RPA的工程化结合。可以说，数字员工就是狭义AI Agent。

基于其技术特点，RPA跟大模型可谓是“天作之合”：

（1）RPA模拟人类操作，大模型模拟人类思考

RPA 软件机器人可以像人类用户一样操作各种计算机应用程序。它通过模拟人类的鼠标点击、键盘输入和屏幕读取等操作来完成任务，无需对现有系统进行大规模的改造。

（2）RPA基于规则的自动化运行，大模型能够完善规则

RPA 的操作是基于预先设定的规则和逻辑进行的。用户可以根据业务流程的具体要求，定义机器人的操作步骤和决策逻辑。而大模型的记忆与规划能力，能够自适应业务流程的变更以及完成流程上的自我优化，无需人为干预即可自我迭代。

richText_image

九科信息智能自动化建设场景

AI与RPA的结合，相当于一颗永不疲劳的“大脑”，指挥不知疲惫的“手”。因此，RPA厂商自然纷纷投身到人工智能的浪潮中。

由于技术受限，大多数RPA厂商只能做简单的“加法”。在这类产品里，大模型更像是众多组件之一，与原有RPA的组件成为接力关系，成为自动化执行的流程中的一个步骤。大模型与RPA做加法，未能与传统的RPA形成本质上的区别。

因此，少数头部厂商在做“乘法”：大模型与RPA深度协作，并参与到全工作流程中。

richText_image

九科信息 AI与RPA的“双重融合”

以九科信息近日接入DeepSeek后，推出的“bit-Agent”的测试产品为例，用户只需要一句话描述任务，AI大模型即可分析、理解、规划并指示RPA执行。

在交互体验上，便直接与传统RPA形成鲜明区别，它只需要用户通过自然语言，便可让RPA运行起来。这让用户从一个机器人流程自动化的“开发者”，变成“指挥者”，大大降低了RPA对人类决策的依赖程度。

“bit-Agent”让我们看到了数字员工成熟落地的可能。随着LLM大模型在细分领域的进一步完善，机器代替人类工作，或许就在不久的将来。