科普|五分钟,让非技术人员也能看懂Agent、MCP与Function Call
2025年被称为智能体元年,产品的更迭日新月异,新兴的技术井喷式涌现,大量专业的技术概念也随之被传播到大众视野里。
不少朋友渴望了解新技术,但被这些专业概念劝退;尝试学习理解,却发现相关的解释文章晦涩难懂,让人一头雾水。
今天小九将用最通俗的语言,让你只用五分钟,就能清晰理解AI应用领域中三个超高频词汇:Agent、MCP(Model Context Protocol)与Function Call的概念以及联系。
01 Agent、MCP、Function Call
下面,小九将在一次沉浸式旅行规划的场景中,带大家体验Agent、MCP与Function Call的功能。
小九计划在五一假期前往成都旅行,于是向Agent提出需求:
“我想在成都玩五天,预算控制在5000元左右,喜欢美食和历史文化景点,帮我制定一份旅行计划。”
智能旅行规划系统启动。
Agent介入:明确目标与策略
当小九提交需求后,旅行规划Agent率先行动。
旅行规划Agent首先会对小九的需求进行语义分析,将其拆解为多个具体任务。例如,确定要游览的历史文化景点、筛选符合预算的美食体验,以及规划合理的住宿和交通安排。
随后,Agent根据这些任务,制定执行计划,决定先获取成都的历史文化景点信息,再筛选美食,接着考虑住宿和交通等事宜。
这一过程充分体现了Agent的自主性和主动性,它能够根据用户输入的信息,独立制定解决方案。
MCP助力:获取外部数据与工具支持
为了完成旅行规划任务,旅行规划Agent需要大量的信息支持。这时,MCP发挥关键作用,它作为连接大语言模型与外部数据源和工具的桥梁,帮助Agent获取所需信息。
旅行规划Agent借助MCP向多个外部数据源发送请求。比如,它连接到旅游数据库,获取成都热门历史文化景点的详细信息,包括景点开放时间、门票价格等;访问美食推荐平台,收集各类美食店铺的位置、特色菜品和价格信息;还与酒店预订平台和交通票务系统交互,获取住宿和交通方面的相关数据。
MCP基于标准化设计,确保了与不同数据源和工具交互时的一致性和稳定性。同时,其灵活扩展的特性,使得旅行规划Agent能够根据实际需求,与各种不同类型的数据源和工具进行集成。
Function Call赋能:调用专业工具完成特定任务
在旅行规划过程中,有许多特定任务需要借助专业工具来完成。这时,Function Call发挥了重要作用。
任务一:预算分配优化
为了确保旅行预算控制在5000元左右,旅行规划Agent通过Function Call调用数学计算工具。该工具根据小九提供的预算,结合从各个数据源获取的信息,进行合理的预算分配。例如,计算每个景点的门票费用、每餐的平均花费、住宿和交通的预计支出等,从而制定出详细的预算分配方案。
任务二:路线规划
旅行规划Agent通过Function Call调用地图规划工具,根据景点的地理位置和开放时间,规划出一条合理的旅行路线。地图规划工具会考虑交通拥堵情况、景点之间的距离等因素,确保旅行路线高效且合理。例如,工具会将距离较近的景点安排在同一天游览,避免不必要的往返奔波。
任务三:信息筛选与整合
旅行规划Agent还通过Function Call调用文本分析工具,对从各个数据源获取的大量信息进行筛选和整合。例如,从众多美食店铺中筛选出符合小九口味和预算的店铺,从酒店预订平台提供的众多酒店中选择性价比高且位置便利的酒店。文本分析工具利用自然语言处理技术,对文本信息进行分类、提取关键信息,帮助旅行规划Agent快速准确地找到最适合小九的旅行方案。
Agent收尾:输出结果
在旅行规划Agent通过MCP获取外部数据,并借助Function Call调用专业工具完成各项任务后,它将整合所有信息,生成一份详细的旅行计划。
最后,旅行规划Agent将生成的旅行计划以自然语言的形式反馈给小九。小九对这份旅行计划非常满意,顺利开启了他的成都之旅。
让我们整体回顾一遍。在这个智能旅行规划场景中:
- Agent负责理解用户需求、制定规划策略;
- MCP为Agent提供了与外部数据源和工具交互的标准协议;
- Function Call能力则让Agent能够调用各种专业工具,完成复杂的特定任务。
三者相互协作,共同为用户提供了高效、个性化的旅行规划服务,展现了AI技术在实际应用中的强大魅力。
02 九科信息 bit-Agent:企业级场景的智能体应用
我们现在已经了解Agent、MCP与Function Call三者的关系。当我们聚焦企业场景,企业可以利用它们去实现什么商业价值?
在九科信息最新发布的“专为中国企业打造的智能体”bit-Agent中,企业可以利用bit-Agent去完成表单填写、数据录入、流程审批以及信息查询等多个日常高频场景的端对端自动化。
拆解bit-Agent,它由两部分构成:一个是大语言模型(LLM),一个是机器人流程自动化(RPA)。大语言模型充当大脑,指挥RPA进行自动化操作,由此为企业节省宝贵的时间和人力。
而MCP与Function Call,则是驱动bit-Agent运行的关键。
我们以目前最为火爆的大语言模型DeepSeek为例。DeepSeek具备强大的思维链,但它却无法为我们处理图像和网页。但是在MCP与Function Call帮助下,它将极大地拓宽其能力边界。
比如,一家金融机构每天都要面对大量客户资料的审核工作,其中涉及客户提交的各类扫描文档(包含图片格式的证件照等)以及网页端客户信息的查询与更新。
在这个场景下:首先MCP将作为桥梁,帮助DeepSeek连接到专业的图像识别工具和网页编辑工具 ➡️ 然后通过Function Call调用图像识别工具,提取客户身份信息,再调用网页数据查询工具,核实客户在网页端的交易记录等信息 ➡️ 最后指挥RPA完成客户资料的审核流程审批以及信息更新。
整个过程无需人工过多干预,极大地提高了金融机构的业务处理效率。
因此,对于目前已经完成大模型私有化部署,但缺少落地场景的企业,九科bit-Agent无疑是一个绝佳的选择。
值得一提的是,bit-Agent支持接入任意提供Function Call功能的大语言模型,且后续将拓展自动化能力至操作系统和客户端,从而完全覆盖企业日常办公场景。
目前,九科信息正在与众多大型企业共同探索、拓宽bit-Agent的应用边界,并诚邀您加入,一同见证bit-Agent的更多可能。