1.1 什么是智能体
在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过**执行器(Actuators)采取行动(Action)**以达成特定目标的实体。
传统智能体严禁路线:
反射智能体
基于模型的反射智能体,状态,世界模型
基于目标的智能体
基于效用的智能体
学习型智能体,强化学习
大语言模型,LLM
工作方式:规划与推理,工具使用,动态修正
智能体的类型:
- 基于内部决策架构的分类
- 反应式智能体
- 模型式智能体
- 基于目标与基于效用的智能体
- 学习能力
- 基于时间与反应性的分类
- 权衡:追求速度的反应性&追求最优解的规划性
- 反应式智能体:简单反应式、基于模型,速度快、计算开销低
- 规划式智能体:基于目标、基于效用
- 混合式智能体:规划&反应,LLM
- 基于知识表示的分类
- 符号主义 AI,知识获取瓶颈
- 亚符号注意 AI(连接主义),神经网络和深度学习,黑箱
- 神经符号主义 AI(神经符号混合主义)
1.2 智能体的构成与运行原理
任务环境:PEAS 模型:性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)
环境通常是部分可观察的
行动结果的可预测性,环境分为:确定性、随机性
多智能体环境
几乎所有任务都发生在序贯且动态的环境中。“序贯”意味着当前动作会影响未来;而“动态”则意味着环境自身可能在智能体决策时发生变化。
“感知-思考-行动-观察”循环
智能体循环:
- 感知:观察
- 思考:规划、工具选择
- 行动
智能体的行动会引起环境 (Environment) 的状态变化 (State Change),环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获,形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环,逐步推进任务,从初始状态向目标状态演进。
交互协议:规范 LLM 与环境间的信息交换
输出的机构化定义:思考,行动
Thought: 用户想知道北京的天气。我需要调用天气查询工具。
Action: get_weather("北京")
外部的解析器
感知系统,传感器,处理封装原始输出(观察)
1.3 动手体验:5 分钟实现第一个智能体
准备工作
requests:从 python 程序中访问网络 APItavily-python:一个强大的 AI 搜索 API 客户端,用于获取实时的网络搜索结果,可以在官网注册后获取 APIopenai: OpenAI 官方提供的 Python SDK,用于调用 GPT 等大语言模型服务
指令模板:提示工程
们需要设计一个“指令模板”,告诉 LLM 它应该扮演什么角色、拥有哪些工具、以及如何格式化它的思考和行动。这是我们智能体的“说明书”,它将作为 system_prompt 传递给 LLM。
工具 1
工具 2
将所有工具放入一个字典,供主循环调用
接入大语言模型
API_KEY , BASE_URL , MODEL_ID
执行行动循环
1.4 智能体应用的协作模式
基于智能体在任务中的角色和自主性程度,其协作模式主要分为两种:一种是作为高效工具,深度融入我们的工作流;另一种则是作为自主的协作者,与其他智能体协作完成复杂目标。
- 作为开发者工具的智能体
- Claude Code
- 作为自主协作者的智能体
- 单智能体自主循环
- 多智能体协作:角色扮演式对话、组织化工作流
- 高级控制流架构
Workflow 是让 AI 按部就班地执行指令,而 Agent 则是赋予 AI 自由度去自主达成目标。
工作流:一种传统的自动化范式,其核心是对一系列任务或步骤进行预先定义的、结构化的编排。
基于大型语言模型的智能体:一个具备自主性的、以目标为导向的系统。
这种基于实时信息进行动态推理和决策的能力,正是 Agent 的核心价值所在。
习题:
-
请分析以下四个
case中的主体是否属于智能体,如果是,那么属于哪种类型的智能体(可以从多个分类维度进行分析),并说明理由:case A:一台符合冯·诺依曼结构的超级计算机,拥有高达每秒 2 EFlop 的峰值算力
不是
case B:特斯拉自动驾驶系统在高速公路上行驶时,突然检测到前方有障碍物,需要在毫秒级做出刹车或变道决策
基于模型反应式智能体,部分可观察环境,混合智能体
case C:AlphaGo 在与人类棋手对弈时,需要评估当前局面并规划未来数十步的最优策略
效用式智能体
case D:ChatGPT 扮演的智能客服在处理用户投诉时,需要查询订单信息、分析问题原因、提供解决方案并安抚用户情绪
基于效用的智能体 -
假设你需要为一个”智能健身教练”设计任务环境。这个智能体能够:
- 通过可穿戴设备监测用户的心率、运动强度等生理数据
- 根据用户的健身目标(减脂/增肌/提升耐力)动态调整训练计划
- 在用户运动过程中提供实时语音指导和动作纠正
- 评估训练效果并给出饮食建议
请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
序贯,动态,部分可观察,确定性 -
某电商公司正在考虑两种方案来处理售后退款申请:
方案 A(
Workflow):设计一套固定流程,例如:A.1 对于一般商品且在 7 天之内,金额
< 100RMB自动通过;100-500RMB由客服审核;>500RMB需主管审批;而特殊商品(如定制品)一律拒绝退款 iA.2 对于超过 7 天的商品,无论金额,只能由客服审核或主管审批;
方案 B(
Agent):搭建一个智能体系统,让它理解退款政策、分析用户历史行为、评估商品状况,并自主决策是否批准退款请分析:
- 这两种方案各自的优缺点是什么?
- 在什么情况下
Workflow更合适?什么情况下Agent更有优势?如果你是该电商公司的负责人,你更倾向于采用哪种方案? - 是否存在一个方案 C,能够结合两种方案,达到扬长避短的效果?
-
在 1.3 节的智能旅行助手基础上,请思考如何添加以下功能(可以只描述设计思路,也可以进一步尝试代码实现):
提示:思考如何修改
Thought-Action-Observation循环来实现这些功能。- 添加一个”记忆”功能,让智能体记住用户的偏好(如喜欢历史文化景点、预算范围等)
- 当推荐的景点门票已售罄时,智能体能够自动推荐备选方案
- 如果用户连续拒绝了 3 个推荐,智能体能够反思并调整推荐策略
-
卡尼曼的”系统 1”(快速直觉)和”系统 2”(慢速推理)理论[2]为神经符号主义 AI 提供了很好的类比。请首先构思一个具体的智能体的落地应用场景,然后说明场景中的:
提示:医疗诊断助手、法律咨询机器人、金融风控系统等都是常见的应用场景
- 哪些任务应该由”系统 1”处理?
- 哪些任务应该由”系统 2”处理?
- 这两个系统如何协同工作以达成最终目标?
-
尽管大语言模型驱动的智能体系统展现出了强大的能力,但它们仍然存在诸多局限。请分析以下问题:
- 为什么智能体或智能体系统有时会产生”幻觉”(生成看似合理但实际错误的信息)?
- 在 1.3 节的案例中,我们设置了最大循环次数为 5 次。如果没有这个限制,智能体可能会陷入什么问题?
- 如何评估一个智能体的”智能”程度?仅使用准确率指标是否足够?