Hello-Agents 第一章笔记

1.1 什么是智能体

在人工智能领域，智能体被定义为任何能够通过传感器（Sensors）感知其所处环境（Environment），并自主地通过**执行器（Actuators）采取行动（Action）**以达成特定目标的实体。

传统智能体严禁路线：
反射智能体
基于模型的反射智能体，状态，世界模型
基于目标的智能体
基于效用的智能体
学习型智能体，强化学习

大语言模型，LLM
工作方式：规划与推理，工具使用，动态修正

智能体的类型：

基于内部决策架构的分类
1. 反应式智能体
2. 模型式智能体
3. 基于目标与基于效用的智能体
  - 学习能力
基于时间与反应性的分类
- 权衡：追求速度的反应性&追求最优解的规划性
1. 反应式智能体：简单反应式、基于模型，速度快、计算开销低
2. 规划式智能体：基于目标、基于效用
3. 混合式智能体：规划&反应，LLM
基于知识表示的分类
1. 符号主义 AI，知识获取瓶颈
2. 亚符号注意 AI（连接主义），神经网络和深度学习，黑箱
3. 神经符号主义 AI（神经符号混合主义）

1.2 智能体的构成与运行原理

任务环境：PEAS 模型：性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)
环境通常是部分可观察的
行动结果的可预测性，环境分为：确定性、随机性
多智能体环境
几乎所有任务都发生在序贯且动态的环境中。“序贯”意味着当前动作会影响未来；而“动态”则意味着环境自身可能在智能体决策时发生变化。
“感知-思考-行动-观察”循环

智能体循环：

感知：观察
思考：规划、工具选择
行动
智能体的行动会引起环境 (Environment) 的状态变化 (State Change)，环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获，形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环，逐步推进任务，从初始状态向目标状态演进。

交互协议：规范 LLM 与环境间的信息交换
输出的机构化定义：思考，行动

Thought: 用户想知道北京的天气。我需要调用天气查询工具。
Action: get_weather("北京")

外部的解析器
感知系统，传感器，处理封装原始输出（观察）

1.3 动手体验：5 分钟实现第一个智能体

准备工作

requests ：从 python 程序中访问网络 API
tavily-python：一个强大的 AI 搜索 API 客户端，用于获取实时的网络搜索结果，可以在官网注册后获取 API
openai： OpenAI 官方提供的 Python SDK，用于调用 GPT 等大语言模型服务

指令模板：提示工程
们需要设计一个“指令模板”，告诉 LLM 它应该扮演什么角色、拥有哪些工具、以及如何格式化它的思考和行动。这是我们智能体的“说明书”，它将作为 system_prompt 传递给 LLM。

工具 1

工具 2

将所有工具放入一个字典，供主循环调用

接入大语言模型
API_KEY , BASE_URL , MODEL_ID

执行行动循环

1.4 智能体应用的协作模式

基于智能体在任务中的角色和自主性程度，其协作模式主要分为两种：一种是作为高效工具，深度融入我们的工作流；另一种则是作为自主的协作者，与其他智能体协作完成复杂目标。

作为开发者工具的智能体
1. Claude Code
作为自主协作者的智能体
1. 单智能体自主循环
2. 多智能体协作：角色扮演式对话、组织化工作流
3. 高级控制流架构

Workflow 是让 AI 按部就班地执行指令，而 Agent 则是赋予 AI 自由度去自主达成目标。

工作流：一种传统的自动化范式，其核心是对一系列任务或步骤进行预先定义的、结构化的编排。
基于大型语言模型的智能体：一个具备自主性的、以目标为导向的系统。

这种基于实时信息进行动态推理和决策的能力，正是 Agent 的核心价值所在。

习题：

请分析以下四个 case 中的主体是否属于智能体，如果是，那么属于哪种类型的智能体（可以从多个分类维度进行分析），并说明理由：

case A：一台符合冯·诺依曼结构的超级计算机，拥有高达每秒 2 EFlop 的峰值算力
不是
case B：特斯拉自动驾驶系统在高速公路上行驶时，突然检测到前方有障碍物，需要在毫秒级做出刹车或变道决策
基于模型反应式智能体，部分可观察环境，混合智能体
case C：AlphaGo 在与人类棋手对弈时，需要评估当前局面并规划未来数十步的最优策略
效用式智能体
case D：ChatGPT 扮演的智能客服在处理用户投诉时，需要查询订单信息、分析问题原因、提供解决方案并安抚用户情绪
基于效用的智能体
假设你需要为一个”智能健身教练”设计任务环境。这个智能体能够：
- 通过可穿戴设备监测用户的心率、运动强度等生理数据
- 根据用户的健身目标（减脂/增肌/提升耐力）动态调整训练计划
- 在用户运动过程中提供实时语音指导和动作纠正
- 评估训练效果并给出饮食建议
请使用 PEAS 模型完整描述这个智能体的任务环境，并分析该环境具有哪些特性（如部分可观察、随机性、动态性等）。
序贯，动态，部分可观察，确定性
某电商公司正在考虑两种方案来处理售后退款申请：

方案 A（Workflow）：设计一套固定流程，例如：

A.1 对于一般商品且在 7 天之内，金额 < 100RMB 自动通过；100-500RMB 由客服审核；>500RMB 需主管审批；而特殊商品（如定制品）一律拒绝退款 i

A.2 对于超过 7 天的商品，无论金额，只能由客服审核或主管审批；

方案 B（Agent）：搭建一个智能体系统，让它理解退款政策、分析用户历史行为、评估商品状况，并自主决策是否批准退款

请分析：
- 这两种方案各自的优缺点是什么？
- 在什么情况下 Workflow 更合适？什么情况下 Agent 更有优势？如果你是该电商公司的负责人，你更倾向于采用哪种方案？
- 是否存在一个方案 C，能够结合两种方案，达到扬长避短的效果？
在 1.3 节的智能旅行助手基础上，请思考如何添加以下功能（可以只描述设计思路，也可以进一步尝试代码实现）：

提示：思考如何修改 Thought-Action-Observation 循环来实现这些功能。
- 添加一个”记忆”功能，让智能体记住用户的偏好（如喜欢历史文化景点、预算范围等）
- 当推荐的景点门票已售罄时，智能体能够自动推荐备选方案
- 如果用户连续拒绝了 3 个推荐，智能体能够反思并调整推荐策略
卡尼曼的”系统 1”（快速直觉）和”系统 2”（慢速推理）理论[2]为神经符号主义 AI 提供了很好的类比。请首先构思一个具体的智能体的落地应用场景，然后说明场景中的：

提示：医疗诊断助手、法律咨询机器人、金融风控系统等都是常见的应用场景
- 哪些任务应该由”系统 1”处理？
- 哪些任务应该由”系统 2”处理？
- 这两个系统如何协同工作以达成最终目标？
尽管大语言模型驱动的智能体系统展现出了强大的能力，但它们仍然存在诸多局限。请分析以下问题：
- 为什么智能体或智能体系统有时会产生”幻觉”（生成看似合理但实际错误的信息）？
- 在 1.3 节的案例中，我们设置了最大循环次数为 5 次。如果没有这个限制，智能体可能会陷入什么问题？
- 如何评估一个智能体的”智能”程度？仅使用准确率指标是否足够？

墨水的花园

Explorer

Hello-Agents 第一章笔记

1.1 什么是智能体

1.2 智能体的构成与运行原理

1.3 动手体验：5 分钟实现第一个智能体

1.4 智能体应用的协作模式

习题：

Graph View

Table of Contents

Backlinks