1.1 什么是智能体

在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过**执行器(Actuators)采取行动(Action)**以达成特定目标的实体。

传统智能体严禁路线:
反射智能体
基于模型的反射智能体,状态,世界模型
基于目标的智能体
基于效用的智能体
学习型智能体,强化学习

大语言模型,LLM
工作方式:规划与推理,工具使用,动态修正

智能体的类型:

  1. 基于内部决策架构的分类
    1. 反应式智能体
    2. 模型式智能体
    3. 基于目标与基于效用的智能体
      • 学习能力
  2. 基于时间与反应性的分类
    • 权衡:追求速度的反应性&追求最优解的规划性
    1. 反应式智能体:简单反应式、基于模型,速度快、计算开销低
    2. 规划式智能体:基于目标、基于效用
    3. 混合式智能体:规划&反应,LLM
  3. 基于知识表示的分类
    1. 符号主义 AI,知识获取瓶颈
    2. 亚符号注意 AI(连接主义),神经网络和深度学习,黑箱
    3. 神经符号主义 AI(神经符号混合主义)

1.2 智能体的构成与运行原理

任务环境:PEAS 模型:性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)
环境通常是部分可观察
行动结果的可预测性,环境分为:确定性、随机性
多智能体环境
几乎所有任务都发生在序贯动态的环境中。“序贯”意味着当前动作会影响未来;而“动态”则意味着环境自身可能在智能体决策时发生变化。
“感知-思考-行动-观察”循环

智能体循环:

  1. 感知:观察
  2. 思考:规划、工具选择
  3. 行动
    智能体的行动会引起环境 (Environment) 的状态变化 (State Change),环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获,形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环,逐步推进任务,从初始状态向目标状态演进。

交互协议:规范 LLM 与环境间的信息交换
输出的机构化定义:思考,行动

Thought: 用户想知道北京的天气。我需要调用天气查询工具。
Action: get_weather("北京")

外部的解析器
感知系统,传感器,处理封装原始输出(观察)

1.3 动手体验:5 分钟实现第一个智能体

准备工作

  1. requests :从 python 程序中访问网络 API
  2. tavily-python:一个强大的 AI 搜索 API 客户端,用于获取实时的网络搜索结果,可以在官网注册后获取 API
  3. openai: OpenAI 官方提供的 Python SDK,用于调用 GPT 等大语言模型服务

指令模板:提示工程
们需要设计一个“指令模板”,告诉 LLM 它应该扮演什么角色、拥有哪些工具、以及如何格式化它的思考和行动。这是我们智能体的“说明书”,它将作为 system_prompt 传递给 LLM。

工具 1

工具 2

将所有工具放入一个字典,供主循环调用

接入大语言模型
API_KEY , BASE_URL , MODEL_ID

执行行动循环

1.4 智能体应用的协作模式

基于智能体在任务中的角色和自主性程度,其协作模式主要分为两种:一种是作为高效工具,深度融入我们的工作流;另一种则是作为自主的协作者,与其他智能体协作完成复杂目标。

  1. 作为开发者工具的智能体
    1. Claude Code
  2. 作为自主协作者的智能体
    1. 单智能体自主循环
    2. 多智能体协作:角色扮演式对话、组织化工作流
    3. 高级控制流架构

Workflow 是让 AI 按部就班地执行指令,而 Agent 则是赋予 AI 自由度去自主达成目标。

工作流:一种传统的自动化范式,其核心是对一系列任务或步骤进行预先定义的、结构化的编排
基于大型语言模型的智能体:一个具备自主性的、以目标为导向的系统

这种基于实时信息进行动态推理和决策的能力,正是 Agent 的核心价值所在。

习题:

  1. 请分析以下四个 case 中的主体是否属于智能体,如果是,那么属于哪种类型的智能体(可以从多个分类维度进行分析),并说明理由:

    case A一台符合冯·诺依曼结构的超级计算机,拥有高达每秒 2 EFlop 的峰值算力
    不是
    case B特斯拉自动驾驶系统在高速公路上行驶时,突然检测到前方有障碍物,需要在毫秒级做出刹车或变道决策
    基于模型反应式智能体,部分可观察环境,混合智能体
    case CAlphaGo 在与人类棋手对弈时,需要评估当前局面并规划未来数十步的最优策略
    效用式智能体
    case DChatGPT 扮演的智能客服在处理用户投诉时,需要查询订单信息、分析问题原因、提供解决方案并安抚用户情绪
    基于效用的智能体

  2. 假设你需要为一个”智能健身教练”设计任务环境。这个智能体能够:

    • 通过可穿戴设备监测用户的心率、运动强度等生理数据
    • 根据用户的健身目标(减脂/增肌/提升耐力)动态调整训练计划
    • 在用户运动过程中提供实时语音指导和动作纠正
    • 评估训练效果并给出饮食建议

    请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
    序贯,动态,部分可观察,确定性

  3. 某电商公司正在考虑两种方案来处理售后退款申请:

    方案 A(Workflow):设计一套固定流程,例如:

    A.1 对于一般商品且在 7 天之内,金额 < 100RMB 自动通过;100-500RMB 由客服审核;>500RMB 需主管审批;而特殊商品(如定制品)一律拒绝退款 i

    A.2 对于超过 7 天的商品,无论金额,只能由客服审核或主管审批;

    方案 B(Agent):搭建一个智能体系统,让它理解退款政策、分析用户历史行为、评估商品状况,并自主决策是否批准退款

    请分析:

    • 这两种方案各自的优缺点是什么?
    • 在什么情况下 Workflow 更合适?什么情况下 Agent 更有优势?如果你是该电商公司的负责人,你更倾向于采用哪种方案?
    • 是否存在一个方案 C,能够结合两种方案,达到扬长避短的效果?
  4. 在 1.3 节的智能旅行助手基础上,请思考如何添加以下功能(可以只描述设计思路,也可以进一步尝试代码实现):

    提示:思考如何修改 Thought-Action-Observation 循环来实现这些功能。

    • 添加一个”记忆”功能,让智能体记住用户的偏好(如喜欢历史文化景点、预算范围等)
    • 当推荐的景点门票已售罄时,智能体能够自动推荐备选方案
    • 如果用户连续拒绝了 3 个推荐,智能体能够反思并调整推荐策略
  5. 卡尼曼的”系统 1”(快速直觉)和”系统 2”(慢速推理)理论[2]为神经符号主义 AI 提供了很好的类比。请首先构思一个具体的智能体的落地应用场景,然后说明场景中的:

    提示:医疗诊断助手、法律咨询机器人、金融风控系统等都是常见的应用场景

    • 哪些任务应该由”系统 1”处理?
    • 哪些任务应该由”系统 2”处理?
    • 这两个系统如何协同工作以达成最终目标?
  6. 尽管大语言模型驱动的智能体系统展现出了强大的能力,但它们仍然存在诸多局限。请分析以下问题:

    • 为什么智能体或智能体系统有时会产生”幻觉”(生成看似合理但实际错误的信息)?
    • 在 1.3 节的案例中,我们设置了最大循环次数为 5 次。如果没有这个限制,智能体可能会陷入什么问题?
    • 如何评估一个智能体的”智能”程度?仅使用准确率指标是否足够?