ai-agent

什么是AI gent

是能够自主规划、调用工具并完成复杂人物的智能体
Agent = LLM + Planning + Memory + Tool

AI agent的核心架构

规划(任务优先级排序与执行路径生成)
记忆(保存对话历史、用户偏好与外部知识)
工具(图片模型知识截止日期、增强行动力)

主流AI agent开发框架

LangChain
AutoGPT
CrewAI
AutoGen

阅读以下 AI Agent 的执行序列,指出其中违反 ReAct 逻辑的一处错误,并简要说明理由。 1. Thought: 我需要查询 2024 年巴黎奥运会金牌榜。 2. Action: google_search(“2024 Paris Olympics medal table”) 3. Observation: 中国获得 40 金,美国获得 40 金。 4. Action: google_search(“谁是第一名”) 5. Thought: 根据搜索结果,中国和美国金牌数相同,我需要对比奖牌总数来确定排名。

解析:错误出现在步骤 4。在 ReAct 逻辑中,步骤 3 获取 Observation 后,Agent 应当先进入 Thought 环节进行推理(例如:’我看到了金牌数相同,接下来需要查看总奖牌数’),然后再决定执行下一个 Action。而在本例中,Agent 在步骤 3 之后直接执行了步骤 4 的 Action,跳过了必要的推理环节。此外,步骤 4 的搜索指令在已有数据的情况下显得冗余,反映了 Agent 推理能力的缺失或 Prompt 设计的缺陷。

意思是
思考 - 行动 - 观察 - 思考 - 执行。

为了让 AI Agent 能够准确理解何时以及如何使用搜索工具,你需要为搜索工具编写怎样的描述信息(Description)和输入 Schema?

描述信息:是你写给 LLM 看的一段话,告诉它这个工具是干什么的(例如:“这是一个用于搜索实时信息的工具”)。没有它,LLM 根本不知道什么时候该调用搜索功能。
Schema:定义了工具接收参数的格式(通常是 JSON 格式)。比如搜索工具需要一个参数 query(字符串类型)。