1 适用场景

需要多步组合、选择路径的复杂问题。

该问题可以被拆分成多个子模块,每个子模块都能清晰地定义输入、输出和功能,并能判断是否达成目标。

可能感觉有解决的方法,但不能确定具体的每一步方法。

可能存在多种组合方式,而不仅限于单一的方法,并且我们无法确定最优的解决方案。

对于单个模块而言,只需将接口描述清楚,无需过多考虑它与其他模块之间的调用关系。

2 原理

Thought->Action->Observation (Repeated many times)。

代理根据用户输入及当前状态选择一个动作,执行该动作并观察结果,然后继续下一个动作。

有了代理,就不需要手动编写 if/else 逻辑了,只需将选项提供给模型,让其进行判断。

3 langchain agent

Langchain 本身提供一些工具,例如 Google 搜索、GitHub 和 Python 等。如果需要自己实现工具,则需要继承 BaseTool 类,并实现 run 方法。模型根据工具的描述调用相应的方法,并观察其返回结果。

3.1.1 类别

计划代理:通过 llm 制定计划

执行代理:通过 llm 和 tools 实现计划

3.1.2 Chain 与 Agent 的差别

Chain 和 Agent 都用于解决多步问题。Chain 是静态的,过程是事先设计好的;而 Agent 则是动态的,由大模型来决策整个过程。

4 示例

AI智能体基础,Agent的具体实现

5 想法和启发

手动或自动将需要复用的方法封装成代理程序,以实现模块化并形成可重复使用的积木块。

让大语言模型组装这些积木块。