Agent 算是最近几个月比较关注的点,但不少同学还是不明白具体是什么意思。这篇文章,我们来简单了解下。

什么是 AI Agent(简洁版)© 由 ZAKER科技 提供

一、什么是 AI Agent

定义:让 AI 以类似人的工作和思考方式,来完成一系列的任务

AI Agent 能做什么?

靠 LLM 思考、能使用工具、能召唤助手

本质:给出任务,能帮你搞定的,就是 Agent

二、决策流程

AI Agent 基本决策流程

P(感知)P(规划)A(行动)

举个例子,此刻你肚子饿了,想吃东西。

假如你回家说:妈,我饿了!那么妈妈会:(感知)听到你说的 -(规划)计划做你爱吃的东西 -(行动)做好吃的叫你吃饭。

假如你身在他乡,你肚子饿了,想点外卖,打开了饿了么 app,那么饿了么会:(感知)你在 app 下单 -(规划)餐厅接单,骑手接单 -(行动)骑手将你的饭送到你手中。

什么是 AI Agent(简洁版)

三、AI Agent 的组成

每个 AI Agent 都会包括大脑(LLM)、规划(Planning)、记忆(Memory)、工具使用(Tool use)

大脑

用大语言模型 (LLM) 作为大脑

规划

一项复杂的任务需要涉及到许多步骤,Agent 需要知道这些步骤并提前规划:子目标分解、反思和完善。

记忆

对应人脑的记忆类型,可以用以下映射表述:

短期记忆包含所有上下文内容,受 Transformer 有限的上下文窗口长度的限制。

长期记忆作为 Agent 在查询时可以处理的外部存储数据库,可以通过快速检索进行访问。

工具使用

AI Agent 可以调用外部 API,以获得模型权重中缺少的额外信息,包括当前信息、代码执行能力、专有信息源的访问。

四、LLM 驱动下的 AI Agent 体系概览

每个 bot 都可能包括大脑(LLM)、规划(Planning)、记忆(Memory)、工具使用(Tool use)

什么是 AI Agent(简洁版)

五、AI Agent 的问题

是否需要一个 Agent 监控 当前的 Agent

为保证 AI Agent 决策的透明性,系统可能需要向用户展示推理过程

LLM 的上下文限制,影响大体量任务的执行

LLM 会出现格式与内容错误、甚至在一些时候也会表现出叛逆行为

六、AI Agent 和我们关系

作为 AI 的新型应用模式 Agent,无论是作为我们的助力还是独立智能体,都将显著提高工作效率,激发创新活力。随着 AI 技术的发展,那些能够理解 AI 的潜力、制定有效策略并指导 AI 行动准则的人,确实将成为企业中非常宝贵的资产。同时,这也要求员工不断提升自己的技能,以适应这个快速变化的时代。