AI Agent巨变！谷歌重磅发布开源A2A协议，实现智能体间的自由“对话”

谷歌云正式宣布推出全新的开源协议Agent2Agent（A2A），旨在打破当前人工智能（AI）智能体之间的壁垒，实现不同厂商、不同框架构建的AI智能体之间的无缝协作与信息交换。这一举措标志着AI领域迈向更加开放、高效和智能的新时代。

打破壁垒，实现智能体间的自由“对话”

随着企业对自主AI智能体的部署日益增长，如何让这些智能体在复杂的企业环境中协同工作，处理跨系统、跨应用的日常或复杂任务，成为了提升生产力的关键。然而，由于缺乏统一的标准，不同智能体之间往往难以有效沟通和协作，形成了一个个“信息孤岛”。

谷歌此次发布的A2A协议正是为了解决这一痛点。作为一个开放协议，A2A为AI智能体之间的通信、安全信息交换和协同行动提供了一套标准化的方法。无论这些智能体是由哪家供应商开发，采用何种底层技术，只要遵循A2A协议，就能实现真正的多智能体场景，摆脱了传统上将智能体局限于单一“工具”的限制。

五大核心设计原则，打造强大可靠的互操作性基础

A2A协议在设计之初就秉持了五大关键原则，以确保其能够适应未来复杂多变的AI应用场景:

拥抱智能体能力（Embrace agentic capabilities）:A2A侧重于使智能体能够以其自然的、非结构化的方式进行协作，即使它们不共享内存、工具和上下文也能高效工作。
构建于现有标准之上（Build on existing standards）:该协议基于HTTP、SSE和JSON-RPC等流行的现有标准构建，这大大降低了企业将其集成到现有IT架构中的难度。
默认安全（Secure by default）:A2A在设计上就支持企业级的身份验证和授权，其安全性与OpenAPI的身份验证方案相当。
支持长期任务（Support for long-running tasks）:A2A具有高度的灵活性，可以支持从快速任务到需要数小时甚至数天才能完成的深度研究等各种场景。在整个过程中，A2A可以向用户提供实时的反馈、通知和状态更新。
模态无关（Modality agnostic）:考虑到智能世界不仅限于文本，A2A还支持包括音频和视频流在内的多种模态。

核心功能解析:智能体如何“交流”与“协作”?

A2A协议定义了智能体之间交互的关键能力:

能力发现（Capability discovery）:智能体可以通过JSON格式的“智能体卡片（Agent Card）”宣传自身的能力，使客户端智能体能够找到最适合执行特定任务的远程智能体。
任务管理（Task management）:智能体之间的通信以任务完成为导向。协议定义了“任务（task）”对象及其生命周期，任务可以立即完成，也可以通过智能体之间的同步通信来跟踪长期任务的最新状态。任务的输出被称为“工件（artifact）”。
协作（Collaboration）:智能体之间可以互相发送消息，以传递上下文、回复、工件或用户指令。
用户体验协商（User experience negotiation）:每条消息都包含“部件（parts）”，这是一个完整的、特定内容类型的数据块（如生成的图像）。客户端和远程智能体可以协商用户界面能力所需的正确格式，例如iframe、视频和Web表单等。