高德联合千问开源AGenUI：让Agent UI同时跑在iOS、安卓和鸿蒙上-AITOP100,AI资讯

AGenUI

近日，高德与阿里千问C端应用团队联合发布了AGenUI——这是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。开发者接入SDK后，即可将Agent的输出直接渲染为可交互的原生卡片，无需为不同平台分别写UI代码。

AGenUI基于Google A2UI协议构建，补全了"这些描述如何在手机上跑起来"的端侧原生渲染能力，两者结合推动AI应用从"文本式交互"走向"生成式UI交互"。目前已正式开源，访问genui.amap.com或GitHub即可参与。

一、痛点：Agent很聪明，但界面很原始

在大语言模型能力不断突破的今天，Agent早已不只是简单的问答机器——它具备了规划、记忆、工具调用等复杂能力。无论是LangChain、LangGraph还是AutoGen，开发者都能构建出足够"聪明"的智能体。

但与此同时，Agent与用户之间的交互方式，却始终停留在最基础的聊天框模式。

举个例子：当你想让Agent帮你完成一个多步骤操作（比如订机票），传统模式下Agent只能输出一段冗长的文字："请选择出发日期、选择航班、填写乘客信息……"然后你得手动完成所有步骤，再把结果反馈给Agent。这种低效的交互方式，不仅让用户疲于应对，也浪费了Agent的智能算力。

问题的根源在于：Agent"知道"要什么样的界面，但没有办法直接生成并呈现给用户——它只能输出文本，把"搭界面"这件事推给用户自己完成。

这就是A2UI协议诞生的背景。

二、Google A2UI协议：让Agent"描述"界面，而不是"编写"界面

Google在去年年底提出了并开源了A2UI（Agent-to-User Interface）协议。这套协议定义了Agent与前端之间的通信标准，让Agent能够用统一的方式描述界面需求，前端则按照标准将其渲染为真实的UI组件。

A2UI的核心设计哲学是"声明式UI"——Agent只"描述"，不"编码"。

传统的Agent交互中，若想实现界面展示，往往需要Agent生成HTML、JSX等前端代码，再由前端解析执行。这种方式不仅要求Agent具备前端编码能力，还会带来兼容性和安全性问题。

A2UI采用了完全不同的思路：Agent不再输出前端代码，而是输出一套结构化的JSON数据，用于描述"需要什么界面组件"“组件有什么属性”“组件之间的层级关系”。

比如，Agent想要一个姓名输入框，只需要输出这样的JSON：

json复制

{
 "surfaceUpdate": {
 "surfaceId": "main",
 "components": [
 {
 "id": "name",
 "component": {
 "type": "TextField",
 "props": { "label": "姓名" }
 }
 }
 ]
 }
}

这段JSON清晰地告诉前端：需要在ID为"main"的界面上，添加一个文本输入框组件，标签为"姓名"。前端负责将这种结构化描述映射成真实的本地UI组件，至于用React、Vue还是其他框架实现，完全由前端决定，Agent无需关心。

A2UI的四大核心特性：

声明式UI：Agent输出结构化JSON描述界面需求，不输出可执行代码
安全可控：Agent输出的是数据而非代码，前端只渲染"白名单组件"，从根源上解决安全性问题
跨平台渲染：Agent只需描述"我要一个输入框+一个按钮"，无需关心这个输入框在不同平台的技术实现
模型解耦：不绑定特定LLM，任何能够输出符合规范的JSON的模型都可以接入

2026年4月，Google正式推出A2UI 0.9版本，搭载共享Web核心库与官方React渲染器，同时完成对Flutter、Lit、Angular等主流开发框架的渲染器更新，并推出支持Python环境安装的Agent SDK，进一步降低了AI智能体接入与开发门槛。

三、A2UI的三层架构：协议层、渲染层、数据层

A2UI的核心架构分为三层，每一层都有清晰的分工：

1. 协议层（Agent-to-UI Communication）

这是A2UI的核心，定义了Agent与前端之间的通信格式和标准。Agent通过输出符合A2UI协议的JSON数据，向前端传递界面描述信息，这部分数据被称为"surfaceUpdate"（界面更新）。

一个典型的协议层示例——餐厅搜索界面：

json复制

{
 "surfaceUpdate": {
 "surfaceId": "restaurant-search",
 "components": [
 {
 "id": "search-form",
 "component": {
 "type": "Form",
 "children": [
 {"type": "TextField", "props": {"placeholder": "搜索餐厅..."}},
 {"type": "Button", "props": {"text": "搜索"}}
 ]
 }
 }
 ]
 }
}

三个核心字段：surfaceId标识界面唯一ID；components是组件数组；每个组件包含type（组件类型）、props（属性）、children（子组件）等字段。

AGenUI

2. 渲染层（Framework-Agnostic Rendering）

渲染层的核心职责是将协议层的结构化JSON数据，映射成各个前端框架能够识别的本地UI组件。

渲染层是框架无关的——无论前端使用React、Vue、Angular还是SwiftUI、Compose，都可以实现A2UI的渲染逻辑：

平台	渲染方式
Web	React / Angular / Lit
iOS	SwiftUI
Android	Compose
Flutter	Widget

本质上，渲染层就是一个"翻译器"，将A2UI协议定义的抽象组件，翻译成各个平台原生的具体组件。

3. 数据层（双向数据同步）

在实际交互中，前端也需要向Agent反馈用户操作的数据（比如用户输入的文本），同时Agent也可能需要向前端推送动态数据（比如搜索结果）。数据层通过"dataModelUpdate"（数据模型更新）字段来实现双向数据同步。

这意味着Agent与前端之间不仅能实现界面交互，还能实现数据的实时同步，为复杂交互场景（表单提交、动态列表、状态更新等）提供了坚实的技术支撑。

四、AGenUI：让A2UI在手机上真正跑起来

Google的A2UI协议定义了"模型如何描述界面"，但并没有解决"这些描述如何在手机上跑起来"的问题——它主要面向Web端。

AGenUI正是来解决这个问题的。

高德与阿里千问C端应用团队联合发布的AGenUI，是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。它在Google A2UI协议的基础上，补全了移动端的端侧原生渲染能力。

AGenUI的端云一体架构：

云侧：通过Agent Skill生成AI原生的A2UI JSON。这一步降低了大模型的Token消耗——Agent不需要输出大段文本说明，只需要输出结构化的界面描述；同时降低了输出不确定性——JSON格式比自然语言的界面描述更稳定、更易于解析
端侧：依托跨平台C++ Core统一处理协议解析、状态管理与布局计算，在iOS、Android和鸿蒙三端直接渲染为原生组件，从底层保证了多端体验一致

这是关键的一点：AGenUI不是通过JavaScript或WebView来实现跨平台，而是用C++核心在三个平台各自渲染原生组件。这意味着性能更高、体验更接近原生应用。

Streaming-first流式架构是AGenUI的核心设计之一：