Part IX 前端、交互与多模态¶
本部分目标¶
Agent 平台最终要通过界面进入业务工作流。Part IX 讨论对话 UI、流式输出、Generative UI、富交互产物、多模态输入和语音 Agent。重点在任务进度、证据、工具结果、错误恢复和人工确认入口怎样被用户看见,聊天窗口本身只是入口。
本部分章节¶
| 章 | 主题 | 读完应能回答的问题 |
|---|---|---|
| 第47章 对话 UI 与流式输出 | SSE、事件协议、增量渲染 | Agent UI 怎样展示状态、工具调用、错误和最终回答 |
| 第48章 Generative UI 与富交互 | Tool Call 渲染、图表、表格、Artifacts | 模型输出怎样变成可编辑、可审计的交互产物 |
| 第49章 多模态输入与语音 Agent | 语音、图像、文件上传、Realtime | 多模态输入怎样接入权限、证据链和实时交互 |
阅读路径¶
第47章建立前端事件协议和流式渲染基础,第48章讨论结构化产物和可编辑 UI,第49章扩展到语音、图像和文件输入。UI 是 Runtime、Trace、Policy 和 Evidence 的呈现层,不是孤立的前端页面。