建议对标Google WorkSpace CLI,打造WPS CLI作为AI Agent的统一接口
GitHub仓库地址:Google Workspace CLI
(来自公众号浮之静)深度解析:Google Workspace CLI
Google 近期在 GitHub 上发布了基于 Rust 编写的 Google Workspace CLI。这一举措不仅是对特定云平台工具链的升级,更标志着整个科技巨头阵营开始向“代理优先(Agent-First)” 的软件设计理念全面倾斜。如今,越来越多的企业和开源产品正在加速其软件交互接口的 CLI 化,一切架构设计的终极目标都在向适配 AI 代理与 Skills 生态靠拢。建议WPS官方开发团队可以对标Google WorkSpace CLI,打造WPS CLI作为AI Agent的统一接口:
一、打造CLI统一入口,覆盖WPS生态的全部核心服务
开发核心wps-cli命令行工具,原生对接WPS开放平台全量API,实现一个工具一站式覆盖WPS文字、表格、演示、PDF、云文档、企业云盘、日历、待办、表单、WPS会议、企业管理后台、WPS听记、WPS AI及知识库等全产品线能力,无需单独对接各产品分散的API接口。
选择CLI作为AI Agent的统一接口的原因:
1. 结构化输出:命令行的文本输出天然匹配 LLM 的处理格式
大语言模型的训练数据主要是文本。命令行界面的文本交互模式,与 LLM 的处理方式完美匹配。相比之下,GUI 操作需要图像理解、坐标定位、事件模拟——复杂度高出几个数量级。
2. CLI 是跨平台的通用协议
无论是 Linux、macOS 还是 Windows,无论是本地还是云端,CLI 都能用相同的方式工作。对于 AI Agent 来说,CLI 是一个稳定的、可预测的接口。
3. 确定性:相同的命令永远产生相同的结果
RPA(机器人流程自动化)最大的问题是脆弱:界面变化、元素位置改变都会导致脚本失效。CLI 则不同——命令和参数不变,结果就不变。
4. 自我描述:--help 参数提供了 AI 可以自动发现的文档
5.可组合性:命令可以串联、管道化,构建复杂的工作流
二、动态生成命令
Google Workspace CLI并非传统的静态命令集合,而是能够在运行时动态读取 Google Discovery API服务并构建其全部命令面的动态系统。Google Discovery API服务是一个提供 Google 各项云端 API 元数据描述的机器可读接口系统。它以结构化的 JSON 文档格式,实时暴露 Google 服务的可用端点、方法签名、参数约束规则以及所需的身份验证权限等全量信息,这使得像 Google Workspace CLI这样的客户端工具无需在代码中预先硬编码庞大的静态库,即可在运行时动态拉取并自动构建出包含最新云端能力的整个命令操作面。
建议WPS CLI也能内置动态API生成机制,CLI启动时实时从WPS官方API目录拉取最新接口定义,WPS产品新增功能上线后,CLI可即时同步支持,无需等待CLI版本迭代,彻底解决封装库更新滞后的行业痛点。
三、输出结构化XML,同时支持多模态输入输出
Google Workspace CLI强制采用结构化 JSON 输出。
由于正在内测的「WPS 笔记」强制采用XML输入输出,为保持一致性,建议WPS CLI的操作执行结果默认输出标准化、结构化的XML格式,字段规范统一、可预测,响应体、元数据、错误信息等内容全部结构化,AI Agent 不需要解析人类视角的输出,直接阅读XML 就行。
### XML 输入输出
- 所有内容以语义 XML 格式收发,使用标签如 `<p>`、`<h1>`-`<h6>`、`<blockquote>`、`<codeblock>`、`<table>`、`<highlightBlock>`、`<columns>` 等。
- 完整 XML 格式参考已集成到 MCP Server Instructions 中自动注入。未注入时可调用 `get_xml_reference` 工具按需获取。在XML格式以外,可以参照「WPS 笔记」(https://mp.weixin.qq.com/s/015SMjfHJl-_OT9pYREGhQ)支持全模态输入和输出:
四、简易、轻便的接入门槛
内置完整的鉴权管理、token自动刷新、接口分页处理、异常重试与标准化错误处理机制,屏蔽底层API对接的繁琐细节,大幅降低接入门槛。
设计自引导安装机制,Agent调用时可自动检测环境中是否存在wps-cli,若未安装则自动完成一键部署与基础鉴权配置,实现零手动干预的快速部署,适配多机器、多团队的规模化扩展场景。
npm install -g @wps/cli五、开箱即用的Agent Skill技能体系
“技能(Skill)”指的是专门编写的 Markdown 文件群,其本质是用于向模型传授具体业务规则和最佳实践的“可复用程序化知识(Reusable Procedural Knowledge)”。诸如 skills.sh(由 Vecel 维护的 Agent 技能生态系统)已迅速崛起为 AI 时代的 NPM,开发者只需一行 CLI 命令(如 npx skills add)即可将企业级能力安装到自己的 Agent 中。
Google Workspace CLI内置了超过 100+ 个专为自动化办公设计的技能Skills(地址:https://github.com/googleworkspace/cli/blob/main/docs/skills.md),建议WPS CLI可以对标提供丰富的技能。
基础服务技能层:为WPS每一个核心产品线打造独立的标准化技能模块,包括但不限于:
每个技能模块对应完整的API操作能力,作为Agent能力搭建的基础构建模块。
预制角色技能层:针对国内办公高频场景,打造开箱即用的角色化Agent技能包,预设完整的身份定位与能力组合,覆盖行政助理、项目经理、HR专员、销售运营、财务专员、内容创作者、IT管理员、教研人员、客户支持、团队负责人等核心办公角色;每个角色打包对应所需的服务技能、操作流程与工作流模板,无需用户自行组合多产品能力,直接匹配角色即可完成对应场景任务。
快捷辅助技能层:针对办公高频操作打造极简快捷命令,比如wps-docs-convert(多格式文档一键转换)、wps-pdf-ocr(PDF图片文字识别提取)、wps-drive-upload(文件批量上传云盘)、wps-sheets-batch(表格数据批量清洗处理)、wps-email-send(基于WPS邮箱的个性化邮件批量发送)等,简化单一场景的操作步骤,降低普通用户使用门槛。
场景化工作流模板层:将办公高频的跨产品、多步骤自动化工作流模板,以标准化文档形式封装,支持AI Agent按需微调、条件判断插入、自定义扩展,支持以下场景:
文档与数据协同类:从表格数据批量生成定制化文档 / 演示文稿、多格式文档批量转换与归档、PDF 文件批量处理与结构化数据提取、云文档对外共享权限批量审计与管理、表单回收数据自动同步至表格并生成可视化统计报表
邮件与沟通类:从表格名单批量发送个性化邮件、收件箱智能分拣与自动回复、邮件附件自动归档至 WPS 云盘并生成管理台账
日程与项目管理类:会议前自动拉取相关文档生成会议材料包、自动创建周例会日程并同步议程模板、项目待办批量创建与进度自动跟踪、周报自动生成(同步本周日程、文档修改、待办完成情况等数据填充至预设模板)
企业行政与人事类:新员工入职一键流程(企业账号创建、欢迎文档推送、共享文件夹权限配置、团队日历添加、入职待办分配)、员工考勤数据自动统计与报表生成、企业培训资料批量分发与学习进度跟踪
教研教学类:学生作业批量收集与归档、考试成绩自动统计与分析、教学课件批量生成与格式统一、考试试卷自动排版与格式校验
在Google Workspace CLI中这些工作流模板被称为recipes,其最强大的地方在于它们不是写死的脚本,而是半结构化的指导文档。AI Agent 拿到后,可以根据你的具体需求(比如“只处理销售部的邮件”“周报只要上周五之后的数据”)做微调、插入条件判断、甚至替换部分命令,而不需要从零写调用逻辑。
正在内测的AI 原生笔记产品—— 「WPS 笔记」目前已支持Agent Skill技能:
WPSNOTE/WPSnote-skills --- wpsnote/wpsnote-skills,结构如下:
六、内置全链路安全合规管控机制
原生对接 WPS 现有安全体系,支持数据访问权限精细化管控,所有 CLI 操作全程留痕,支持操作日志全量存储与审计回溯,满足企业级合规管控要求。
内置 prompt 安全过滤与注入攻击防护能力,在 WPS 文档、表格、邮件等数据进入 AI 大模型上下文之前,自动完成恶意指令扫描与过滤,从数据链路源头防范 Agent 越狱风险,保障企业与个人数据安全。
支持企业级私有化部署,可无缝对接企业内部 WPS 私有化部署环境,数据流转全程不出企业内网,满足金融、政务等强合规行业的使用需求。
七、原生支持MCP服务
Anthropic 主导推进的模型上下文协议(Model Context Protocol, MCP),作为一种开放标准的双向交互协议,是连接孤立的 AI 代理与全球海量云端服务、数据系统以及底层物理资源的桥梁,被比喻为“AI 应用程序的 USB-C 接口”。开发者只需实现一次 MCP 服务器,便能通过 JSON-RPC 格式将自身的能力暴露出去,而任何遵循该协议的 MCP 客户端(代理,如 Claude for Desktop, Gemini CLI ,OpenClaw以及各类 IDE)都可以无缝接入。这种高度统一的通信机制赋予了代理调用数百个分布在不同网络层和服务器集群上的工具链的能力,重塑了软件集成的版图。
建议WPS CLI原生支持MCP协议,自带MCP服务器,可将WPS全量能力封装为标准化工具,一键接入WPS AI自身Agent体系,同时兼容Claude、文心一言、通义千问、豆包等国内外主流大模型,以及VS Code等支持MCP的开发环境。
{
"mcpServers":{
"wps":{
"command":"wps",
"args":["mcp","-s","docs,sheets,slides"]
}
}
}正在内测的AI 原生笔记产品—— 「WPS 笔记」目前已支持MCP协议:https://p.kdocs.cn/s/DCHZIKZGADQHG。WPS笔记开放了23+个原子能力接口,赋予了AI Agent 像人类一样精细操作笔记的能力。这意味着,不论你是和龙虾对话,还是在 Claude Code / Cursor 的命令行里写代码,都可以让 AI Agent 直接操作你的笔记:创建、写入、修改、排版。不止是今天狂欢的龙虾,所有未来兼容MCP的AI Agent,都将可以在WPS笔记中实现人与AI的「协作-产出-积累-复用」。(WPS笔记内测申请:ainote.kdocs.cn)
八、配套完善的开发者生态体系
提供国内主流 AI Agent 开发框架的原生集成指南与一键配置方案,包括但不限于 LangChain、AutoGPT、Dify、FastGPT 等,大幅降低开发者的集成与二次开发成本。
支持与 WPS 开放平台、WPS 插件市场深度打通,CLI 能力可同步适配 WPS 插件生态,实现插件能力与 CLI 命令的双向调用。
开源全量示例代码,覆盖 Python、Go、JavaScript、Rust 等主流开发语言的接入示例,同步提供详细的开发文档、场景化最佳实践教程与常见问题解决方案。
开放社区贡献通道,支持开发者提交自定义技能、工作流模板与功能优化建议,共建 WPS CLI 开源生态。
提供配套的本地调试工具与模拟环境,支持开发者本地调试 CLI 命令与 Agent 技能,降低开发与测试成本。