强烈建议开发 WPS 灵犀移动端 APP

WPS 灵犀当前仅推出了Windows 与 macOS桌面端(lingxi.wps.cn/claw/)及微信小程序,除此之外其功能内嵌在各系统的WPS客户端内部,但尚未推出移动端APP。

根据 QuestMobile 发布的《2025 年中国移动互联网年度大报告》,截至 2025 年 12 月,国内移动端 AI 应用月活跃用户规模已达 7.22 亿,占全网移动端活跃用户的 56.6%。移动端已成为 AI 应用的主战场,豆包以 2.27 亿月活稳居国内 AI 原生 App 榜首,近期还打算推出付费会员体系。在这一市场格局下,WPS 灵犀移动端的缺席意味着金山办公正在主动让渡移动端 AI 流量的入口位置。

我建议WPS官方推出灵犀移动端APP,在 AI 时代抢占移动端入口,在通用 AI 助手的包围中开辟出一条属于"AI 办公原生"的独特赛道。相比WPS超级会员,WPS大会员每年需要为AI功能支付超过100元人民币的差额支出。在WPS桌面端以外,如果有一个WPS AI专属的移动APP,能让大会员感受到物有所值,增强获得感进而增加付费意愿。


一、整合 WPS 移动客户端中的 AI 功能,实现产品聚焦与职责分离

1.1 现状:移动端 AI 功能散落嵌入 Office 客户端

当前 WPS Office 移动客户端(iOS / Android)已内置部分 AI 能力,除AI 伴写、AI 文档问答、AI 数据分析外,还包括WPS 灵犀、WPS AI PPT、WPS AI 简历、WPS AI 法速查、WPS 听记、WPS AI设计室、WPS笔记等。这些功能以"嵌入组件"的形式分散在WPS移动客户端中,不仅导致WPS客户端越来越臃肿,而且还导致了存在两个严重的问题:

  • 功能不够聚焦:移动端 WPS Office 的核心功能是文档查看和编辑,各类AI 功能的嵌入使其产品定位逐渐模糊。对于只需要查看或简单编辑文档的用户而言,AI 功能的存在增加了应用的复杂度和资源消耗。引入过多新功能,不仅导致原有核心功能的体验被削弱,还会导致新功能的作用不够突显,无法吸引到用户足够的关注,无法得到用户的充分重视,在守旧和创新两个方向都不讨好。

  • 客户端功能更新慢:AI 功能与 Office 基础编辑功能耦合在同一应用内,意味着 WPS的更新节奏与AI 能力的更新节奏强绑定,WPS的文档查看编辑核心功能与AI功能均无法独立快速演进,互相拖累,难以跟上AI应用快速更新的节奏。

1.2 建议:灵犀移动端作为独立 AI 入口,与 Office 客户端形成互补

将 AI 功能从 WPS Office 移动客户端中剥离,收敛至独立的"灵犀"APP 中,形成如下职责划分:

维度

WPS Office 移动客户端

WPS 灵犀移动端 APP

核心定位

文档查看、轻量编辑、文件管理

AI 对话、智能创作、任务自动化

AI 功能

仅保留与当前文档上下文直接相关的轻量 AI 操作(如选中段落后的快捷润色、翻译)

承载所有独立的 AI 能力(AI 伴写、AI PPT、语音转写、智能分析等)

用户场景

"打开文件、编辑文件、保存文件"

"下达指令、获取结果、交付内容"

迭代节奏

跟随 Office 基础能力发版周期

独立迭代,快速响应 AI 能力升级

通过这一分离,WPS Office 移动端回归"轻量文档工具"的本质,降低应用臃肿度;灵犀移动端则专注于 AI 交互体验的打磨,两者通过 WPS 云文档(365.kdocs.cn)实现数据互通,用户在灵犀中生成的内容可直接同步至 WPS Office 中查看和编辑。


二、整合现有 AI 小程序,收敛入口,构建一站式体验

2.1 现状:AI 能力分散于多个独立小程序

目前金山办公围绕 AI 办公场景已推出多款微信小程序,各小程序功能独立、入口分散:

小程序

核心功能

WPS 灵犀

AI 对话、文档创作、PPT 生成等通用 AI 办公能力

WPS AI PPT

通过自然语言或文档一键生成演示文稿

WPS 听记

实时录音转文字、音视频文件导入转写、智能区分说话人、实时同传字幕

WPS AI 简历

简历撰写、优化、智能分析、证件照制作

WPS AI 法速查

法律咨询、控辩研讨、文书生成,联合聚法案例提供法律解答

用户需要分别进入不同小程序才能使用对应功能,缺乏统一的入口和一致的交互体验。这种分散状态带来的问题包括:

  • 用户认知成本高:普通用户难以理解"WPS 灵犀"与"WPS AI PPT"之间的关系和差异,容易产生困惑。

  • 功能发现效率低:用户在使用灵犀对话时,无法直接调用听记或法速查的能力,需要主动切换小程序。

  • 品牌心智不统一:多个独立小程序稀释了"WPS 灵犀"作为统一 AI 品牌的认知。

2.2 建议:以灵犀 APP 为统一入口,小程序功能模块化内聚

将上述小程序的核心能力整合为灵犀移动端 APP 内的功能模块:

  • 灵犀对话作为主界面,承载通用 AI 对话与文档创作能力;

  • AI 演示模块承载 PPT 生成与编辑能力;

  • 语音转写模块承载听记的录音转文字、音视频转写能力;

  • 简历助手模块承载简历撰写与优化能力;

  • 法律助手模块承载法速查的法律咨询与文书生成能力。

整合后的灵犀 APP 成为用户在移动端使用 WPS AI 能力的统一入口,原有小程序可逐步过渡为引流渠道,最终引导用户下载 APP 获取完整体验。


三、以 WPS 生态独特优势切入移动端 AI 竞争

3.1 竞品现状:通用 AI 助手试图覆盖办公场景

当前移动端 AI 市场中,豆包与通义千问是用户量最大的两款通用 AI 助手,其底部横滑菜单栏已集成大量泛办公类功能:

豆包菜单功能:AI 创作、拍题答疑、AI 生图、AI 生视频、打电话、AI 博客、帮我写作、视频通话、PPT 生成、深入研究、豆包 P 图、录音纪要、翻译、同声传译、作业批改、豆包爱学、音乐生成、照片动起来、爱点音乐、做个小应用

通义千问菜单功能:任务助理、AI 生图、拍题答疑、AI 生视频、作业批改、AI 写作、PPT 创作、实时记录、翻译、打电话、深度研究、文档阅读、AI 修图

上述竞品试图以"大而全"的功能矩阵覆盖所有场景,但存在一个根本性短板:缺乏与办公文档的深度集成能力。它们的"PPT 生成""录音纪要""文档阅读"等功能均运行在独立的沙箱环境中,无法直接操作用户的真实文档、表格和演示文稿。

3.2 WPS 灵犀的差异化壁垒:原生文档操控能力

WPS 灵犀的核心竞争优势在于其与 WPS Office 套件的原生深度集成,这是任何通用 AI 助手都无法复制的壁垒。灵犀移动端应围绕这一优势构建差异化功能矩阵:

差异化方向

具体能力

竞品无法实现的原因

文档原生操控

直接在用户的真实 .docx / .xlsx / .pptx / .pdf 文件上执行 AI 操作(润色段落、分析数据、生成图表、提取信息),结果直接写回文件

竞品只能生成新文件,无法操作用户本地或云端已有文档

云文档无缝衔接

AI 生成的内容自动保存至 WPS 云文档(365.kdocs.cn),用户在手机、平板、电脑间无缝切换继续编辑

竞品的内容产出与用户办公文档体系割裂

办公场景纵深

基于金山办公 30 余年文档处理经验积累的排版、格式、模板能力,AI 输出的文档质量(排版、格式、模板匹配)远超通用模型

竞品输出为纯文本或简单 Markdown,缺乏专业排版能力

垂直领域深耕

法律、财务、教育等垂直场景的 AI 能力(法速查、财务分析、简历优化),基于金山办公在政企市场的深厚积累

竞品仅有通用的泛领域回答能力

灵犀移动端无需在泛娱乐功能(生图、生视频、音乐生成等)上与竞品正面竞争,而应聚焦"AI 驱动的文档生产力"这一核心赛道,以"办公场景完成度"而非"功能数量"取胜。


四、在移动端引入龙虾(Claw)机制,构建开放生态

4.1 龙虾机制的核心价值

WPS 灵犀 Claw(龙虾)在桌面端已展现出显著的产品价值,其核心机制包括:

  • Skill(技能):通过 SKILL.md 文件定义的标准化能力描述,使灵犀能够理解并执行特定领域的复杂任务(如股票分析、合同审查、知识库管理等)。社区用户可自主开发并分享 Skill,形成能力生态。

  • Channel(渠道):灵犀 Claw 支持连接微信等第三方平台作为指令输入渠道(如微信 Clawbot),实现跨平台的任务下达。

  • MCP(Model Context Protocol):灵犀 Claw 可通过 mcporter 等工具间接调用外部 MCP 服务,扩展灵犀可触达的工具与服务边界。

这套机制将灵犀从"封闭的 AI 助手"升级为"可扩展的 AI Agent 平台",是 WPS 灵犀区别于竞品的最重要技术特征。

4.2 移动端龙虾能力的适配方案

考虑到移动端的运行环境与桌面端存在本质差异,建议采用以下适配策略:

桌面端龙虾能力

移动端适配方案

说明

Skill 技能系统

完整迁移

SKILL.md 为纯文本描述文件,不依赖特定运行时环境,可直接复用现有 Skill 生态。移动端灵犀加载 Skill 后即可理解并执行对应任务。

Channel 渠道系统

部分迁移

微信 Clawbot 等消息型渠道天然适合移动端,甚至可进一步扩展至系统通知、快捷指令等移动端原生能力。

MCP 工具调用

云端代理执行

MCP 服务调用涉及网络通信与数据处理,可在服务端完成,移动端仅负责发送指令与接收结果。

4.3 移动端技术架构建议

移动端与桌面端最大的技术差异在于本地代码执行能力受限,建议采用以下架构:

移动端直接承载的能力(HTML / JavaScript 环境):

  • Skill 技能的加载、解析与任务调度

  • 自然语言交互界面(对话、语音输入)

  • 结果展示与文档预览

  • 文件上传/下载与云文档同步

  • 频道管理(微信连接、系统通知推送等)

需依赖云端执行的能力(Python / Node.js 服务端):

  • MCP 工具的实际调用与数据处理

  • 复杂数据分析与计算任务

  • 文档格式转换与渲染

  • Skill 中涉及 Python / Node.js 脚本执行的部分

这一架构的核心思路是:移动端作为交互层与调度层,云端作为执行层。用户在手机上通过自然语言下达任务,灵犀移动端解析任务意图并调度对应的 Skill,需要代码执行的部分通过安全通道发送至云端完成,结果回传后在移动端呈现。


浏览 120
收藏
5
分享
5 +1
+1
全部评论