强烈建议开发 WPS 灵犀移动端 APP
WPS 灵犀当前仅推出了Windows 与 macOS桌面端(lingxi.wps.cn/claw/)及微信小程序,除此之外其功能内嵌在各系统的WPS客户端内部,但尚未推出移动端APP。
根据 QuestMobile 发布的《2025 年中国移动互联网年度大报告》,截至 2025 年 12 月,国内移动端 AI 应用月活跃用户规模已达 7.22 亿,占全网移动端活跃用户的 56.6%。移动端已成为 AI 应用的主战场,豆包以 2.27 亿月活稳居国内 AI 原生 App 榜首,近期还打算推出付费会员体系。在这一市场格局下,WPS 灵犀移动端的缺席意味着金山办公正在主动让渡移动端 AI 流量的入口位置。
我建议WPS官方推出灵犀移动端APP,在 AI 时代抢占移动端入口,在通用 AI 助手的包围中开辟出一条属于"AI 办公原生"的独特赛道。相比WPS超级会员,WPS大会员每年需要为AI功能支付超过100元人民币的差额支出。在WPS桌面端以外,如果有一个WPS AI专属的移动APP,能让大会员感受到物有所值,增强获得感进而增加付费意愿。
一、整合 WPS 移动客户端中的 AI 功能,实现产品聚焦与职责分离
1.1 现状:移动端 AI 功能散落嵌入 Office 客户端
当前 WPS Office 移动客户端(iOS / Android)已内置部分 AI 能力,除AI 伴写、AI 文档问答、AI 数据分析外,还包括WPS 灵犀、WPS AI PPT、WPS AI 简历、WPS AI 法速查、WPS 听记、WPS AI设计室、WPS笔记等。这些功能以"嵌入组件"的形式分散在WPS移动客户端中,不仅导致WPS客户端越来越臃肿,而且还导致了存在两个严重的问题:
功能不够聚焦:移动端 WPS Office 的核心功能是文档查看和编辑,各类AI 功能的嵌入使其产品定位逐渐模糊。对于只需要查看或简单编辑文档的用户而言,AI 功能的存在增加了应用的复杂度和资源消耗。引入过多新功能,不仅导致原有核心功能的体验被削弱,还会导致新功能的作用不够突显,无法吸引到用户足够的关注,无法得到用户的充分重视,在守旧和创新两个方向都不讨好。
客户端功能更新慢:AI 功能与 Office 基础编辑功能耦合在同一应用内,意味着 WPS的更新节奏与AI 能力的更新节奏强绑定,WPS的文档查看编辑核心功能与AI功能均无法独立快速演进,互相拖累,难以跟上AI应用快速更新的节奏。
1.2 建议:灵犀移动端作为独立 AI 入口,与 Office 客户端形成互补
将 AI 功能从 WPS Office 移动客户端中剥离,收敛至独立的"灵犀"APP 中,形成如下职责划分:
维度 | WPS Office 移动客户端 | WPS 灵犀移动端 APP |
核心定位 | 文档查看、轻量编辑、文件管理 | AI 对话、智能创作、任务自动化 |
AI 功能 | 仅保留与当前文档上下文直接相关的轻量 AI 操作(如选中段落后的快捷润色、翻译) | 承载所有独立的 AI 能力(AI 伴写、AI PPT、语音转写、智能分析等) |
用户场景 | "打开文件、编辑文件、保存文件" | "下达指令、获取结果、交付内容" |
迭代节奏 | 跟随 Office 基础能力发版周期 | 独立迭代,快速响应 AI 能力升级 |
通过这一分离,WPS Office 移动端回归"轻量文档工具"的本质,降低应用臃肿度;灵犀移动端则专注于 AI 交互体验的打磨,两者通过 WPS 云文档(365.kdocs.cn)实现数据互通,用户在灵犀中生成的内容可直接同步至 WPS Office 中查看和编辑。
二、整合现有 AI 小程序,收敛入口,构建一站式体验
2.1 现状:AI 能力分散于多个独立小程序
目前金山办公围绕 AI 办公场景已推出多款微信小程序,各小程序功能独立、入口分散:
小程序 | 核心功能 |
WPS 灵犀 | AI 对话、文档创作、PPT 生成等通用 AI 办公能力 |
WPS AI PPT | 通过自然语言或文档一键生成演示文稿 |
WPS 听记 | 实时录音转文字、音视频文件导入转写、智能区分说话人、实时同传字幕 |
WPS AI 简历 | 简历撰写、优化、智能分析、证件照制作 |
WPS AI 法速查 | 法律咨询、控辩研讨、文书生成,联合聚法案例提供法律解答 |
用户需要分别进入不同小程序才能使用对应功能,缺乏统一的入口和一致的交互体验。这种分散状态带来的问题包括:
用户认知成本高:普通用户难以理解"WPS 灵犀"与"WPS AI PPT"之间的关系和差异,容易产生困惑。
功能发现效率低:用户在使用灵犀对话时,无法直接调用听记或法速查的能力,需要主动切换小程序。
品牌心智不统一:多个独立小程序稀释了"WPS 灵犀"作为统一 AI 品牌的认知。
2.2 建议:以灵犀 APP 为统一入口,小程序功能模块化内聚
将上述小程序的核心能力整合为灵犀移动端 APP 内的功能模块:
灵犀对话作为主界面,承载通用 AI 对话与文档创作能力;
AI 演示模块承载 PPT 生成与编辑能力;
语音转写模块承载听记的录音转文字、音视频转写能力;
简历助手模块承载简历撰写与优化能力;
法律助手模块承载法速查的法律咨询与文书生成能力。
整合后的灵犀 APP 成为用户在移动端使用 WPS AI 能力的统一入口,原有小程序可逐步过渡为引流渠道,最终引导用户下载 APP 获取完整体验。
三、以 WPS 生态独特优势切入移动端 AI 竞争
3.1 竞品现状:通用 AI 助手试图覆盖办公场景
当前移动端 AI 市场中,豆包与通义千问是用户量最大的两款通用 AI 助手,其底部横滑菜单栏已集成大量泛办公类功能:
豆包菜单功能:AI 创作、拍题答疑、AI 生图、AI 生视频、打电话、AI 博客、帮我写作、视频通话、PPT 生成、深入研究、豆包 P 图、录音纪要、翻译、同声传译、作业批改、豆包爱学、音乐生成、照片动起来、爱点音乐、做个小应用
通义千问菜单功能:任务助理、AI 生图、拍题答疑、AI 生视频、作业批改、AI 写作、PPT 创作、实时记录、翻译、打电话、深度研究、文档阅读、AI 修图
上述竞品试图以"大而全"的功能矩阵覆盖所有场景,但存在一个根本性短板:缺乏与办公文档的深度集成能力。它们的"PPT 生成""录音纪要""文档阅读"等功能均运行在独立的沙箱环境中,无法直接操作用户的真实文档、表格和演示文稿。
3.2 WPS 灵犀的差异化壁垒:原生文档操控能力
WPS 灵犀的核心竞争优势在于其与 WPS Office 套件的原生深度集成,这是任何通用 AI 助手都无法复制的壁垒。灵犀移动端应围绕这一优势构建差异化功能矩阵:
差异化方向 | 具体能力 | 竞品无法实现的原因 |
文档原生操控 | 直接在用户的真实 .docx / .xlsx / .pptx / .pdf 文件上执行 AI 操作(润色段落、分析数据、生成图表、提取信息),结果直接写回文件 | 竞品只能生成新文件,无法操作用户本地或云端已有文档 |
云文档无缝衔接 | AI 生成的内容自动保存至 WPS 云文档(365.kdocs.cn),用户在手机、平板、电脑间无缝切换继续编辑 | 竞品的内容产出与用户办公文档体系割裂 |
办公场景纵深 | 基于金山办公 30 余年文档处理经验积累的排版、格式、模板能力,AI 输出的文档质量(排版、格式、模板匹配)远超通用模型 | 竞品输出为纯文本或简单 Markdown,缺乏专业排版能力 |
垂直领域深耕 | 法律、财务、教育等垂直场景的 AI 能力(法速查、财务分析、简历优化),基于金山办公在政企市场的深厚积累 | 竞品仅有通用的泛领域回答能力 |
灵犀移动端无需在泛娱乐功能(生图、生视频、音乐生成等)上与竞品正面竞争,而应聚焦"AI 驱动的文档生产力"这一核心赛道,以"办公场景完成度"而非"功能数量"取胜。
四、在移动端引入龙虾(Claw)机制,构建开放生态
4.1 龙虾机制的核心价值
WPS 灵犀 Claw(龙虾)在桌面端已展现出显著的产品价值,其核心机制包括:
Skill(技能):通过 SKILL.md 文件定义的标准化能力描述,使灵犀能够理解并执行特定领域的复杂任务(如股票分析、合同审查、知识库管理等)。社区用户可自主开发并分享 Skill,形成能力生态。
Channel(渠道):灵犀 Claw 支持连接微信等第三方平台作为指令输入渠道(如微信 Clawbot),实现跨平台的任务下达。
MCP(Model Context Protocol):灵犀 Claw 可通过 mcporter 等工具间接调用外部 MCP 服务,扩展灵犀可触达的工具与服务边界。
这套机制将灵犀从"封闭的 AI 助手"升级为"可扩展的 AI Agent 平台",是 WPS 灵犀区别于竞品的最重要技术特征。
4.2 移动端龙虾能力的适配方案
考虑到移动端的运行环境与桌面端存在本质差异,建议采用以下适配策略:
桌面端龙虾能力 | 移动端适配方案 | 说明 |
Skill 技能系统 | 完整迁移 | SKILL.md 为纯文本描述文件,不依赖特定运行时环境,可直接复用现有 Skill 生态。移动端灵犀加载 Skill 后即可理解并执行对应任务。 |
Channel 渠道系统 | 部分迁移 | 微信 Clawbot 等消息型渠道天然适合移动端,甚至可进一步扩展至系统通知、快捷指令等移动端原生能力。 |
MCP 工具调用 | 云端代理执行 | MCP 服务调用涉及网络通信与数据处理,可在服务端完成,移动端仅负责发送指令与接收结果。 |
4.3 移动端技术架构建议
移动端与桌面端最大的技术差异在于本地代码执行能力受限,建议采用以下架构:
移动端直接承载的能力(HTML / JavaScript 环境):
Skill 技能的加载、解析与任务调度
自然语言交互界面(对话、语音输入)
结果展示与文档预览
文件上传/下载与云文档同步
频道管理(微信连接、系统通知推送等)
需依赖云端执行的能力(Python / Node.js 服务端):
MCP 工具的实际调用与数据处理
复杂数据分析与计算任务
文档格式转换与渲染
Skill 中涉及 Python / Node.js 脚本执行的部分
这一架构的核心思路是:移动端作为交互层与调度层,云端作为执行层。用户在手机上通过自然语言下达任务,灵犀移动端解析任务意图并调度对应的 Skill,需要代码执行的部分通过安全通道发送至云端完成,结果回传后在移动端呈现。