腾讯Marvis操作系统级AI助手深度解析

快乐小子新
快乐小子新 Lv.2 潜力创作者

Lv.2潜力创作者

一、引言

2026年5月20日,腾讯正式发布操作系统层级AI助手Marvis(马维斯),面向Windows、Mac、Android三端全量开放,无需邀请码即可使用。区别于传统的AI对话工具或单一应用层Agent,Marvis的核心定位在于"操作系统层级"——它将终端系统、文件、应用、算力和跨端连接纳入统一的AI中间层,用户仅需用自然语言描述目标,Marvis即可理解任务、拆解步骤并调度对应Agent执行。本文将从架构设计、独特能力与安全机制三个维度深度解析Marvis,并针对WPS灵犀Claw用户群体,提供将已有技能(Skill)迁移至Marvis平台的完整实践方案。

二、Marvis核心架构与独特能力

2.1 操作系统层级深度集成

Marvis区别于市面上绝大多数AI助手的根本特征在于其系统级触达能力。它并非运行在应用层的对话程序,而是能够穿透操作系统抽象层,直接访问Windows系统设置、硬件信息、进程管理与文件系统。用户可通过自然语言完成以下操作:查询CPU型号、内存占用、电池健康度与网络状态;检测当前硬件配置能否流畅运行指定游戏(如《黑神话:悟空》);一键调整鼠标灵敏度、关闭开机自启动项、清理系统冗余文件。这一能力的底层支撑来自腾讯应用宝团队多年积累的系统适配技术,以及Marvis与英特尔在芯片层、与微软在WinML框架上的协同优化。

2.2 六Agent原生协作体系

Marvis出厂预置了由六个Agent组成的协作体系,形成完整的任务规划与执行闭环:

主Agent(Main Agent)作为统筹中枢,负责理解用户意图、拆解复杂任务、调度专项Agent并行执行。五个专项Agent各司其职:File Agent处理本地文件的搜索、阅读、编辑、格式转换(支持PDF转Word、图片转PNG、Excel转CSV等),并能基于文档和图片内容进行语义级问答;Computer Agent负责Windows系统运维,包括系统设置调整、设备管理器操作、注册表编辑、窗口分屏排布、虚拟桌面切换、进程管理与计划任务;App Agent管理电脑端应用与Android模拟器内应用的安装、启动、卸载与界面交互,支持直接运行APK与微信小程序;Browser Agent执行需要登录认证或多步交互的网页操作;Search Agent提供多轮联网检索与深度信息聚合。这一架构的设计理念是"专业的事交给专业的Agent做",用户无需学习任何配置流程,复合指令如"找出最近一个季度的发票,按时间顺序整理成表格"可由主Agent自动拆解为文件检索、内容识别、数据提取与表格生成四个子任务并行调度。

2.3 双模式算力架构与隐私保护

Marvis提供"效率模式"与"隐私模式"两种工作方式,实现灵活的端云算力调度。效率模式采用端云协同策略:复杂任务的理解与规划借助云端大模型(混元与DeepSeek-V4),文件处理、执行动作和本地索引则在端侧完成,兼顾响应速度与推理质量。隐私模式则完全基于阿里Qwen端侧大模型运行,所有数据解析、图片识别与对话均在本地完成,数据完全不上云,断网状态下亦可正常使用。这一设计对财务、法务、人力资源等处理敏感数据的岗位具有实际价值。此外,Marvis明确承诺用户数据仅用于当下推理计算、绝不用于模型训练,并允许用户自定义索引范围,对不希望被索引的内容可随时屏蔽。上线初期,每位用户每天享有1000万免费Token用量。

2.4 跨端可视化操控

Marvis支持Windows、Mac、Android、iOS(预计2026年6月中旬推出)四端同账号互通。其跨端能力区别于多数产品停留在"远程命令下发"层面的做法:用户可在手机上实时查看电脑屏幕画面并进行桌面级可视化操控,PC锁屏状态下手机仍可远程输入密码解锁操作。得益于应用宝的跨端引擎技术积累,Marvis不仅能操作电脑上的EXE软件,还能直接在Windows环境下运行Android应用(如微博、小红书等),且不抢占键盘鼠标,支持多任务并行。这一能力将PC的生产力属性与移动应用的丰富生态有效衔接。

2.5 AI图库与AI文档库

Marvis内置多本地模型实现文件与图片的深度语义理解。其文件检索能力不限于文件名匹配,而是能够解析文档正文内容、识别图片中的文字(OCR),并按照人像、内容主题、拍摄地点、节日场景等维度进行智能分类,构建AI图库与AI文档库。这一功能解决了用户"不记得文件名就找不到文件"的长期痛点,将分散在本地磁盘各处的文件转化为可按语义检索的个人知识库。

2.6 L2级安全兜底机制

Marvis建立了分级安全管控体系:对删除文件、修改系统核心配置等敏感操作,AI必须先给出完整执行计划并强制触发"硬垂询",等待用户明确点击确认后方可执行;对支付、密码输入等更高敏感级别的动作,Marvis拒绝代为执行,必须由用户本人完成。这一机制在赋予AI系统级操控能力的同时,确保了用户对关键决策的最终控制权。

三、WPS灵犀Claw技能向Marvis迁移实践

3.1 两平台技能体系对比

WPS灵犀Claw与Marvis均采用技能(Skill)机制实现AI能力的模块化扩展,但底层实现方式存在差异。以下从五个维度进行对比:

对比维度

WPS灵犀Claw

Marvis

技能定义文件

SKILL.md(含Frontmatter元数据 + Markdown操作指令)

SKILL.md(含操作指令与工具声明)

脚本支持

Python、Node.js

Python、Shell(PowerShell/Bash)

安装方式

聊天指令安装、自定义生成、ZIP包上传

技能目录放置、use_skill工具加载

存储路径

%AppData%\WPS灵犀\serverdir\skills\

Marvis技能目录(用户可配置)

管理方式

图形界面开关管理 + 自然语言管理

自然语言管理

依赖声明

Frontmatter中install字段声明

运行时动态安装(Agent自动处理)

两者的核心共同点是均以SKILL.md为技能描述载体,均采用Markdown格式编写操作指令,这意味着技能的核心逻辑描述部分具有较高的可移植性。

3.2 迁移步骤详解

步骤一:分析源技能结构。 进入WPS灵犀Claw技能目录(C:\Users\<用户名>\AppData\Roaming\WPS灵犀\serverdir\skills\),找到目标技能文件夹。每个技能包含三个核心部分:SKILL.md(技能定义与操作指令)、scripts/(辅助脚本)、assets/(模板与资源文件)。首先阅读SKILL.md的Frontmatter区域,了解技能名称、版本、环境变量依赖与系统命令依赖;然后阅读正文区域,理解技能的核心操作逻辑。

步骤二:适配SKILL.md。 将WPS灵犀Claw的SKILL.md迁移到Marvis时,需进行以下调整:移除WPS灵犀Claw特有的Frontmatter元数据,保留核心操作指令文本;若源技能依赖WPS灵犀Claw特有的内置工具或MCP服务调用,需替换为Marvis等效能力(如网络请求改用web_fetch工具);调整文件路径引用,将WPS灵犀Claw的路径约定改为Marvis的工作空间路径规范。

步骤三:脚本适配。 WPS灵犀Claw技能中的Node.js脚本需视情况处理:若脚本实现的是通用逻辑(如数据处理、格式转换),可在Marvis中用Python重写;若脚本依赖Node.js专属生态且重写成本过高,可通过Marvis的shell_executor调用Node.js运行时执行原脚本。Python脚本一般可直接复用,仅需调整文件路径和依赖声明。

步骤四:依赖处理。 WPS灵犀Claw通过SKILL.md的Frontmatter中install字段声明依赖,安装时自动执行。Marvis采取运行时动态安装策略:当技能执行中遇到ModuleNotFoundErrorcommand not found错误时,Agent会自动调用shell_executor执行pip installnpm install安装缺失依赖,无需用户手动介入。

步骤五:测试验证。 将适配完成的技能文件夹放入Marvis技能目录,通过自然语言向Marvis下达与技能相关的任务指令,验证Agent能否正确加载技能、理解操作指令并成功执行。建议从简单任务开始逐步验证,确认每个子步骤的输出符合预期。

3.3 以金山文档技能为例

在马维斯安装金山文档(kdocs)技能之后,可通过AI创建智能文档、表格、演示文稿,编辑在线内容,搜索云文档,以及执行网页剪藏、接龙转表格、信息收集表单生成等高级工作流。对于在WPS灵犀Claw上已深度使用kdocs技能的用户,切换到Marvis后可直接获得同等甚至更丰富的文档操作能力——因为Marvis的kdocs技能同时支持shell_executorpython_executor作为执行后端,处理复杂文档任务时具有更高的灵活性。

对于WPS灵犀Claw社区中用户自行开发或从ClawHub等技能市场获取的第三方技能,可参照上述五步迁移流程进行适配。轻量级技能(仅含SKILL.md文档,无脚本依赖)迁移最为简便,通常仅需调整路径引用即可直接使用。含Python脚本的技能迁移成本中等,主要工作在于路径适配和依赖声明。含Node.js脚本且重度依赖npm生态的技能迁移成本相对较高,需评估重写与复用的投入产出比。

四、总结

Marvis作为操作系统层级AI助手,以系统级触达、六Agent协作、隐私模式、跨端操控、AI知识库和L2安全机制六大核心能力,重新定义了桌面AI助手的边界。对于WPS灵犀Claw用户群体而言,Marvis不仅提供了差异化的系统操控与跨端能力,更通过兼容的技能体系降低了迁移门槛。两个平台在技能机制上的共性(均以SKILL.md为描述载体、均支持Python脚本执行)使得大部分技能可在适配后复用,而Marvis独有的Agent协作架构和运行时依赖自动处理机制则为技能执行提供了更强的鲁棒性。建议用户从轻量级技能开始尝试迁移,逐步积累经验后扩展到复杂技能,充分释放Marvis操作系统层级的AI潜能。

广东省
浏览 1467
2
4
分享
4 +1
1
2 +1
全部评论 1
 
马成功老师
马成功老师 WPS资深用户Lv.2 潜力创作者KVPWPS函数专家

Lv.2潜力创作者

感谢科普,受益匪浅
· 北京
1
回复