【科普】WPS灵犀Claw的内置工具(一)

内置工具:

工具名称

用途

start_write_file

开启写作模式,准备向文件写入内容。调用后输出内容将直接写入磁盘文件

end_write_file

结束写作模式,将输出内容保存到文件

generate_image

通过文生图或图生图方式使用 AI 模型生成图像

view_image

通过视觉模型分析图片文件,返回文字描述或问题回答

pip_install

在当前 Python 环境中使用 pip 安装缺失的 Python 包

jupyter_cell_exec

在持久化 Jupyter 内核中执行 Python 代码,支持数据分析、文件处理、自动化等

search

在多种来源中搜索信息(财经、法律、医疗、互联网、税务、新闻等)

init_slides

根据 design.xml、outline.xml 和 images.xml 生成 PPTX 构建脚本

timer_task

创建定时任务,支持 cron 周期性任务和一次性定时任务

speech_to_text

将音频文件(mp3/wav/pcm)转录为文字

get_memory

读取云端记忆内容(指定 kind 槽位)

edit_memory

对记忆内容做定向 find/replace 编辑,适用于小修改

write_memory

全量写入指定 kind 的记忆内容,适用于初始化或大幅改写

  • jupyter_cell_exec 工具

基本信息

属性

说明

运行环境

持久化 Jupyter 内核

执行方式

每次调用相当于执行一个 Jupyter Code Cell

语言

Python

核心特性

1. 持久化内核(Persistence)

这是该工具最关键的特性。多次调用之间共享完整的运行时状态:

  • import 的模块,后续调用可直接使用,无需重复导入

  • 已定义的变量和函数,后续调用可直接引用

  • 已加载的数据(如 DataFrame),后续调用可直接操作

这意味着整个任务生命周期内,内核状态是累积的,类似于在一个持续的 Jupyter Notebook 中逐个 Cell 执行代码。

2. 通用可编程接口

作为功能完备的编程接口,能够处理:

任务类型

示例

数据分析

读取 CSV、聚合统计、透视表

文件处理

批量重命名、格式转换、内容提取

可视化

matplotlib/seaborn 生成图表

系统自动化

操作系统命令、文件系统管理

网络请求

API 调用、网页爬取

Office 文档处理

生成 Word/Excel/PPT

机器学习

模型训练、预测、评估

参数说明

参数名

类型

是否必填

说明

brief

string

简要描述本次执行的目的(用于操作日志)

code

string

要执行的 Python 代码

重要约束规则

代码编写规则:

  • 禁止重复 import — 已导入的模块后续 Cell 直接使用

  • 禁止重复定义 — 已创建的变量和函数后续 Cell 直接引用

  • 禁止重复读取 — 已加载的数据后续 Cell 直接操作

文件与系统规则:

  • 通过 workspace_dir 环境变量获取工作目录

  • 使用 print() 输出结果

  • 生成图片时需打印保存路径

  • 使用 try/except 处理潜在错误

  • 大型数据集先用 .head() 预览

  • 删除文件必须使用 send2trash 移入回收站,严禁 os.remove 等永久删除方式

包管理规则:

  • 环境已预装常用第三方包(requests、pandas、numpy、matplotlib 等),默认直接导入

  • 仅在运行时遇到 ModuleNotFoundError 时,通过 pip_install 安装缺失包

  • 安装完成后无需重启解释器即可直接 import

典型工作流示例

Cell 1: import pandas as pd; df = pd.read_csv("data.csv")
Cell 2: print(df.head()); print(df.describe())
Cell 3: import matplotlib.pyplot as plt; df.plot(); plt.savefig("chart.png")
Cell 4: result = df.groupby("category").sum(); print(result)

每个 Cell 的执行依赖前一个 Cell 的状态,形成渐进式数据处理流水线。

与其他内置工具的协作

协作工具

协作方式

pip_install

先安装缺失包,再通过 jupyter_cell_exec 导入使用

start_write_file / end_write_file

jupyter_cell_exec 生成内容后,通过写作工具写入文件

search

搜索获取信息后,在内核中处理分析

view_image / generate_image

图像生成/分析后,在内核中进一步处理

jupyter_cell_exec 是整个系统的核心执行引擎,几乎所有涉及数据处理、文件操作、代码逻辑的任务最终都通过它来完成,配合持久化内核实现了跨调用的状态累积。

  • search 工具

基本信息

属性

说明

功能

在多种来源中搜索信息

数据来源

搜索引擎爬虫缓存的网络资源

特点

执行速度快,单次可获取多个来源的摘要信息

参数说明

参数名

类型

是否必填

说明

queries

array

最多 3 个搜索查询字符串,必须是同一意图的变体(查询扩展),不能是不同目标

type

string

搜索类别,决定结果来源和格式,共 7 种可选值

time

string

时间过滤器,限制结果范围。默认为 all(不限)

brief

string

一句话描述此次搜索目的(用于操作日志)

7 种搜索类别

type 值

说明

数据来源

finance

财经资讯、股票行情、投资理财

权威金融机构

law

法律法规、司法解释、案例判决

官方法律数据库

medical

疾病诊疗、药品信息、健康科普

专业医学平台

internet

科技资讯、产品技术、数码评测

科技媒体

tax

税收政策、纳税指南、税务法规

税务部门

news_province

省级地方新闻、区域时事、地方政策

可信省级媒体

news_center

国家级重大新闻、中央政策、权威信息发布

可信国家级中央媒体

时间过滤器

time 值

含义

all

不限制时间(默认)

past_day

过去一天

past_week

过去一周

past_month

过去一个月

past_year

过去一年

queries 使用规范

queries 是一个数组,最多包含 3 个查询字符串。核心规则:3 个查询必须是同一意图的不同表达(查询扩展),而非不同搜索目标

正确示例:

queries: ["人工智能发展趋势", "AI行业未来走向", "人工智能技术前景"]

三个查询表达的是同一个意图,用不同措辞覆盖更多结果。

错误示例:

queries: ["人工智能发展趋势", "房价走势", "今天天气"]

三个查询指向完全不同的目标,违反了查询扩展原则。

注意事项

  1. 不支持高级搜索语法 — 不要在查询中使用引号、过滤器、运算符等

  1. 摘要不完整 — 搜索引擎对页面内容有裁剪,部分细节可能缺失,不要仅依赖摘要

  1. 存在时效性 — 内容可能已过期,需要关注信息的时效性

  1. 必须跟进源 URL — 不要仅依赖搜索结果摘要,必要时应通过浏览器技能访问原始页面获取完整信息

典型使用场景

场景

type 选择

示例

了解一个技术概念

internet

"深度学习是什么原理"

查询公司财报

finance

"比亚迪2025年营收"

查找法律条文

law

"劳动合同法解除赔偿标准"

查询药品信息

medical

"布洛芬用法用量禁忌"

了解税收政策

tax

"个人所得税专项附加扣除2025"

跟踪地方政策

news_province

"广东省新能源汽车补贴政策"

了解国家大事

news_center

"两会政府工作报告要点"

search 是系统的信息检索基础工具,通过多类别、多查询扩展的方式快速获取网络信息概览,时效性要求高的场景需配合 browser SKILL 实时验证。

timer_task 工具详解

基本信息

属性

说明

功能

创建定时任务,在指定时间自动执行 AI Agent 任务

核心价值

将 AI 从"被动响应"转变为"主动定时执行",实现自动化工作流

参数说明

参数名

类型

是否必填

说明

brief

string

任务名称,用于标识和展示,如"每日天气提醒"、"周报生成"

prompt

string

Agent 执行的完整任务描述,必须是自包含的(Agent 执行时没有对话上下文)

cron

string

once_time 二选一

cron 表达式,用于周期性任务

once_time

string

cron 二选一

一次性任务的执行时间

两种任务模式

模式一:周期性任务(cron)

使用 6 字段 cron 表达式秒 分 时 日 月 周

字段

范围

说明

0-59

第几秒

0-59

第几分

0-23

第几小时(24小时制)

1-31

月份中的第几天

1-12

第几月

0-6

星期几(0=周日,1=周一,...,6=周六)

特殊字符:

字符

含义

示例

*

任意值

* * * * * * = 每秒

,

列举

1,3,5 = 第1、3、5

-

范围

1-5 = 第1到5

/

步进

*/5 = 每5单位

常用周期示例:

需求

cron 表达式

每天早上 9 点

0 0 9 * * *

工作日早上 9 点

0 0 9 * * 1-5

每小时整点

0 0 * * * *

每 2 小时

0 0 */2 * * *

每月 1 号 9 点

0 0 9 1 * *

周一三五下午 2 点

0 0 14 * * 1,3,5

周日上午 10 点

0 0 10 * * 0

模式二:一次性任务(once_time)

指定一个精确时间点执行一次。

格式

示例

YYYY/MM/DD HH:MM:SS

2026/3/31 18:26:03

YYYY-MM-DD HH:MM

2026-03-31 18:26

prompt 编写规范

这是最关键的参数。由于 Agent 在任务触发时没有对话上下文,prompt 必须是完整、自包含的任务描述。

核心原则:

  • 包含所有必要信息(数据源、输出格式、文件路径、具体要求等)

  • 不依赖任何"上文"或"之前说的"

  • 明确描述期望的输出结果

好的 prompt 示例:

请访问东方财富网获取今日上证指数、深证成指、创业板指的收盘数据,
整理为表格后保存到 D:\WPS灵犀\20260411-21-20-46\output\market_summary.xlsx

差的 prompt 示例:

帮我把之前那个数据更新一下
缺少数据来源、输出路径、"之前那个"指代不明,Agent 无法独立执行。

重要约束

约束

说明

最小执行间隔

1 小时,不支持分钟级定时任务

cron 格式

仅支持 6 字段,不支持 5 字段或 7 字段

创建后不可修改

只能创建,如需修改或删除需通过客户端界面操作

cron 与 once_time 二选一

不能同时指定

典型应用场景

场景

模式

示例

每日晨报

cron 周期

每天早上 8 点自动搜集行业新闻生成日报

每周复盘

cron 周期

每周五下午 6 点生成本周项目进度报告

定时数据采集

cron 周期

每天收盘后自动采集股价数据更新 Excel

一次性提醒

once_time

在某个会议开始前 30 分钟生成提醒

定期清理

cron 周期

每月 1 号整理上月临时文件

timer_task 是系统的自动化调度工具,通过 cron 表达式或一次性时间点实现任务的定时触发,将 Agent 从被动响应升级为主动执行,核心要点是 prompt 必须完整自包含。

  • get_memory、edit_memory、write_memory

详见https://bbs.wps.cn/topic/85448

北京
浏览 140
收藏
5
分享
5 +1
+1
全部评论