【科普】WPS灵犀Claw的内置工具(一)
内置工具:
工具名称 | 用途 |
start_write_file | 开启写作模式,准备向文件写入内容。调用后输出内容将直接写入磁盘文件 |
end_write_file | 结束写作模式,将输出内容保存到文件 |
generate_image | 通过文生图或图生图方式使用 AI 模型生成图像 |
view_image | 通过视觉模型分析图片文件,返回文字描述或问题回答 |
pip_install | 在当前 Python 环境中使用 pip 安装缺失的 Python 包 |
jupyter_cell_exec | 在持久化 Jupyter 内核中执行 Python 代码,支持数据分析、文件处理、自动化等 |
search | 在多种来源中搜索信息(财经、法律、医疗、互联网、税务、新闻等) |
init_slides | 根据 design.xml、outline.xml 和 images.xml 生成 PPTX 构建脚本 |
timer_task | 创建定时任务,支持 cron 周期性任务和一次性定时任务 |
speech_to_text | 将音频文件(mp3/wav/pcm)转录为文字 |
get_memory | 读取云端记忆内容(指定 kind 槽位) |
edit_memory | 对记忆内容做定向 find/replace 编辑,适用于小修改 |
write_memory | 全量写入指定 kind 的记忆内容,适用于初始化或大幅改写 |
- jupyter_cell_exec 工具
基本信息
属性 | 说明 |
运行环境 | 持久化 Jupyter 内核 |
执行方式 | 每次调用相当于执行一个 Jupyter Code Cell |
语言 | Python |
核心特性
1. 持久化内核(Persistence)
这是该工具最关键的特性。多次调用之间共享完整的运行时状态:
已 import 的模块,后续调用可直接使用,无需重复导入
已定义的变量和函数,后续调用可直接引用
已加载的数据(如 DataFrame),后续调用可直接操作
这意味着整个任务生命周期内,内核状态是累积的,类似于在一个持续的 Jupyter Notebook 中逐个 Cell 执行代码。
2. 通用可编程接口
作为功能完备的编程接口,能够处理:
任务类型 | 示例 |
数据分析 | 读取 CSV、聚合统计、透视表 |
文件处理 | 批量重命名、格式转换、内容提取 |
可视化 | matplotlib/seaborn 生成图表 |
系统自动化 | 操作系统命令、文件系统管理 |
网络请求 | API 调用、网页爬取 |
Office 文档处理 | 生成 Word/Excel/PPT |
机器学习 | 模型训练、预测、评估 |
参数说明
参数名 | 类型 | 是否必填 | 说明 |
brief | string | 是 | 简要描述本次执行的目的(用于操作日志) |
code | string | 是 | 要执行的 Python 代码 |
重要约束规则
代码编写规则:
禁止重复 import — 已导入的模块后续 Cell 直接使用
禁止重复定义 — 已创建的变量和函数后续 Cell 直接引用
禁止重复读取 — 已加载的数据后续 Cell 直接操作
文件与系统规则:
通过 workspace_dir 环境变量获取工作目录
使用 print() 输出结果
生成图片时需打印保存路径
使用 try/except 处理潜在错误
大型数据集先用 .head() 预览
删除文件必须使用 send2trash 移入回收站,严禁 os.remove 等永久删除方式
包管理规则:
环境已预装常用第三方包(requests、pandas、numpy、matplotlib 等),默认直接导入
仅在运行时遇到 ModuleNotFoundError 时,通过 pip_install 安装缺失包
安装完成后无需重启解释器即可直接 import
典型工作流示例
Cell 1: import pandas as pd; df = pd.read_csv("data.csv")
Cell 2: print(df.head()); print(df.describe())
Cell 3: import matplotlib.pyplot as plt; df.plot(); plt.savefig("chart.png")
Cell 4: result = df.groupby("category").sum(); print(result)每个 Cell 的执行依赖前一个 Cell 的状态,形成渐进式数据处理流水线。
与其他内置工具的协作
协作工具 | 协作方式 |
pip_install | 先安装缺失包,再通过 jupyter_cell_exec 导入使用 |
start_write_file / end_write_file | jupyter_cell_exec 生成内容后,通过写作工具写入文件 |
search | 搜索获取信息后,在内核中处理分析 |
view_image / generate_image | 图像生成/分析后,在内核中进一步处理 |
jupyter_cell_exec 是整个系统的核心执行引擎,几乎所有涉及数据处理、文件操作、代码逻辑的任务最终都通过它来完成,配合持久化内核实现了跨调用的状态累积。
- search 工具
基本信息
属性 | 说明 |
功能 | 在多种来源中搜索信息 |
数据来源 | 搜索引擎爬虫缓存的网络资源 |
特点 | 执行速度快,单次可获取多个来源的摘要信息 |
参数说明
参数名 | 类型 | 是否必填 | 说明 |
queries | array | 是 | 最多 3 个搜索查询字符串,必须是同一意图的变体(查询扩展),不能是不同目标 |
type | string | 是 | 搜索类别,决定结果来源和格式,共 7 种可选值 |
time | string | 否 | 时间过滤器,限制结果范围。默认为 all(不限) |
brief | string | 否 | 一句话描述此次搜索目的(用于操作日志) |
7 种搜索类别
type 值 | 说明 | 数据来源 |
finance | 财经资讯、股票行情、投资理财 | 权威金融机构 |
law | 法律法规、司法解释、案例判决 | 官方法律数据库 |
medical | 疾病诊疗、药品信息、健康科普 | 专业医学平台 |
internet | 科技资讯、产品技术、数码评测 | 科技媒体 |
tax | 税收政策、纳税指南、税务法规 | 税务部门 |
news_province | 省级地方新闻、区域时事、地方政策 | 可信省级媒体 |
news_center | 国家级重大新闻、中央政策、权威信息发布 | 可信国家级中央媒体 |
时间过滤器
time 值 | 含义 |
all | 不限制时间(默认) |
past_day | 过去一天 |
past_week | 过去一周 |
past_month | 过去一个月 |
past_year | 过去一年 |
queries 使用规范
queries 是一个数组,最多包含 3 个查询字符串。核心规则:3 个查询必须是同一意图的不同表达(查询扩展),而非不同搜索目标。
正确示例:
queries: ["人工智能发展趋势", "AI行业未来走向", "人工智能技术前景"]三个查询表达的是同一个意图,用不同措辞覆盖更多结果。
错误示例:
queries: ["人工智能发展趋势", "房价走势", "今天天气"]三个查询指向完全不同的目标,违反了查询扩展原则。
注意事项
不支持高级搜索语法 — 不要在查询中使用引号、过滤器、运算符等
摘要不完整 — 搜索引擎对页面内容有裁剪,部分细节可能缺失,不要仅依赖摘要
存在时效性 — 内容可能已过期,需要关注信息的时效性
必须跟进源 URL — 不要仅依赖搜索结果摘要,必要时应通过浏览器技能访问原始页面获取完整信息
典型使用场景
场景 | type 选择 | 示例 |
了解一个技术概念 | internet | "深度学习是什么原理" |
查询公司财报 | finance | "比亚迪2025年营收" |
查找法律条文 | law | "劳动合同法解除赔偿标准" |
查询药品信息 | medical | "布洛芬用法用量禁忌" |
了解税收政策 | tax | "个人所得税专项附加扣除2025" |
跟踪地方政策 | news_province | "广东省新能源汽车补贴政策" |
了解国家大事 | news_center | "两会政府工作报告要点" |
search 是系统的信息检索基础工具,通过多类别、多查询扩展的方式快速获取网络信息概览,时效性要求高的场景需配合 browser SKILL 实时验证。
timer_task 工具详解
基本信息
属性 | 说明 |
功能 | 创建定时任务,在指定时间自动执行 AI Agent 任务 |
核心价值 | 将 AI 从"被动响应"转变为"主动定时执行",实现自动化工作流 |
参数说明
参数名 | 类型 | 是否必填 | 说明 |
brief | string | 是 | 任务名称,用于标识和展示,如"每日天气提醒"、"周报生成" |
prompt | string | 是 | Agent 执行的完整任务描述,必须是自包含的(Agent 执行时没有对话上下文) |
cron | string | 与 once_time 二选一 | cron 表达式,用于周期性任务 |
once_time | string | 与 cron 二选一 | 一次性任务的执行时间 |
两种任务模式
模式一:周期性任务(cron)
使用 6 字段 cron 表达式:秒 分 时 日 月 周
字段 | 范围 | 说明 |
秒 | 0-59 | 第几秒 |
分 | 0-59 | 第几分 |
时 | 0-23 | 第几小时(24小时制) |
日 | 1-31 | 月份中的第几天 |
月 | 1-12 | 第几月 |
周 | 0-6 | 星期几(0=周日,1=周一,...,6=周六) |
特殊字符:
字符 | 含义 | 示例 |
* | 任意值 | * * * * * * = 每秒 |
, | 列举 | 1,3,5 = 第1、3、5 |
- | 范围 | 1-5 = 第1到5 |
/ | 步进 | */5 = 每5单位 |
常用周期示例:
需求 | cron 表达式 |
每天早上 9 点 | 0 0 9 * * * |
工作日早上 9 点 | 0 0 9 * * 1-5 |
每小时整点 | 0 0 * * * * |
每 2 小时 | 0 0 */2 * * * |
每月 1 号 9 点 | 0 0 9 1 * * |
周一三五下午 2 点 | 0 0 14 * * 1,3,5 |
周日上午 10 点 | 0 0 10 * * 0 |
模式二:一次性任务(once_time)
指定一个精确时间点执行一次。
格式 | 示例 |
YYYY/MM/DD HH:MM:SS | 2026/3/31 18:26:03 |
YYYY-MM-DD HH:MM | 2026-03-31 18:26 |
prompt 编写规范
这是最关键的参数。由于 Agent 在任务触发时没有对话上下文,prompt 必须是完整、自包含的任务描述。
核心原则:
包含所有必要信息(数据源、输出格式、文件路径、具体要求等)
不依赖任何"上文"或"之前说的"
明确描述期望的输出结果
好的 prompt 示例:
请访问东方财富网获取今日上证指数、深证成指、创业板指的收盘数据,
整理为表格后保存到 D:\WPS灵犀\20260411-21-20-46\output\market_summary.xlsx差的 prompt 示例:
帮我把之前那个数据更新一下重要约束
约束 | 说明 |
最小执行间隔 | 1 小时,不支持分钟级定时任务 |
cron 格式 | 仅支持 6 字段,不支持 5 字段或 7 字段 |
创建后不可修改 | 只能创建,如需修改或删除需通过客户端界面操作 |
cron 与 once_time 二选一 | 不能同时指定 |
典型应用场景
场景 | 模式 | 示例 |
每日晨报 | cron 周期 | 每天早上 8 点自动搜集行业新闻生成日报 |
每周复盘 | cron 周期 | 每周五下午 6 点生成本周项目进度报告 |
定时数据采集 | cron 周期 | 每天收盘后自动采集股价数据更新 Excel |
一次性提醒 | once_time | 在某个会议开始前 30 分钟生成提醒 |
定期清理 | cron 周期 | 每月 1 号整理上月临时文件 |
timer_task 是系统的自动化调度工具,通过 cron 表达式或一次性时间点实现任务的定时触发,将 Agent 从被动响应升级为主动执行,核心要点是 prompt 必须完整自包含。
- get_memory、edit_memory、write_memory