多agent或并行执行任务需求-节省时间
# WPS灵犀 并行任务执行能力 需求方案
> 提交人:国誉评估 · 柳总13342998699
> 日期:2026.05.15
> 反馈渠道:WPS社区 forum.wps.cn → WPS灵犀板块
---
## 一、背景与痛点
### 当前现状
WPS灵犀已具备强大的单会话任务执行能力(文件处理、数据分析、iFinD金融查询、快查工商、报告生成等),但在面对**多个独立子任务**时,只能串行执行——一个做完再做下一个,无法并行。
### 实际场景
以资产评估项目为例,一个完整项目涉及多个独立环节:
```
同时需要做的事:
├── 查A公司财报数据(iFinD)
├── 查B公司工商信息(快查)
├── 读取科目余额表(Python + openpyxl)
├── 生成评估申报表(Python + COM)
└── 撰写评估报告(docx skill)
```
当前灵犀只能按顺序一个一个做。假设每个任务需要30秒,5个独立任务就要2.5分钟,并行的话只需30秒。
### 替代方案的代价
为解决并行问题,目前部署了一套多Agent系统(Hermes),包含5个独立Agent进程、Gateway通信层、Hook通知机制、Session管理等基础设施。**维护成本远大于并行节省的时间**:
- 5个进程 + Gateway 需要开机自启和持续监控
- Hook/Approval/Session 等机制每次Hermes升级都可能失效需要适配
- Agent间通信(delegate_task、文件传递、状态同步)增加复杂度
- 实际上90%的并行需求只是"同时查几个数据源"这种简单场景
**结论:如果灵犀原生支持并行执行,完全不需要维护这套多Agent基础设施。**
---
## 二、需求定义
### 核心需求
**支持在一个灵犀会话中,并行执行多个无依赖关系的子任务。**
### 用户交互示例
**输入**(一句话):
> "帮我同时查贵州茅台、五粮液、泸州老窖三家公司最近一年的营收和净利润"
**期望行为**:
1. 灵犀识别出3个独立查询任务
2. 同时发起3个查询(而非串行查询3次)
3. 3个结果全部返回后,汇总成一张表格输出
**输入**(复杂场景):
> "帮我做亚诺化工的评估申报表,数据源在桌面报表及账套文件夹里"
**期望行为**:
1. 灵犀自动拆分:读取科目余额表 + 读取辅助核算表 + 读取固定资产表(并行读取)
2. 数据汇总后执行填充逻辑(串行,有依赖)
3. 自动生成验证报告
---
## 三、技术可行性分析
### 灵犀现有能力已完全具备
| 能力 | 状态 | 说明 |
|------|------|------|
| 多工具调用 | ✅ 已有 | 工具层已支持调用任意skill |
| Python并发 | ✅ 已有 | Python执行环境支持threading/asyncio |
| 任务拆分 | ✅ 已有 | LLM本身具备任务分解和编排能力 |
| 结果合并 | ✅ 已有 | LLM可以汇总多个结果 |
### 缺的只有一个编排层
当前的瓶颈是系统级的串行约束:
> "每次响应只能包含一个工具调用,等待结果返回后再发起下一次"
**需要改为**:
> "当多个工具调用之间无数据依赖时,允许同时发起,全部完成后统一处理结果"
### 建议的实现方案
**方案A:模型层自动编排(推荐)**
- 在system prompt中告知模型支持并行调用
- 模型自行判断哪些调用无依赖,在一次回复中同时发起多个工具调用
- 系统等待所有并行调用完成后,将结果汇总返回给模型做下一步决策
- 类似OpenAI的Parallel Function Calling
**方案B:用户显式指定**
- 用户用特定语法标记并行任务,如"同时" / "并行"
- 系统解析后拆分为多个独立执行流
- 结果汇总后返回
**方案C:后台任务队列**
- 支持提交后台任务,灵犀异步执行
- 完成后通知用户(类似定时任务,但更通用)
- 适合耗时较长的任务
> 建议:**方案A优先**,对用户零额外学习成本,模型智能判断并行性。
---
## 四、适用场景
### 高频场景(日常办公)
| 场景 | 当前耗时 | 并行后 | 节省 |
|------|---------|--------|------|
| 同时查3-5家公司财务数据 | 3-5分钟 | 1分钟 | 60-80% |
| 读取多个数据源文件 | N×30秒 | 30秒 | (N-1)/N |
| 同时生成多份报告 | N×2分钟 | 2分钟 | (N-1)/N |
| 查数据+做计算+出图表 | 串行累计 | 部分重叠 | 30-50% |
### 专业场景(评估/审计)
| 阶段 | 可并行的子任务 |
|------|--------------|
| 数据采集 | 多个iFinD查询、多个快查、多个文件读取 |
| 数据处理 | 多个Sheet同时计算、多个文件同时清洗 |
| 报告生成 | 评估报告+评估说明+申报表同时生成 |
| 底稿填充 | 多个资产类别同时填充 |
---
## 五、优先级建议
| 优先级 | 功能点 | 理由 |
|--------|--------|------|
| **P0** | 支持并行工具调用(无依赖时自动并发) | 核心能力,覆盖80%场景 |
| **P1** | 并行进度反馈("正在同时执行3个任务...") | 用户体验 |
| **P2** | 后台任务+完成通知 | 长耗时场景 |
| **P3** | 任务依赖图可视化 | 复杂项目编排 |
---
## 六、预期收益
### 对用户
- **效率提升**:多数据源查询、批量文件处理等场景耗时降低60-80%
- **零维护成本**:不需要部署和维护任何额外基础设施
- **零学习成本**:像平常一样跟灵犀说话,系统自动判断是否并行
### 对产品
- **差异化竞争力**:目前主流AI助手(ChatGPT/Claude/文心一言)均不支持真正的并行任务执行
- **企业客户价值**:金融、评估、审计等专业领域大量存在"同时查多个数据源"的需求
- **技术壁垒**:编排层+工具链整合是深度集成才能做到的,纯API产品做不到
---
## 七、补充说明
### 为什么不用多个灵犀会话替代?
- 多会话需要用户手动管理,无法自动汇总结果
- 每个会话独立计费/限流,并行开销更大
- 会话间无法共享上下文,结果需要人工合并
### 为什么不继续用多Agent方案?
- 维护成本高:5个进程 + Gateway + Hook + Session + Bridge
- 升级脆弱:Hermes每次更新都可能破坏自定义的hook/approval机制
- 大材小用:90%的并行需求只是"同时查几个数据"这种简单场景
- 灵犀已有全部底层能力,只差一个编排层