多agent或并行执行任务需求-节省时间

# WPS灵犀 并行任务执行能力 需求方案

> 提交人:国誉评估 · 柳总13342998699

> 日期:2026.05.15

> 反馈渠道:WPS社区 forum.wps.cn → WPS灵犀板块

---

## 一、背景与痛点

### 当前现状

WPS灵犀已具备强大的单会话任务执行能力(文件处理、数据分析、iFinD金融查询、快查工商、报告生成等),但在面对**多个独立子任务**时,只能串行执行——一个做完再做下一个,无法并行。

### 实际场景

以资产评估项目为例,一个完整项目涉及多个独立环节:

```

同时需要做的事:

├── 查A公司财报数据(iFinD)

├── 查B公司工商信息(快查)

├── 读取科目余额表(Python + openpyxl)

├── 生成评估申报表(Python + COM)

└── 撰写评估报告(docx skill)

```

当前灵犀只能按顺序一个一个做。假设每个任务需要30秒,5个独立任务就要2.5分钟,并行的话只需30秒。

### 替代方案的代价

为解决并行问题,目前部署了一套多Agent系统(Hermes),包含5个独立Agent进程、Gateway通信层、Hook通知机制、Session管理等基础设施。**维护成本远大于并行节省的时间**:

- 5个进程 + Gateway 需要开机自启和持续监控

- Hook/Approval/Session 等机制每次Hermes升级都可能失效需要适配

- Agent间通信(delegate_task、文件传递、状态同步)增加复杂度

- 实际上90%的并行需求只是"同时查几个数据源"这种简单场景

**结论:如果灵犀原生支持并行执行,完全不需要维护这套多Agent基础设施。**

---

## 二、需求定义

### 核心需求

**支持在一个灵犀会话中,并行执行多个无依赖关系的子任务。**

### 用户交互示例

**输入**(一句话):

> "帮我同时查贵州茅台、五粮液、泸州老窖三家公司最近一年的营收和净利润"

**期望行为**:

1. 灵犀识别出3个独立查询任务

2. 同时发起3个查询(而非串行查询3次)

3. 3个结果全部返回后,汇总成一张表格输出

**输入**(复杂场景):

> "帮我做亚诺化工的评估申报表,数据源在桌面报表及账套文件夹里"

**期望行为**:

1. 灵犀自动拆分:读取科目余额表 + 读取辅助核算表 + 读取固定资产表(并行读取)

2. 数据汇总后执行填充逻辑(串行,有依赖)

3. 自动生成验证报告

---

## 三、技术可行性分析

### 灵犀现有能力已完全具备

| 能力 | 状态 | 说明 |

|------|------|------|

| 多工具调用 | 已有 | 工具层已支持调用任意skill |

| Python并发 | 已有 | Python执行环境支持threading/asyncio |

| 任务拆分 | 已有 | LLM本身具备任务分解和编排能力 |

| 结果合并 | 已有 | LLM可以汇总多个结果 |

### 缺的只有一个编排层

当前的瓶颈是系统级的串行约束:

> "每次响应只能包含一个工具调用,等待结果返回后再发起下一次"

**需要改为**:

> "当多个工具调用之间无数据依赖时,允许同时发起,全部完成后统一处理结果"

### 建议的实现方案

**方案A:模型层自动编排(推荐)**

- 在system prompt中告知模型支持并行调用

- 模型自行判断哪些调用无依赖,在一次回复中同时发起多个工具调用

- 系统等待所有并行调用完成后,将结果汇总返回给模型做下一步决策

- 类似OpenAI的Parallel Function Calling

**方案B:用户显式指定**

- 用户用特定语法标记并行任务,如"同时" / "并行"

- 系统解析后拆分为多个独立执行流

- 结果汇总后返回

**方案C:后台任务队列**

- 支持提交后台任务,灵犀异步执行

- 完成后通知用户(类似定时任务,但更通用)

- 适合耗时较长的任务

> 建议:**方案A优先**,对用户零额外学习成本,模型智能判断并行性。

---

## 四、适用场景

### 高频场景(日常办公)

| 场景 | 当前耗时 | 并行后 | 节省 |

|------|---------|--------|------|

| 同时查3-5家公司财务数据 | 3-5分钟 | 1分钟 | 60-80% |

| 读取多个数据源文件 | N×30秒 | 30秒 | (N-1)/N |

| 同时生成多份报告 | N×2分钟 | 2分钟 | (N-1)/N |

| 查数据+做计算+出图表 | 串行累计 | 部分重叠 | 30-50% |

### 专业场景(评估/审计)

| 阶段 | 可并行的子任务 |

|------|--------------|

| 数据采集 | 多个iFinD查询、多个快查、多个文件读取 |

| 数据处理 | 多个Sheet同时计算、多个文件同时清洗 |

| 报告生成 | 评估报告+评估说明+申报表同时生成 |

| 底稿填充 | 多个资产类别同时填充 |

---

## 五、优先级建议

| 优先级 | 功能点 | 理由 |

|--------|--------|------|

| **P0** | 支持并行工具调用(无依赖时自动并发) | 核心能力,覆盖80%场景 |

| **P1** | 并行进度反馈("正在同时执行3个任务...") | 用户体验 |

| **P2** | 后台任务+完成通知 | 长耗时场景 |

| **P3** | 任务依赖图可视化 | 复杂项目编排 |

---

## 六、预期收益

### 对用户

- **效率提升**:多数据源查询、批量文件处理等场景耗时降低60-80%

- **零维护成本**:不需要部署和维护任何额外基础设施

- **零学习成本**:像平常一样跟灵犀说话,系统自动判断是否并行

### 对产品

- **差异化竞争力**:目前主流AI助手(ChatGPT/Claude/文心一言)均不支持真正的并行任务执行

- **企业客户价值**:金融、评估、审计等专业领域大量存在"同时查多个数据源"的需求

- **技术壁垒**:编排层+工具链整合是深度集成才能做到的,纯API产品做不到

---

## 七、补充说明

### 为什么不用多个灵犀会话替代?

- 多会话需要用户手动管理,无法自动汇总结果

- 每个会话独立计费/限流,并行开销更大

- 会话间无法共享上下文,结果需要人工合并

### 为什么不继续用多Agent方案?

- 维护成本高:5个进程 + Gateway + Hook + Session + Bridge

- 升级脆弱:Hermes每次更新都可能破坏自定义的hook/approval机制

- 大材小用:90%的并行需求只是"同时查几个数据"这种简单场景

- 灵犀已有全部底层能力,只差一个编排层

广东省
浏览 220
收藏
4
分享
4 +1
+1
全部评论