多agent或并行执行任务需求-节省时间

#靠谱AI办公WPS

柳新民

# WPS灵犀并行任务执行能力需求方案

> 提交人：国誉评估 · 柳总13342998699

> 日期：2026.05.15

> 反馈渠道：WPS社区 forum.wps.cn → WPS灵犀板块

---

## 一、背景与痛点

### 当前现状

WPS灵犀已具备强大的单会话任务执行能力（文件处理、数据分析、iFinD金融查询、快查工商、报告生成等），但在面对**多个独立子任务**时，只能串行执行——一个做完再做下一个，无法并行。

### 实际场景

以资产评估项目为例，一个完整项目涉及多个独立环节：

```

同时需要做的事：

├── 查A公司财报数据（iFinD）

├── 查B公司工商信息（快查）

├── 读取科目余额表（Python + openpyxl）

├── 生成评估申报表（Python + COM）

└── 撰写评估报告（docx skill）

```

当前灵犀只能按顺序一个一个做。假设每个任务需要30秒，5个独立任务就要2.5分钟，并行的话只需30秒。

### 替代方案的代价

为解决并行问题，目前部署了一套多Agent系统（Hermes），包含5个独立Agent进程、Gateway通信层、Hook通知机制、Session管理等基础设施。**维护成本远大于并行节省的时间**：

- 5个进程 + Gateway 需要开机自启和持续监控

- Hook/Approval/Session 等机制每次Hermes升级都可能失效需要适配

- Agent间通信（delegate_task、文件传递、状态同步）增加复杂度

- 实际上90%的并行需求只是"同时查几个数据源"这种简单场景

**结论：如果灵犀原生支持并行执行，完全不需要维护这套多Agent基础设施。**

---

## 二、需求定义

### 核心需求

**支持在一个灵犀会话中，并行执行多个无依赖关系的子任务。**

### 用户交互示例

**输入**（一句话）：

> "帮我同时查贵州茅台、五粮液、泸州老窖三家公司最近一年的营收和净利润"

**期望行为**：

1. 灵犀识别出3个独立查询任务

2. 同时发起3个查询（而非串行查询3次）

3. 3个结果全部返回后，汇总成一张表格输出

**输入**（复杂场景）：

> "帮我做亚诺化工的评估申报表，数据源在桌面报表及账套文件夹里"

**期望行为**：

1. 灵犀自动拆分：读取科目余额表 + 读取辅助核算表 + 读取固定资产表（并行读取）

2. 数据汇总后执行填充逻辑（串行，有依赖）

3. 自动生成验证报告

---

## 三、技术可行性分析

### 灵犀现有能力已完全具备

| 能力 | 状态 | 说明 |

|------|------|------|

| 多工具调用 | ✅ 已有 | 工具层已支持调用任意skill |

| Python并发 | ✅ 已有 | Python执行环境支持threading/asyncio |

| 任务拆分 | ✅ 已有 | LLM本身具备任务分解和编排能力 |

| 结果合并 | ✅ 已有 | LLM可以汇总多个结果 |

### 缺的只有一个编排层

当前的瓶颈是系统级的串行约束：

> "每次响应只能包含一个工具调用，等待结果返回后再发起下一次"

**需要改为**：

> "当多个工具调用之间无数据依赖时，允许同时发起，全部完成后统一处理结果"

### 建议的实现方案

**方案A：模型层自动编排（推荐）**

- 在system prompt中告知模型支持并行调用

- 模型自行判断哪些调用无依赖，在一次回复中同时发起多个工具调用

- 系统等待所有并行调用完成后，将结果汇总返回给模型做下一步决策

- 类似OpenAI的Parallel Function Calling

**方案B：用户显式指定**

- 用户用特定语法标记并行任务，如"同时" / "并行"

- 系统解析后拆分为多个独立执行流

- 结果汇总后返回

**方案C：后台任务队列**

- 支持提交后台任务，灵犀异步执行

- 完成后通知用户（类似定时任务，但更通用）

- 适合耗时较长的任务

> 建议：**方案A优先**，对用户零额外学习成本，模型智能判断并行性。

---

## 四、适用场景

### 高频场景（日常办公）

| 场景 | 当前耗时 | 并行后 | 节省 |

|------|---------|--------|------|

| 同时查3-5家公司财务数据 | 3-5分钟 | 1分钟 | 60-80% |

| 读取多个数据源文件 | N×30秒 | 30秒 | (N-1)/N |

| 同时生成多份报告 | N×2分钟 | 2分钟 | (N-1)/N |

### 专业场景（评估/审计）

| 阶段 | 可并行的子任务 |

|------|--------------|

| 数据采集 | 多个iFinD查询、多个快查、多个文件读取 |

| 数据处理 | 多个Sheet同时计算、多个文件同时清洗 |

| 报告生成 | 评估报告+评估说明+申报表同时生成 |

| 底稿填充 | 多个资产类别同时填充 |

---

## 五、优先级建议

| 优先级 | 功能点 | 理由 |

|--------|--------|------|

| **P0** | 支持并行工具调用（无依赖时自动并发） | 核心能力，覆盖80%场景 |

| **P1** | 并行进度反馈（"正在同时执行3个任务..."） | 用户体验 |

| **P2** | 后台任务+完成通知 | 长耗时场景 |

| **P3** | 任务依赖图可视化 | 复杂项目编排 |

---

## 六、预期收益

### 对用户

- **效率提升**：多数据源查询、批量文件处理等场景耗时降低60-80%

- **零维护成本**：不需要部署和维护任何额外基础设施

- **零学习成本**：像平常一样跟灵犀说话，系统自动判断是否并行

### 对产品

- **差异化竞争力**：目前主流AI助手（ChatGPT/Claude/文心一言）均不支持真正的并行任务执行

- **企业客户价值**：金融、评估、审计等专业领域大量存在"同时查多个数据源"的需求

- **技术壁垒**：编排层+工具链整合是深度集成才能做到的，纯API产品做不到

---

## 七、补充说明

### 为什么不用多个灵犀会话替代？

- 多会话需要用户手动管理，无法自动汇总结果

- 每个会话独立计费/限流，并行开销更大

- 会话间无法共享上下文，结果需要人工合并

### 为什么不继续用多Agent方案？

- 维护成本高：5个进程 + Gateway + Hook + Session + Bridge

- 升级脆弱：Hermes每次更新都可能破坏自定义的hook/approval机制

- 大材小用：90%的并行需求只是"同时查几个数据"这种简单场景

- 灵犀已有全部底层能力，只差一个编排层

WPS灵犀反馈建议

2026-05-15 12:32:52 广东省

4 +1