WPS知识库的“最后一公里”:什么时候能支持「截图提问」?

Mr Chen
Mr Chen

WPS寻令官 | 创作者俱乐部成员

🛑 一、一个让所有“懒人”抓狂的瞬间

想象这个场景:

你正在处理一份复杂的财务报表,发现某个数据对不上。

你立刻截了个图,想问公司的WPS知识库:“这张表里的逻辑哪里错了?”或者“这个数据的来源文档是哪一份?”

然后,你尴尬地发现——

WPS知识库目前只支持文字提问!

不支持直接上传图片/截图进行检索或问答!

你只能:

1️⃣ 把截图里的文字手动敲出来(或者先发给微信文件传输助手识别一下再复制);

2️⃣ 用模糊的关键词去搜文档标题;

3️⃣ 放弃提问,自己翻几十个文件夹……

💔 明明AI已经能看懂图片了,为什么知识库还停留在“纯文本”时代?

🔍 二、为什么“截图提问”是知识库的刚需?

作为深度用户,我认为“截图提问”不是锦上添花,而是打通知识闭环的关键一步

1. 所见即所问,降低门槛

很多业务问题是非结构化的。比如一张复杂的流程图、一段代码报错截图、一个设计稿的局部。让用户用文字描述清楚“左上角那个红色的框和右下角的箭头有什么关系”,太难了!截图是最自然的语言。

2. 精准定位,拒绝“大海捞针”

文字搜索容易匹配到大量无关文档。而以图搜图基于图片内容的语义检索,能直接锁定包含该图表、该界面的具体文档段落,效率提升10倍不止。

3. 适配移动端,随时随地

在手机WPS上,看到问题随手一截,直接扔进知识库提问,这才是真正的移动办公体验。现在还得切出去转文字,体验断层太严重。

💡 三、我理想中的“截图提问”功能长这样

如果WPS知识库上线此功能,我希望它能做到:

📸 一键粘贴/上传:在提问框直接 Ctrl+V 截图,或点击相机图标上传。

🧠 多模态理解:AI不仅能识别图中的文字(OCR),还能理解图表逻辑、界面布局、甚至手写批注。

🔗 溯源定位:回答时,不仅给出结论,还要高亮显示原文档中对应的截图位置,并给出跳转链接。

🗣️ 追问交互:基于截图继续追问:“如果把图里这个参数改成5,结果会怎样?”

🚀 四、竞品都在跑,WPS不能停

目前市面上不少新一代AI知识库(如ima)已经实现了“图片+文档”混合检索

WPS拥有最庞大的企业文档生态,如果能率先在国产办公软件中实现“截图问知识库”,绝对是降维打击

这不仅仅是加一个功能,而是重新定义人与企业知识的交互方式

📣 五、@WPS产品团队,听得到吗?

我们爱WPS,是因为它总在解决真问题。

现在的WPS AI已经很强大,但知识库的“看图”能力是最后一块拼图。

强烈建议:

「支持截图/图片提问」列入WPS知识库的高优先级迭代计划!

让我们告别“转文字再提问”的笨拙,体验真正的“有图有真相,一问便知”

甘肃省
浏览 80
收藏
8
分享
8 +1
1
+1
全部评论 1
 
金丝雀
DeepSeek支持多模态了,估计就也一并支持了吧。其实可以通过前置小模型来实现。
· 北京
回复