【功能测试】WPS AI PPT with Nano,实践出真知

дй※®ε 哦嘞
дй※®ε 哦嘞

创作者俱乐部成员

功能介绍

WPS冲浪队长宣告【有奖测评】年终必看!WPS AIPPT支持Nano Banana Pro图片转PPT编辑。强调字体准确还原,生成图层可分离,编辑丝滑体验。

正值双蛋前夕,相信有很多人开始高强度制作PPT了。正好让我们看看转换准确度如何,能不能让我们基于原有的演示效果图快速转换可编辑PPT,提升效率。

测试材料

既然强调图片转PPT,那我们就准备一些图片提供给WPS AI PPT进行识别转换。正好之前在社区发的一些贴子的配图就是基于WPS制作出PPT再导出的图片。那就直接使用吧。

基于之前配图对于PPT的版式类型,大致选用以下四张。两张封面页两张正文页,分别一深一浅。

封面页

封面页

正文页

正文页

测试录屏

  1. 浅色封面

字体上来说,匹配的字形较为接近,字体颜色、相对位置也尽量做到了完美还原。

唯一不足或者说吹毛求疵的地方在于,这个图片在之前制作PPT时,是大小标题的关系:

识别中放在了同一个文本框内。并通过放大“超会AI大会员”一行的段前距来模拟原图的间隔效果。可以说比较取巧,但也可以强行批评其不拆分两个单元格使得不能后期快速调整两处文字内容相对位置。

图片上则效果较差了,可能是网页直接拖拽导致读取的图片像素较低,转换出来的图片部分相对模糊,不如原图清晰。相对于直接使用转换出来的图片,我会更愿意将原图裁切出这一部分插入。

在还原效果上,原图当时我是使用了WPS美化素材中智能图形并列图形,取了原素材的三段外环,并将三种会员的logo图片置入环内,从而做出来的效果图。原结构是可以根据需要去单独调整每个图标大小以及修改色环颜色的,如果只能识别出来一张更模糊的图片,那这一部分我直接重置可能更快也更好。

  1. 深色封面

文字上,字形没有很好的还原,但相对成功的识别出了文字及文本框的相对位置,随后手动修改字形也相对便捷。

图片还原上,虽然清晰度还是会相对较差,但倒是出乎我意料地对两三个圆环做到了单独提取(其实本来背景就是直接套用的WPS AI模板),如果想要快速修改出原有效果,我可以把识别出的模糊背景删除放上纯黑背景,再把识别出的圆环快速复制放缩,相比自己手动设置圆环渐变,能够稍微减少一点工作量。

  1. 目录页/正文页

针对文字更多的正文页,本身内容较多情况下,想要手动还原压力会更大。因此这一部分把各部分图片单独放出来方便比对查看。

原图

识别结果

针对识别出来的单页PPT来看,整体效果可以打到80分(满分100),除了定义那个形状由椭圆变成了方块需要修改,这一张我甚至可以直接使用。

识别出后打底的纯图

当然如果需要细致修改的话,就回到了智能图形的结构还原上,可以看到它对我原来的6个子项的图形结构一股脑地转换成了一张底图,而且文字1、4也成为了底图的一部分。

识别出来的文字部分(为了方便查看手动添加了背景色,其中的方形色块以及6那个方块是识别出来的细碎图片块)

文字部分,所有文字变成了一个文本框内的字符,原来的间距变成了空格、换行符。如果我要手动修改还原的话,我需要单独选中文字且避开空格内容。

如果能识别到间隔部分并把:“公共书签”、“用于共享和协作……”这些文字各自单独放在各自文本框中,那我就可以直接单独复制文本框内所有文字而不需要控制划选光标来避开空格文字。

进而可以直接添加一个六个子元素的智能图形再直接把文字内容复制粘贴进去。

  1. 带水印的正文页图片

原图

这张原图是当时制作PPT导出为图片时添加水印的产物,来看看面对带水印的PPT图片结果如何。

整体识别结果

删除识别出来的底图剩下的文字部分及少量拆分小图

文字方面,识别出来的段前段后间距等相对得到保留,但原图中“2023年”前面的段落符号没有识别出来,被直接抛弃。

比较惊喜的事水印文字没有被作为正文内容一起识别导致大量冗余文字出现

识别出来的背景底图

图片部分,背景色水印及左侧的引导线被合并在一起识别成了一张依然很糊的图片。但好处是可以直接拆除并快速通过形状的复制粘贴形状对齐快速复现。

这张识别出来的背景我是绝对不会直接使用的。

补充测试

1、网页图片直接拖拽VS手动下载再上传

鉴于上面四张都存在背景图较为模糊的问题,因此考虑是网页直接拖拽导致图片本身清晰度低导致转换效果差。故转换上传动作,从原来的直接拖拽变为从网页下载图片再从AIPPT-🍌图片转 PPT页面手动上传

手动上传转换结果

网页直接拖拽转换结果

可以看出首先在页面大小上,同样是占满整个幻灯片页面,手动上传转换出来的,缩放比在80%就足以占满窗口,但直接拖拽的要缩放到230%才能占满。而清晰度上,手动上传图片的识别结果中图片清晰度也更符合需要

2、有水印图片如果无水印的效果

调出原PPT,直接截一张无水印图,将这张图手动上传识别。

截图

转换效果

底图文字拆分情况

可以看到还是丢失了项目符号,以及还是形状背景色一起识别一张底层图片的问题

3、水印颜色更深时会不会被识别成文字内容

极端一些,把原来默认的10%透明度拉大到70%(当然正常不会这么高)

拉到70%导出如下图

原图

转换过程

转换出来的PPT

把页面中的图片对象全部删除只留下文字部分

可以看到这么极端情况下,识别时也尽量避开了把水印识别为文字的情况。但一些原有文字因为与水印颜色高度接近且重合,不可避免的跟水印合在一起被识别为了图片。但面对这么深色的水印,识别的文字还识读出了这些,还是高于我的预期了。

测试总结

  1. 优势部分

有NAno加持的PPT转换,能相对完整的保留图片中的元素位置及结构。面对干扰信息(比如全屏水印)较少的情况,还原出来的文字不仅相对完整,结构也相对来说可以更快捷的利用。

  1. 缺陷部分

识别情况受图片清晰度影响较明显,同时图片的上传方式又比较影响服务器获取图片的清晰度。因此针对图片上传,看看能不能改进一下获取手段,针对网页图片能不能基于浏览器插件做到无损导入。

文字部分会把识别出来的文字合并放入一个文本框,原本应该存在的间隔距离被空格、段前段后距代替,不利于正常调整。

最后,Nano加持下的AI 图片转演示文稿,能力还是比较惊艳我的。希望也能跟WPS AI本身一样,逐步进步,逐步改善,相信后面也能成为一个很重要的助力。

💡

上传之前,最后补充一个建议给智能文档。

既然文段内容可以绑定样式设置正文、标题。

那能不能修改样式的默认配置。

正文默认字号11不可修改

如果我需要正文是13号字,那我就要每一段手动选中再修改为13。

非常麻烦。如果能直接修改正文样式,那就不用选择内容了。

江西省
浏览 761
收藏
5
分享
5 +1
1
+1
全部评论 1
 
落叶知清秋
你们测的一个比一个秀
· 北京
回复