wps pdf转换中那些奇奇怪怪的问题

麦宇哲
麦宇哲

WPS产品体验官

  1.  原文中有链接时,转换后docx中出现{HYPERFLINK代码

PDF原文

转换后Docx

并且这段还在当前页和次页重复出现过两回,当前页是图片形式,次页是文字形式。但是都包含了超链接代码字样

  1.  碰到带有部分重盒内容,转换存在乱码

原文底部带有重合

转换后的内容长这个样子:

  1.  目录页转换后完全乱码

WPS PDF似乎是想重新组织目录?但是转换代码有BUG?

原文中的目录页

转换后的目录页

  1.  错乱的目录

转换后的书签可以看得出WPS PDF试图努力的分析过原始文档,并且生成了自己认为合理的目录,只是这个docx目录是不是有点怪怪的?

WPS努力识别出来的目录

真实的目录页

真实的目录页

  1.  难以理解的章节名称提取

原PDF中的章节名

  1.  百分百会保留且单独留一页的乱码脚注

转换后的效果

原PDF文档

原PDF中页脚中略带重合的内容

在编辑模式下,可以看出WPS其实是可以区分出上一行文字和下一行文字的,只是在转换工具中没有正确识别。

WPS PDF编辑中IEEE识别成功

原WPS PDF编辑中On October识别成功

希望WPS PDF转换工具可以越来越好。早日变的更加完善。尤其对于这种纯文字,背景干净的PDF,可以转换的非常完美。

北京
浏览 814
收藏
4
分享
4 +1
4
+1
全部评论 4
 
WPS 冲浪队长
WPS 冲浪队长

社区管理员

PDF转化为文字,当文章中有链接时,会出现{HYPERFLINK代码 目录页乱码 这两个问题:当前官网版本个人版18608使用【布局优先】的模式转换可以解决 内容重复部分,会出现乱码:正在修复中
· 广东省
回复
 
WPS反馈小助理小绿
从截图看,第1、2、3 的问题都是把PDF文档中的域代码识别出来了,也就是文件半身内容就是这个,而展示是另一个形式,就如图文字文档中插入目录,然后右键选择展示域代码,目录也会变成代码,以上现象同理。 关于亲亲反馈的这5个PDF功能效果的问题,小助理会详细记录,后续反馈给相关同事评估看如何优化的
· 广东省
1
回复
麦宇哲
麦宇哲

WPS产品体验官

这样呀,那WPS需要优化优化了。这个转换效果显然不太理想
· 北京
回复
 
麦宇哲
麦宇哲

WPS产品体验官

给我自己回个帖,升个级
· 北京
回复