wps pdf转换中那些奇奇怪怪的问题
麦宇哲
WPS产品体验官
- 原文中有链接时,转换后docx中出现{HYPERFLINK代码
PDF原文
转换后Docx
并且这段还在当前页和次页重复出现过两回,当前页是图片形式,次页是文字形式。但是都包含了超链接代码字样
- 碰到带有部分重盒内容,转换存在乱码
原文底部带有重合
转换后的内容长这个样子:
- 目录页转换后完全乱码
WPS PDF似乎是想重新组织目录?但是转换代码有BUG?
原文中的目录页
转换后的目录页
- 错乱的目录
转换后的书签可以看得出WPS PDF试图努力的分析过原始文档,并且生成了自己认为合理的目录,只是这个docx目录是不是有点怪怪的?
WPS努力识别出来的目录
真实的目录页
真实的目录页
- 难以理解的章节名称提取
原PDF中的章节名
- 百分百会保留且单独留一页的乱码脚注
转换后的效果
原PDF文档
原PDF中页脚中略带重合的内容
在编辑模式下,可以看出WPS其实是可以区分出上一行文字和下一行文字的,只是在转换工具中没有正确识别。
WPS PDF编辑中IEEE识别成功
原WPS PDF编辑中On October识别成功
希望WPS PDF转换工具可以越来越好。早日变的更加完善。尤其对于这种纯文字,背景干净的PDF,可以转换的非常完美。
社区管理员
@金山办公
WPS产品体验官
WPS产品体验官