pdf数据处理
背景:pdf文件是加密的,且我要写的脚本不足以单独调整加密软件的管理策略【功能也不多,也还没写完】
我正在使用pdfplumber和python进行pdf文件的解析,因为pdfplumber包能够很好的解析表格数据,但是在近期的实机测试中,发现要解析的pdf文件只能由特定软件(比如WPS OFFICE)打开,我应该如何解决文件读取的问题?
思路:1.将原本要制作的软件调整为制作wps office的插件可以吗?这样可以的话,那么wps与python的接口如何实现呢?我有看到一个python-wps-client,但是感觉不用太行。官网上说调用api还要搞第三方认证和申请,太麻烦了
2.在wps里调用外部脚本,wps似乎没有这个能力,而且也涉及到pdf文件流在二者之间的传递
所以我想问问大佬们有什么想法
@金山办公
创作者俱乐部成员