IBM开源文档解析神器Docling的使用方法(创建Agent Skill)

它能够轻松读取各种流行的文档格式,包括 PDF、DOCX、PPTX、LSX、图片、HTML、AsciiDoc 和 Markdown,并将其转换为 HTML、Markdown 和 JSON 格式。

其不仅具备深度解析 PDF 能力,涵盖页面布局、阅读顺序、表格结构、代码、公式、图像分类等,对扫描的 PDF 和图像提供强大的 OCR 支持,还支持 LangChain、LlamaIndex、Crew AI 和 Haystack 等集成,成为AI大模型时代的基础设施之一。

使用方法:

你不必记住复杂的编程命令,只需要创建一个Docling技能就行了。

  1. 在支持Agent Skill的工具(比如阶跃AI桌面助手、CodeBuddy、Trae、Claude Code等)中安装repo2skill技能:https://github.com/zhangyanxs/repo2skill

(文章:开源发布 | Repo2Skill:让你的 OpenCode 像“吸星大法”一样吞噬开源项目

  1. 在AI对话框或者终端命令行中输入指令:请使用repo2skill技能,帮我把这个开源工具 https://github.com/DS4SD/docling打包成一个Skill,技能名称为Docling。

  1. 接着,你就可以在AI对话框或者终端命令行使用Docling技能了。比如输入指令:请使用Docling技能将某某PDF文件转换为Markdown文件进行另存。

北京
浏览 602
收藏
2
分享
2 +1
+1
全部评论