当前位置：首页>python>用一行Python代码,把PDF转换为Word

用一行Python代码,把PDF转换为Word

2026-07-06 00:22:55

有没有遇到过这种情况：有时需要将一个PDF文件转换为Word文档。

今天分享一个真正能省时间的办法👇 用 Python，把 PDF 直接转成 Word。

pdf2docx是个超实用的Python工具！它的工作流程很简单：先用PyMuPDF把PDF里的内容“抠”出来，再用一套规则把页面布局（比如段落位置、图片排版）摸清楚，最后用python-docx把这些内容“写”成DOCX文件。

要是你碰到这种需求——从PDF里拿文字、图片或者图表，还不想让原来的排版乱掉（比如标题位置、图片对齐方式），用pdf2docx准没错！

第一步：安装pdf2docx

pip install pdf2docx

第二步：转换PDF文档

from pdf2docx import Converterpdf_file = "poster.pdf"docx_file = "output.docx"cv = Converter(pdf_file)cv.convert(docx_file)cv.close()print("PDF converted to DOCX successfully!")

除了编程方式，pdf2docx还支持命令行操作。以下是使用命令行进行全部页面转换的命令：

pdf2docx convert example.pdf example.docx

同样，也可以使用 start和 end参数来指定转换的页面范围。

pdf2docx能够解析并重新创建页面布局，包括页面边距、章节、列（仅支持1或2列）、页眉和页脚（待办事项）、段落的水平对齐（左/右/居中/两端对齐）和垂直间距等。它还能够解析并重新创建图像和表格，包括边框样式、底纹样式、合并单元格、嵌套表格等。然而，pdf2docx也有一些限制，例如它仅支持基于文本的PDF文件、从左到右的语言、正常的阅读方向，不支持单词变换或旋转。此外，基于规则的方法不能100%转换PDF布局。