06-项目_从多个PDF中合并选择的页面
15.2 项目:从多个PDF中合并选择的页面
假定你有一个很无聊的任务,需要将几十个PDF文档合并成一个PDF文档。每一个文档都有一个封面作为第一页,但你不希望合并后的文档中重复出现这些封面。即使有许多免费的程序可以合并PDF,很多也只是简单地将文档合并在一起。让我们来写一个Python程序,定制需要合并到PDF中的页面。
总的来说,程序需要完成以下任务。
1.找到当前工作目录中的所有PDF文档。
2.按文档名排序,这样就能有序地添加这些PDF。
3.除了第一页之外,将每个PDF的所有页面写入输出的文档。
从实现的角度来看,代码需要执行以下操作。
1.调用 os.listdir()
,找到当前工作目录中的所有文件,并去除非PDF文档。
2.调用Python的 sort()
列表方法,将文档名按字母排序。
3.为输出的PDF文档创建 PdfFileWriter
对象。
4.循环遍历每个PDF文档,为它创建 PdfFileReader
对象。
5.针对每个PDF文档,循环遍历每一页,第一页除外。
6.将页面添加到输出的PDF。
7.将输出的PDF写入一个文档,名为allminutes.pdf。
针对这个项目,打开一个新的文件编辑器窗口,将它保存为combinePdfs.py。