提取附件¶
PDF 文档可以包含附件。附件有一个名称,但可能不是唯一的。因此,reader.attachments["attachment_name"]
的值是一个列表。
您可以通过以下方式提取所有附件:
from pypdf import PdfReader
reader = PdfReader("example.pdf")
for name, content_list in reader.attachments.items():
for i, content in enumerate(content_list):
with open(f"{name}-{i}", "wb") as fp:
fp.write(content)