pip install -r requirements.txtpython pdf_to_images.py input.pdf \
--output ./images \
--dpi 300 \
--format pnginput_pdf: 必填,输入PDF文件路径-o/--output: 输出目录(默认:output)--dpi: 图像分辨率(默认:200)--format: 输出格式 png/jpg(默认:png)--split-height: 垂直切割高度(像素)(默认:None)
pip install PyPDF2python pdf_splitter.py input.pdfinput_pdf: 必填,输入PDF文件路径-o/--output_prefix: 输出文件前缀(默认:page)-p/--pages: 指定要提取的页码,逗号分隔(例如:1,3,5)。如果不指定,默认提取所有页面
- 提取所有页面:
python pdf_splitter.py input.pdf- 提取指定页面:
python pdf_splitter.py input.pdf -p 1,3,5- 自定义输出文件前缀:
python pdf_splitter.py input.pdf -o output_prefixpip install Pillow reportlabpython img_to_pdf.py input_path [output.pdf]input_path: 必填,包含图片的输入目录路径或单个图片文件路径output_pdf: 可选,输出 PDF 文件路径。如果不指定,将在输入路径的同一目录下生成默认文件名
- 将
images目录中的所有图片转换为output.pdf:
python img_to_pdf.py images output.pdf- 将单个图片文件
image.jpg转换为output.pdf:
python img_to_pdf.py image.jpg output.pdf- 将单个图片文件
image.jpg转换为默认文件名的 PDF(生成image.pdf):
python img_to_pdf.py image.jpg- 将
images目录中的所有图片转换为默认文件名的 PDF(生成images/images.pdf):
python img_to_pdf.py imagespython pdf_to_images.py xiumi.pdf --dpi 300 --format jpg --split-height 800