设为首页 收藏本站
查看: 680|回复: 0

[经验分享] # Linux下对PDF文件的处理与操作

[复制链接]

尚未签到

发表于 2017-11-22 19:29:07 | 显示全部楼层 |阅读模式
  ---恢复内容开始---

$1 pdf 转换成eps,jpeg等操作

$1.1 pdf 转换成eps操作
  

pdftops -eps source.pdf object.eps  

  其中source.pdf为所需要转换的原文件pdf,object.eps为转换后对应的eps名称,如果object.eps没有则系统默认的会将文件名命名为和原文件一样,只是后缀变成对应的eps文件。


  • 好像不支持通配符
  • 好像无法指定eps的大小
$1.2 pdf转换成jpeg,tiff操作
  首先机器上必须已经安装 ImageMagick:
  

    sudo aptitude install imagemagick  


  •   要将 pdf 文件转换成jpeg图像使用‘convert‘ 命令
      

    convert doc.pdf doc.jpeg
  •   要将 pdf 文件转换成转换成 tiff
      

    convert doc.pdf doc.tiff
$2 pdf的合并、分解、旋转等操作
  如果说PDF是电子纸张,那么pdftk就是电子起钉器、打孔机、粘合剂、解密指环和 X光镜片。Pdftk是一个简单的工具,可以对PDF文档进行各种日常操作。Pdftk可以让你简单而自由地操作PDF。它不需要Acrobat,并且可以运行在 Linux, Windows, Mac OS X, FreeBSD和Solaris之上。在Debian/Ubuntu中你可以通过apt安装pdftk:
  

    $ sudo aptitude install pdftk  


  •   将两个或更多个PDF合并成一个新文档
      

    pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf  

      或者 (使用句柄):
      

    pdftk A=1.pdf B=2.pdf cat A B output 12.pdf  

      或者 (使用通配符):
      

    pdftk *.pdf cat output combined.pdf
  •   将多个PDF中选定的页面分离出来并形成一个新文档
      

    pdftk A=one.pdf B=two.pdf cat A1-7 B1-5 A8 output combined.pdf
  •   将PDF的第一页顺时针旋转90度
      

    pdftk in.pdf cat 1E 2-end output out.pdf
  •   将整个PDF文档的页面旋转180度
      

    pdftk in.pdf cat 1-endS output out.pdf
$3 pdf中提取信息(文字、图片等)

$3.1 pdf中提取文字信息
  pdftotext将可移植文档格式(PDF)文件转换成纯文本,前提是pdf文件中包含文字信息。


  •   如果文本文件未指定, pdftotext将file.pdf转换成file.txt。
      

    pdftotext example.pdf example.txt
  •   转换第3到7页(包括3和7)使用
      pdftotext -f 3 -l 7 example.pdf example.txt

$3.2 pdf中提取图片信息
  pdfimages从可移植文档格式(PDF)文件中提取图片,保存为可移植像素图(PPM), 可移植位图(PBM), 或者JPEG文件。Pdfimages读取PDF文件,扫描一个或多个页面,并将每一个图像写入一个名为image-root-nnn.xxx的PPM、PBM或者JPEG文件,其中nnn是图像编号,xxx是图像类型(.ppm, .pbm, .jpg)。Pdfimages从PDF文件提取原始图像数据,不做任何额外的变化。任何PDF内容流里的旋转,剪切,颜色反转等动作都被忽略。


  •   从example.pdf提取所有的图像。图像会被保存为PPM格式
      

    pfdimages example.pdf exampleimage
  •   使用-j选项将图像保存为JPG格式
      

    pfdimages -j example.pdf exampleimage
  •   使用-f和-l选项制定起始页和结束页。为了扫描第3至7页(包括3和7)使用:
      

    pfdimages -f 3 -l 7 example.pdf exampleimage
  •   只扫描指定的某一页使用
      

    pfdimages -f 3 -l 3 example.pdf exampleimage
  ---恢复内容结束---

$1 pdf 转换成eps,jpeg等操作

$1.1 pdf 转换成eps操作
  

pdftops -eps source.pdf object.eps  

  其中source.pdf为所需要转换的原文件pdf,object.eps为转换后对应的eps名称,如果object.eps没有则系统默认的会将文件名命名为和原文件一样,只是后缀变成对应的eps文件。


  • 好像不支持通配符
  • 好像无法指定eps的大小
$1.2 pdf转换成jpeg,tiff操作
  首先机器上必须已经安装 ImageMagick:
  

    sudo aptitude install imagemagick  


  •   要将 pdf 文件转换成jpeg图像使用‘convert‘ 命令
      

    convert doc.pdf doc.jpeg
  •   要将 pdf 文件转换成转换成 tiff
      

    convert doc.pdf doc.tiff
$2 pdf的合并、分解、旋转等操作
  如果说PDF是电子纸张,那么pdftk就是电子起钉器、打孔机、粘合剂、解密指环和 X光镜片。Pdftk是一个简单的工具,可以对PDF文档进行各种日常操作。Pdftk可以让你简单而自由地操作PDF。它不需要Acrobat,并且可以运行在 Linux, Windows, Mac OS X, FreeBSD和Solaris之上。在Debian/Ubuntu中你可以通过apt安装pdftk:
  

    $ sudo aptitude install pdftk  


  •   将两个或更多个PDF合并成一个新文档
      

    pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf  

      或者 (使用句柄):
      

    pdftk A=1.pdf B=2.pdf cat A B output 12.pdf  

      或者 (使用通配符):
      

    pdftk *.pdf cat output combined.pdf
  •   将多个PDF中选定的页面分离出来并形成一个新文档
      

    pdftk A=one.pdf B=two.pdf cat A1-7 B1-5 A8 output combined.pdf
  •   将PDF的第一页顺时针旋转90度
      

    pdftk in.pdf cat 1E 2-end output out.pdf
  •   将整个PDF文档的页面旋转180度
      

    pdftk in.pdf cat 1-endS output out.pdf
$3 pdf中提取信息(文字、图片等)

$3.1 pdf中提取文字信息
  pdftotext将可移植文档格式(PDF)文件转换成纯文本,前提是pdf文件中包含文字信息。


  •   如果文本文件未指定, pdftotext将file.pdf转换成file.txt。
      

    pdftotext example.pdf example.txt
  •   转换第3到7页(包括3和7)使用
      pdftotext -f 3 -l 7 example.pdf example.txt

$3.2 pdf中提取图片信息
  pdfimages从可移植文档格式(PDF)文件中提取图片,保存为可移植像素图(PPM), 可移植位图(PBM), 或者JPEG文件。Pdfimages读取PDF文件,扫描一个或多个页面,并将每一个图像写入一个名为image-root-nnn.xxx的PPM、PBM或者JPEG文件,其中nnn是图像编号,xxx是图像类型(.ppm, .pbm, .jpg)。Pdfimages从PDF文件提取原始图像数据,不做任何额外的变化。任何PDF内容流里的旋转,剪切,颜色反转等动作都被忽略。


  •   从example.pdf提取所有的图像。图像会被保存为PPM格式
      

    pfdimages example.pdf exampleimage
  •   使用-j选项将图像保存为JPG格式
      

    pfdimages -j example.pdf exampleimage
  •   使用-f和-l选项制定起始页和结束页。为了扫描第3至7页(包括3和7)使用:
      

    pfdimages -f 3 -l 7 example.pdf exampleimage
  •   只扫描指定的某一页使用
      

    pfdimages -f 3 -l 3 example.pdf exampleimage

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-409610-1-1.html 上篇帖子: Linux常用命令的解释 下篇帖子: 在Windows上使用Ubuntu共享的打印机
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表