---恢复内容开始---
$1 pdf 转换成eps,jpeg等操作
$1.1 pdf 转换成eps操作
pdftops -eps source.pdf object.eps
其中source.pdf为所需要转换的原文件pdf,object.eps为转换后对应的eps名称,如果object.eps没有则系统默认的会将文件名命名为和原文件一样,只是后缀变成对应的eps文件。
$1.2 pdf转换成jpeg,tiff操作
首先机器上必须已经安装 ImageMagick:
sudo aptitude install imagemagick
要将 pdf 文件转换成jpeg图像使用‘convert‘ 命令
convert doc.pdf doc.jpeg
要将 pdf 文件转换成转换成 tiff
convert doc.pdf doc.tiff
$2 pdf的合并、分解、旋转等操作
如果说PDF是电子纸张,那么pdftk就是电子起钉器、打孔机、粘合剂、解密指环和 X光镜片。Pdftk是一个简单的工具,可以对PDF文档进行各种日常操作。Pdftk可以让你简单而自由地操作PDF。它不需要Acrobat,并且可以运行在 Linux, Windows, Mac OS X, FreeBSD和Solaris之上。在Debian/Ubuntu中你可以通过apt安装pdftk:
$ sudo aptitude install pdftk
将两个或更多个PDF合并成一个新文档
pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf
或者 (使用句柄):
pdftk A=1.pdf B=2.pdf cat A B output 12.pdf
或者 (使用通配符):
pdftk *.pdf cat output combined.pdf
将多个PDF中选定的页面分离出来并形成一个新文档
pdftk A=one.pdf B=two.pdf cat A1-7 B1-5 A8 output combined.pdf
将PDF的第一页顺时针旋转90度
pdftk in.pdf cat 1E 2-end output out.pdf
将整个PDF文档的页面旋转180度
pdftk in.pdf cat 1-endS output out.pdf
$3 pdf中提取信息(文字、图片等)
$3.1 pdf中提取文字信息
pdftotext将可移植文档格式(PDF)文件转换成纯文本,前提是pdf文件中包含文字信息。
如果文本文件未指定, pdftotext将file.pdf转换成file.txt。
pdftotext example.pdf example.txt
转换第3到7页(包括3和7)使用
pdftotext -f 3 -l 7 example.pdf example.txt
$3.2 pdf中提取图片信息
pdfimages 从可移植文档格式(PDF)文件中提取图片,保存为可移植像素图(PPM), 可移植位图(PBM), 或者JPEG文件。Pdfimages读取PDF文件,扫描一个或多个页面,并将每一个图像写入一个名为image-root-nnn.xxx的PPM、PBM或者JPEG文件,其中nnn是图像编号,xxx是图像类型(.ppm, .pbm, .jpg)。Pdfimages从PDF文件提取原始图像数据,不做任何额外的变化。任何PDF内容流里的旋转,剪切,颜色反转等动作都被忽略。
从example.pdf提取所有的图像。图像会被保存为PPM格式
pfdimages example.pdf exampleimage
使用-j选项将图像保存为JPG格式
pfdimages -j example.pdf exampleimage
使用-f和-l选项制定起始页和结束页。为了扫描第3至7页(包括3和7)使用:
pfdimages -f 3 -l 7 example.pdf exampleimage
只扫描指定的某一页使用
pfdimages -f 3 -l 3 example.pdf exampleimage
---恢复内容结束---
$1 pdf 转换成eps,jpeg等操作
$1.1 pdf 转换成eps操作
pdftops -eps source.pdf object.eps
其中source.pdf为所需要转换的原文件pdf,object.eps为转换后对应的eps名称,如果object.eps没有则系统默认的会将文件名命名为和原文件一样,只是后缀变成对应的eps文件。
$1.2 pdf转换成jpeg,tiff操作
首先机器上必须已经安装 ImageMagick:
sudo aptitude install imagemagick
要将 pdf 文件转换成jpeg图像使用‘convert‘ 命令
convert doc.pdf doc.jpeg
要将 pdf 文件转换成转换成 tiff
convert doc.pdf doc.tiff
$2 pdf的合并、分解、旋转等操作
如果说PDF是电子纸张,那么pdftk就是电子起钉器、打孔机、粘合剂、解密指环和 X光镜片。Pdftk是一个简单的工具,可以对PDF文档进行各种日常操作。Pdftk可以让你简单而自由地操作PDF。它不需要Acrobat,并且可以运行在 Linux, Windows, Mac OS X, FreeBSD和Solaris之上。在Debian/Ubuntu中你可以通过apt安装pdftk:
$ sudo aptitude install pdftk
将两个或更多个PDF合并成一个新文档
pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf
或者 (使用句柄):
pdftk A=1.pdf B=2.pdf cat A B output 12.pdf
或者 (使用通配符):
pdftk *.pdf cat output combined.pdf
将多个PDF中选定的页面分离出来并形成一个新文档
pdftk A=one.pdf B=two.pdf cat A1-7 B1-5 A8 output combined.pdf
将PDF的第一页顺时针旋转90度
pdftk in.pdf cat 1E 2-end output out.pdf
将整个PDF文档的页面旋转180度
pdftk in.pdf cat 1-endS output out.pdf
$3 pdf中提取信息(文字、图片等)
$3.1 pdf中提取文字信息
pdftotext将可移植文档格式(PDF)文件转换成纯文本,前提是pdf文件中包含文字信息。
如果文本文件未指定, pdftotext将file.pdf转换成file.txt。
pdftotext example.pdf example.txt
转换第3到7页(包括3和7)使用
pdftotext -f 3 -l 7 example.pdf example.txt
$3.2 pdf中提取图片信息
pdfimages 从可移植文档格式(PDF)文件中提取图片,保存为可移植像素图(PPM), 可移植位图(PBM), 或者JPEG文件。Pdfimages读取PDF文件,扫描一个或多个页面,并将每一个图像写入一个名为image-root-nnn.xxx的PPM、PBM或者JPEG文件,其中nnn是图像编号,xxx是图像类型(.ppm, .pbm, .jpg)。Pdfimages从PDF文件提取原始图像数据,不做任何额外的变化。任何PDF内容流里的旋转,剪切,颜色反转等动作都被忽略。
从example.pdf提取所有的图像。图像会被保存为PPM格式
pfdimages example.pdf exampleimage
使用-j选项将图像保存为JPG格式
pfdimages -j example.pdf exampleimage
使用-f和-l选项制定起始页和结束页。为了扫描第3至7页(包括3和7)使用:
pfdimages -f 3 -l 7 example.pdf exampleimage
只扫描指定的某一页使用
pfdimages -f 3 -l 3 example.pdf exampleimage
运维网声明
1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网 享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com