设为首页 收藏本站
查看: 1117|回复: 0

[经验分享] PHP 实现 word/excel/ppt 转换为 PDF

[复制链接]

尚未签到

发表于 2017-12-30 06:09:17 | 显示全部楼层 |阅读模式
  前段时间负责公司内部文件平台的设计,其中有一个需求是要能够在线浏览用户上传的 office 文件。
  我的思路是先将 office 转换成 PDF,再通过 pdf.js 插件解析 PDF 文件,使其能在任何浏览器下查看。
  可以通过 PHP 的 COM 组件,调用其它能够处理 office 文件的应用程序,利用提供的接口来转换 PDF 文件。


OpenOffice
  OpenOffice 是一套开源跨平台的办公软件,由许多自由软件人士共同来维持,让大家能在 Microsoft Office 之外,还能有免费的 Office 可以使用。
  OpenOffice 与微软的办公软件套件兼容,能将 doc、xls、ppt 等文件转换为 PDF 格式,其功能绝对不比 Microsoft Office 差。
  OpenOffice 官网:http://www.openoffice.org/
  OpenOffice 下载:http://www.openoffice.org/download/index.html
DSC0000.png

  OpenOffice 需要 java 支持,请确认安装了 JDK,并配置了 JRE 环境变量。

1. 配置组件服务
  OpenOffice 安装完成之后,按 win+R 快捷键进入运行菜单,输入 Dcomcnfg 打开组件服务。
[组件服务] >> [计算机] >> [我的电脑] >> [DCOM配置] >> [OpenOffice Service Manager]

DSC0001.png

  右键打开属性面板,选择安全选项卡,分别在 启动和激活权限访问权限 上勾选自定义,添加 Everyone 的权限。
DSC0002.png

  ↑ 启动和激活权限 和 访问权限 都使用自定义配置
DSC0003.png

  ↑ 添加 Everyone 用户组,记得确认前先检查名称
DSC0004.png

  ↑ 两个自定义配置相同,允许 Everyone 拥有所有权限
  再选择标识选项卡,勾选交互式用户,保存设置后退出。
DSC0005.png


2. 后台运行软件
  安装完 OpenOffice 后,需要启动一次确认软件可以正常运行,然后再打开命令行运行以下命令:
  切换到安装目录:  cd C:\Program Files\OpenOffice 4\program
  后台运行该软件:  soffice -headless-accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
  PS:该命令只需要执行一次,就可以使软件一直在后台运行,即使重启服务器也不受影响。

3. 配置PHP扩展
  如果是 PHP5.4 以前的版本,需要在 php.ini 里把 com.allow_dcom = true 打开(即去掉前面的分号)。
  如果是 PHP5.4 之后的版本,则要在 php.ini 里增加一行扩展 extension = php_com_dotnet.dll
  重启 Apache 或 IIS 服务器,打印 phpinfo() 信息,检查 com_dotnet 扩展是开启。
DSC0006.png

  ↑ 检查 php 的 ext 目录中 是否存在 com_dotnet.dll 文件,如果没有请自行下载对应版本的 dll

4. 实现文件转换
  PDF 转换工具(支持 doc, docx, xls, xlsx, ppt, pptx 等格式)

DSC0007.gif DSC0008.gif   

class PDFConverter  
{
private $com;  

/**  * need to install openoffice and run in the background
  * soffice -headless-accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
*/  public function __construct()
  {
  try {
  $this->com = new COM('com.sun.star.ServiceManager');
  } catch (Exception $e) {
  die('Please be sure that OpenOffice.org is installed.');
  }
  }
  

  /**
  * Execute PDF file(absolute path) conversion
  * @param $source [source file]
  * @param $export [export file]
  */
  public function execute($source, $export)
  {
  $source = 'file:///' . ('\\', '/', $source);
  $export = 'file:///' . ('\\', '/', $export);
  $this->convertProcess($source, $export);
  }
  

  /**
  * Get the PDF pages
  * @param $pdf_path [absolute path]
  * @return int
  */
  public function getPages($pdf_path)
  {
  if (!($pdf_path)) return 0;
  if (!($pdf_path)) return 0;
  if ($fp = ($pdf_path, 'r')) {
  $page = 0;
  while (!($fp)) {
  $line = ($fp, 255);
  if (('/\/Count [0-9]+/', $line, $matches)) {
  ('/[0-9]+/', $matches[0], $matches2);
  $page = ($page < $matches2[0]) ? $matches2[0] : $page;
  }
  }
  ($fp);
  return $page;
  }
  return 0;
  }
  

  private function setProperty($name, $value)
  {
  $struct = $this->com->Bridge_GetStruct('com.sun.star.beans.PropertyValue');
  $struct->Name = $name;
  $struct->Value = $value;
  return $struct;
  }
  

  private function convertProcess($source, $export)
  {
  $desktop_args = array($this->setProperty('Hidden', true));
  $desktop = $this->com->createInstance('com.sun.star.frame.Desktop');
  $export_args = array($this->setProperty('FilterName', 'writer_pdf_Export'));
  $program = $desktop->loadComponentFromURL($source, '_blank', 0, $desktop_args);
  $program->storeToURL($export, $export_args);
  $program->close(true);
  }
  
}
  


PDFConverter.php  使用 PDFConverter(必须传入绝对路径)
  

$arr = array('doc', 'docx', 'xls', 'xlsx', 'ppt', 'pptx');  

  

$converter = new PDFConverter();  

  

foreach ($arr as $ext) {$source = __DIR__ . '/office/test.' . $ext;$export = __DIR__ . '/pdf/test.' . $ext . '.pdf';$converter->execute($source, $export);echo '<p>' . $ext . ' Done</p>';  
}
  


5. 查看PDF文档
  最后分享一个基于 HTML5 的 PDF 阅读器插件 pdf.js,它是 Mozilla 实验室在 GitHub 上开源的一款 js 库,专门用来读取 PDF 文件。
  由于是 Mozilla 的产品,所以在 Firefox 下表现的十分出色,并且只要是支持 HTML5 的浏览器,都能使用这款阅读器。
  项目地址:https://github.com/mozilla/pdf.js
  插件下载:http://mozilla.github.io/pdf.js/
DSC0009.png

  ↑ pdf.js 不能打开本地 pdf 文件,但可以通过 url 打开服务器上的文件,不支持跨域浏览 pdf
  使用方法:1)将插件解压,放置在网站的根目录;2)通过网址访问 viewer.html;3)添加 file 参数指定 pdf 路径;
  例如:http://localhost/pdfjs/web/viewer.php?file=/office/example.pdf

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-429549-1-1.html 上篇帖子: .net转PHP从零开始 下篇帖子: everest33
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表