设为首页 收藏本站
查看: 1931|回复: 0

[经验分享] 关于Exchange邮箱服务器角色故障排查及解决思路分享

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-5-4 14:05:13 | 显示全部楼层 |阅读模式
  在最近一次关于Exchange服务器故障中,出现了员工无法进入邮箱的问题,最直接方法来登录OWA页面,看看正常不正常,反映出来的报错信息如下: wKiom1VB4w3RhZVkAAFNMoBWvUs433.jpg
     当接到这个报障后,第一时间,当时有人问到是不是公司的CAS服务器挂了?当然还是如果对邮件服务器足够了解的话, 这个报错一定不是邮箱服务器CAS出现故障,因为如果CAS出现问题,您也到不了这个页面的,所以根据产品提供服务来判断,能打开OWA页面,说明CAS服务器是正常的,出现这个报错是在用户输入帐号和密码后出现的,那么其实不用去思考,故障点一定出现在邮箱服务器角色上,好带着这个排错思路我们来看看邮箱服务器角色吧。
     当打开EMC控制台时,所以数据库全为宕的状态,所以这也就是为什么用户在网页方式输入邮箱帐号及密码后,提示邮箱不可用的原因了,但是数据库全为宕状态的根本原因又是什么呢?根据经验有极大的可能是邮箱数据库所在的存储盘满了,OK,那么来看看,发现数据库所在磁盘可用空间为几百KB。
     现在要做的事情,就是尽快清理出空间来先恢复主体业务,可用方法有如下:
1.数据库采用了DAG,那么可以先把副本库删除,保证每个主数据库所在的磁盘有足够的空间,但是隐性的风险在于如果主数据库宕掉,又恢复不起来,那故障影响范围就更大了。
2.通过清除Log的方法释放空间,此方法还是比较稳妥的,至少能先把主、副数据库挂起来,而且不会影响业务使用。
3.开启日志循环功能,但需要卸载故障数据库,且需要时间等待。
     所以最后选择了第二种方法,清除Log,那么OK,这里我采用如下命令清理数据库log文件,GUI下也可以,但是数据量过大,很有可能会导致系统假死,而且清理起来要比较费事。
forfiles /s /m *.log /d -4 /c "cmd /c del @file /f"
上边这条命令的意思是删除4天前的日志,清理后发现空间释放出来几十个G,再来看数据库状态,已经正常挂载和同步,那么OK,此时至少在邮件量不大的情况下能恢复业务。
   好,接下来就要考虑的是如何增加存储的问题了,由于环境中是在esxi中搭建的虚拟化,方法有如下几种:   
1.直接对邮箱服务器角色存储盘扩容,但由于是生产,所以还是有一定风险,如果扩盘失败,那么会带来邮箱服务器整体真正宕机。
2.新增单独的存储盘,并且由于之前是日志与edb数据库文件位于同一个盘下,所以我们在增加新的存储盘时,要增加2块,一块用于存放edb文件,另一块用于存放log文件,也在数据库的恢复性上做了优化这样,增加新存储盘后,再新建新的数据库,将原存储盘中较大的数据库邮箱进行迁移,此项操作虽比较耗时,但是还是相对来说比较稳妥的方法。
3.增加新的邮箱服务器角色,将出问题的原存储盘中的邮箱数据库分别增加副本至新的邮箱服务器中,但是此方法虽也是比较稳妥的方法,但是从服务器增加搭建再到同步副本,仍是很慢的方法。
     所以最终在解决根本性问题时,选择了方法二,这样既能调优Exchange数据库存放结构,又保证不会出现更大的问题,唯一可能要注意的就是要时时观察原数据库存储盘,如是空间接近不足时,要用上述命令删除日志,来保证迁移的顺利,当然也通过这种方法起到了释放空白空间的作用,迁移结束后,先将原数据库卸载,观察如果邮箱无问题,就可以直接删除旧的数据库了。
    当然,存储盘是有限的,而日志文件的增长又是比较迅速的,所以尽可能在企业环境中增加备份软件对日志进行备份来减少日志增加量及完整性,如果实在没有条件搭建备份平台,那么也可以数据库新建后,开启日志循环功能,来控制日志容量的增长。
    当然,最后还想说的是运维工作本身是一件非常谨慎的事情,所以遇到事情还是应该冷静下来,先确认问题点,快速恢复业务,同时找到最稳妥的解决办法来保证从根本防止此类故障问题,这次故障其实还有一个原因就是上一代管理员在对邮件平台规划中并没有考虑到更长远的问题,数据库存储空间不做规划,导致数据库日志在增长后,无法及时清理,所以做任何平台,都应该本着规划为先,测试及评估为中,实施为后的思想,多想想当前规划是否会成为自己运维的增加了更大的风险。
    这篇文章只起到一个排错思路的分享,更多的还是然望能通过这个案例,来说明存储空间及备份在企业中的根本作用和必要性。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-63606-1-1.html 上篇帖子: Exchange Server 2010数据库崩溃还原过程 下篇帖子: 关于Exchange Server 2010中OWA页面无法打开问题处理方法
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表