q986 发表于 2017-6-30 07:33:02

Automation监控Azure PaaS心跳

  前言:
  今天我们只谈技术,文章主要是抛砖引玉,主要谈一下Azure上如何通过Automation监控订阅下的PaaS资源的心跳,如果心跳发生变化自动发邮件通知。可以监控Azure PaaS的服务有:IoT Hub, Service Bus, Azure SQL, My SQL, Stream Analytics…… 总而言之,在ARM模式下Powershell可以Get到的资源都可以作为监控对象。
  在讲Azure Automation之前,我们先来宏观认识MS Automation如何做的,涉及哪些领域,对MS 在Automation之道来认识,来理解,那么我们就会深刻的理解Azure Automation。
https://mmbiz.qlogo.cn/mmbiz_png/uW17kp558ZpElYm7atX5ib0hQdqrNHt8OFkJhz4FzunghJSVJIbm07t5ia5jpQawr3EtlNQBjq8oMKx2HcYial0LQ/0?wx_fmt=png
  容我一次班门弄斧:MS是一家很注重合作伙伴关系的公司,这一点只要了解MS的小伙伴,都能认识合作伙伴的重要性,这个生态系统一直走的不错,举个例子:如果属于那一类的公司,一般都会发现,微软事业部在整个公司里的位置不可比拟,财大气粗。MS不知道养活了多少个企业。
  如上图Automation主要分为两个方向MS和Partners,对于Azure有Azure Automation和DSC,这里强调下Partners里的OEM厂商,毕竟Windows是MS的根基,举个例子:我们买笔记本:华硕,联想,惠普,戴尔…..大部分笔记本都是预装Windows,它是如何做呢,例如:Windows 10 厂商可以通过ADK里的ICD工具自定义镜像加入品牌相关的软件等,批量部署可以通过MDT或者与WDS结合,但是底层:一个共同点基于都是Windows Server通过Powershell DSC或Workflow去做。不过Azure的Automation 用到Powershell Workflow会更多点。重点不在这里,主要是让大家宏观认识Automation。
  为什么要监控PaaS服务:
  也许,好多人好奇,我们为什么要去监控Azure的PaaS服务,高可用,承诺客户99.9%的SLA,同样的Azure的新门户PaaS服务已经集成了监控,我们做这件事有什么意义呢?
  话说过来,同样的还有好多企业用Zibbx去监控IaaS层的运行状况,我相信运维人员在熟悉不过了,各有优略,而Zibbx应该是还不能去监控PaaS服务,这个问题就不做讨论了。
  AzureAutomation的机制:
  首先我们要认识一些术语:自动化账户,Runbook(编辑,发布),作业,资产。
  它们之间的关系大概是这样的:订阅管理者可以创建自动化账户这点毫无质疑,每个自动化账户可以对应多个Runbook, Runbook内容通常是Powershell 或者Powershell 流写成的我们需要实现的逻辑功能。
  Runbook可以是并行的,同样的同一个自动化账户下Runbook之间是可以互调,但是有子父关系以发布版本为准。Runbook有两种状态:编辑,发布。编辑主要是便于我们调试,因为Automation运行的环境和我们本地环境还是有一点点的差别。发布是Runbook的最终状态,如果我们运行Runbook就会运行发布状态。一旦发布每次Run 就会产生一个Job用来跟踪和记录Runbook的作业情况。
  Automation账户还有一个重要的概念是资产,在资产里我们可以导入Powershell 某一个模块,例如:最近在国外云市场挺火的的一个通讯平台Twilio,AWS物联网短信通知某一个环节就才正是它在发力。我们在Azure Automation只要把模块导入设置好连接也是可以这么做。同样的资产里可以添加凭据(连接串,加密证书),变量(可以加密),计划日程,连接(Twilio就是一个例子)这些概念和用途都不详细说了哈。
  简单说一个:变量,变量类型也挺多的,举个例子字符类型的,那么这个字符类型是全局的,同一个自动化账户下的任何一个Runbook都可以调用,这样的好处其一:减少我维护成本例如我把Azure SQL的Resource ID单独拿出来,无论以后这个Azure SQL迁移了订阅,我只需要修改下外面的字符就行,不用打扰Runbook的状态没必要重新更该里面的内容重新发布,重新规划,如果好多Runbook都调用这个变量,那样改起来岂不是累死了,嘿嘿。同样我可以加密,例如我的对其他订阅操作:把我要调用的ID 或者登陆ID加密。
  还有一个Fair share-机制每个Runbook运行每3个小时会重新调用一次(前提是循环作业),运行3次如果还没有完成会以失败状态:等待资源而结束
  如何监控Azure PaaSMy SQL心跳:
  FunctionSendmail($Service,$id,$status)
  {
  $pw=Get-AutomationVariable"pw";
  $Ps=ConvertTo-SecureString-String $pw-AsPlainText -force
  $Cred= New-ObjectSystem.Management..PSCredential("izero001@126.com",$Ps)
  $From= "mail"
  $To= "Mail"
  $Cc= "Mail"
  $Subject= "Subject"
  $Body= "**********************"
  ##############################################################################
  #This section sends a mail using 126 secure SMTP services.
  ##############################################################################
  Send-MailMessage`
  -To $To`
  -Cc $Cc`
  -Subject $Subject `
  -Body $Body `
  -UseSsl `
  -Port 25 `
  -SmtpServer'smtp.126.com' `
  -Priority High `
  -From $From `
  -BodyAsHtml`
  -Credential$Cred
  }
  $starttime= Get-Date;
  $mysqlid= "8888888888"
  $mysqlid_1= "88888888888"
  $mysqlid_2= "00000000000000"
  $mysqlid_3= "***************************"
  $mysqlidt= New-Object-TypeName System.Collections.ArrayList;
  $mysqlidt= $mysqlid,$mysqlid_1,$mysqlid_2,$mysqlid_3
  do{
  foreach($id in$mysqlidt)
  {
  ##############################################################################
  #This section is how to get MySQL status.
  ##############################################################################
  $mysql= "MySQL";
  $mysqlfaild= "Running";
  $mysqlstatus= Get-AzureRmResource-ResourceId $id| `
  Select-ExpandProperty Properties| `
  #?{$_.Code -match "runningState" } | `
  Select-ExpandProperty runningState;
  Write-Output$mysqlstatus;
  if($mysqlstatus -ieq$mysqlfaild)
  { Write-Output"MySQL服务正常";continue;}
  elseif($mysqlstatus)
  { Sendmail$mysql $id$mysqlstatus; Start-Sleep-Seconds 2; }
  else
  { Write-Output "状态值为空";}
  #############################################################################
  $endtime=Get-Date
  Write-OutputNew-TimeSpan $starttime$endtime
  Start-Sleep-Seconds 1
  $ts= New-TimeSpan$starttime $endtime
  $LimitTime= 20
  #if($ts.TotalSeconds-le $LimitTime)
  # { continue;}
  #          else {break;}
  } while($ts.TotalSeconds -le$LimitTime)
  主要实现的功能是MySQL的运行状态只要发生变化就会邮件通知我们,大家可以改下My SQL版本例如:MS2àMS1会检测第一个状态为Stopping,可以实践一下,代码很简单需要自己去研究,这是生产中已经使用的版本,觉得还很烂只是跟大家提供一种思路。但是样并不能解决根本问题,所以最好的方案是:我们通过Powershell去执行My SQL命令来检测其存活,当然了这是理想状况下需要我们自己研究可行性。
  那么,有时候我们不看邮件,例如过节了在家,没事把Twilio调出来,一旦异常就给我们打电话,发短信,对于运维人员来监控公司的核心业务有着非同凡响的意义。值得借鉴。
  AzureAutomation可以做什么?
https://mmbiz.qlogo.cn/mmbiz_png/uW17kp558ZpElYm7atX5ib0hQdqrNHt8O6FkJCGvHlb2oibq9NZnVVhwHESia0xVu4xqM2INZvBYY97iby8P4ovTEQ/0?wx_fmt=png
  上图已经清晰的告诉我们Azure Automation可以做什么了,能做的还很多很多,需要大家一起用心去挖掘。
  监控My SQL我们是通过RM下的资源Id去做的,衡子写了一篇很不错的文章RM下采用模板模式创建虚拟机,很好一个开始,慢慢以后大家会发现RM模式可以帮助我们做好多好多事情,省好多力,如果你是第一用云,我建议你还是用RM。
  同样的,举个例子:例如传统关闭虚拟机我需要指定 ServiceName 和实例Name,那么RM下批量关机,我只需要把虚拟机打上Tag(最多只有15个)例如Dev,那么我就会把所有的Dev机器关机,早上上班开机。这里不得不吐槽下Azure.portal.cn的Loc,把Tag翻译为计费标记,确实有这么一个用处这是出账单的时候,但是同样会误导部署的人进而没有完全把Azure的功能用起来,这一点应该严格对于做产品的来说。嘿嘿,不过有幸还是有人分享给大家哈。
  最后:谢谢你费这么大力气读到这里,感谢!
页: [1]
查看完整版本: Automation监控Azure PaaS心跳