Эта заметка - продолжение публикации Запуск и остановка Azure серверов по расписанию v2. В ней рассказывается о скрипте, который проверяет состояние серверов и отправляет письма об ошибках запуска виртуальных машин администраторам системы, что им необходимо подключиться к порталу Azure и проконтролировать процесс.
Предпосылкой к созданию скрипта проверки стала нестабильность облака Azure, а конкретно то, что команды на включение виртуальных машин могут не исполняться ввиду физической ограниченности ресурсов в датацентрах Azure ("The hardware cluster where the VM is currently deployed did not have enough capacity..."), о чем я писал в предыдущей заметке.
В этом скрипте используется новый модуль взаимодействия PowerShell с облаком Azure, поэтому я расскажу более подробно, как создать новую учетную запись автоматизации. Уже имеющуюся учетную запись автоматизации из скриптов запуска-остановки виртуальных машин использовать без обновления модулей нельзя, а обновлять модули нельзя, так как в скриптах используются старые команды.
- Запуск сервиса через 30 минут от команды на запуск серверов - каждый час.
- Вход в подписку от имени сервисной учетной записи.
- Сканирование всех виртуальных машин в указанном регионею.
- Поиск тегов "Schedule Start" у которых значение равно текущему часу (те же самые метки, которые используются для скрипта запуска серверов).
- Проверка у найденных объектов тега "Schedule Days", если в нем есть текущий день недели, или тег "Schedule Days" отсутствует вообще (разрешены все дни недели).
- Проверка состояния найденных виртуальных машин (запущены ли).
- Запуск отфильтрованных виртуальных машин.
- Запись выполненного действия в тег "Comment" для каждого обработанного объекта.
- Отправка письма администраторам сервиса о найденных незапущенных серверах, что необходимо проконтролировать их.
Для запуска задания от сервисной учетной записи необходимо создать объект типа Automation Account. В моем примере он будет называться aac-Infrastructure.
Итак, необходимо создать новый объект Automation.
data:image/s3,"s3://crabby-images/83443/834435b2d0cb760d5458b03c7ebdca5d524afdc1" alt="Check not started Azure instances - 01"
Ввести название, например aac-Infrastructure, подписку, ресурсную группу, датацентр (локацию) и выбрать создание учетной записи Azure Run As account.
data:image/s3,"s3://crabby-images/58305/58305a724fe85208db5b2ede9f4c928eca9236ca" alt="Check not started Azure instances - 02"
В свойствах созданного объекта Automation account необходимо перейти в раздел подключаемых модулей Modules и установить новые модули из галереи Browse gallery.
data:image/s3,"s3://crabby-images/e35d9/e35d98273e6107a7a52ce70b91a1135fc8300a23" alt="Check not started Azure instances - 03"
Модули используются для правильной обработки команд PowerShell, которые обращаются к объектам Azure. Список модулей, которые необходимо установить:
- Az.Accounts
- Az.Compute
- Az.KeyVault
- Az.Network
- Az.Profile
- Az.Resources
data:image/s3,"s3://crabby-images/d5ca5/d5ca5cb49a2737daba1ebe3667e787bfd919e549" alt="Check not started Azure instances - 04"
data:image/s3,"s3://crabby-images/e3794/e3794e86db7d0ca9a0b5335969ff2e9c487b29da" alt="Check not started Azure instances - 05"
data:image/s3,"s3://crabby-images/a796f/a796fc1cd08e3829b378f81dbc4d27212ce89017" alt="Check not started Azure instances - 06"
В конечном итоге раздел Modules должен выглядеть вот так:
data:image/s3,"s3://crabby-images/53cee/53cee97c6d907efe004c7cb30171e58b66e3b44a" alt="Check not started Azure instances - 07"
Служебная учетная запись Automation создана. Теперь можно переходить к созданию учетной записи SendGrid.
SendGrid - это специальный сервис Azure, который занимается рассылкой сообщений. Чтобы воспользоваться этим сервисом, необходимо создать учетную запись SendGrid.
Необходимо создать новый объект SendGrid.
data:image/s3,"s3://crabby-images/da31f/da31fd0a21b7c55e90909d7525f9a4a5b49fc5e4" alt="Check not started Azure instances - 08"
Ввести название, например sga-Infrastructure, подписку, ресурсную группу, датацентр (локацию), пароль к новой учетной записи, тип подписки и заполнить контактные данные. При первом входе в портал SendGrid сервис потребует подтвердить e-mail, который указан в контактных данных.
data:image/s3,"s3://crabby-images/1a7c1/1a7c1a60201d6d087a5035455b197c07b912f376" alt="Check not started Azure instances - 09"
В созданном объекте нажать на кнопку управления Manage, чтобы перейти в портал SendGrid.
data:image/s3,"s3://crabby-images/00ca7/00ca799c0177639ecd4d7d06b789e0225c8a29cb" alt="Check not started Azure instances - 10"
В портале SendGrid перейти в раздел настроек Settings на вкладку API keys и создать новый ключ доступа для API запросов Create API key.
data:image/s3,"s3://crabby-images/24d24/24d2407f9990a8813349e96954fe611767da829f" alt="Check not started Azure instances - 11"
Дать названию новому ключу, например Send e-mail from Azure Automation Account, назначить полные права FullAccess на доступ у функционалу SendGrid и создать ключ.
data:image/s3,"s3://crabby-images/4fa25/4fa252a26565d1e7fd1a6724604b9c97b2769eee" alt="Check not started Azure instances - 12"
Скопировать и сохранить полученный пароль к ключу, так как в дальшейшем он показываться не будет. В моем примере это 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.
data:image/s3,"s3://crabby-images/2d366/2d36664b34d976c4431c8672ba3b03d143fd32f5" alt="Check not started Azure instances - 13"
Скопировать и сохранить идентификатор ключа. В моем примере это 2wbBs9ItQVKIaabCZqPVLQ.
data:image/s3,"s3://crabby-images/58e1c/58e1ca62c58f4dc61a9489e39cac0ef2bf565e99" alt="Check not started Azure instances - 14"
Учетная запись SendGrid создана и готова к использованию.
Key Vault - это специальное хранилище паролей, токенов, сертификатов, ключей API и других секретных сведений со строгим контролем доступа к ним.
Чтобы воспользоваться сервисом, необходимо создать хранилище ключей Key Vault.
data:image/s3,"s3://crabby-images/a636c/a636c8e27724386f02c0e7afff30ea4d54975894" alt="Check not started Azure instances - 15"
Ввести название, например key-Infrastructure, подписку, ресурсную группу, датацентр (локацию) и прочие параметры.
data:image/s3,"s3://crabby-images/80b05/80b05bc289ac0f520c2261e322caf60cbdf3c25f" alt="Check not started Azure instances - 16"
В созданном хранилище ключей перейти в раздел секретов Secrets и создать новую запись.
data:image/s3,"s3://crabby-images/bceb1/bceb157fa4ab4d018caf8356c9e45b9ba91ae572" alt="Check not started Azure instances - 17"
Ввести данные API ключа, полученного в сервисе SendGrid. В моем случае это идентификатор ключа 2wbBs9ItQVKIaabCZqPVLQ и пароль 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. Другие параметры выставлять не нужно.
data:image/s3,"s3://crabby-images/53d6f/53d6f951e3f8fcaf98efa5a65582ae6b775875d3" alt="Check not started Azure instances - 18"
Далее необходимо настроить доступ к хранилищу ключей - выдать учетной записи автоматизации доступ на чтение ключей. Это делается в разделе Access policies.
data:image/s3,"s3://crabby-images/0fa45/0fa45110728a8b830f7d963d2f0f3b94aa970b28" alt="Check not started Azure instances - 19"
В новой политике доступа необходимо выбрать доступ на чтение List и получение Get к секретам Secret permissions для учетной записи aac-Infrastructure.
data:image/s3,"s3://crabby-images/ad5fa/ad5fabf60dff84f3e726a56da6656a63ec26cea8" alt="Check not started Azure instances - 20"
Проверить список доступов и сохранить его.
data:image/s3,"s3://crabby-images/c06c5/c06c5eb74e17853c07dac2c3bf60a67bed165a2c" alt="Check not started Azure instances - 21"
Хранилище ключей готово.
Последним объектом, необходимым для задачи, является книга запуска Runbook, которая хранит в себе скрипт PowerShell и его настройки запуска.
Необходимо открыть созданную ранее учетную запись автоматизации acc-Infrastructure, перейти в раздел книг запуска Runbooks и создать новую книгу.
data:image/s3,"s3://crabby-images/72fc5/72fc593cdeae8e6361deee12ef9c99d87c69ec4c" alt="Check not started Azure instances - 22"
Ввести имя, например run-NotStartedInstances, и тип скрипта Powershell.
data:image/s3,"s3://crabby-images/d218a/d218a0d78d3e9a6ccf40f5c5a7ebca0760954087" alt="Check not started Azure instances - 23"
Вставить текст скрипта (приведен ниже), настроить переменные в начале текста скрипта, сохранить и опубликовать книгу запуска.
data:image/s3,"s3://crabby-images/d9da7/d9da78f2235687405b6116a7a10aaa0cf216a655" alt="Check not started Azure instances - 24"
Связать созданную книгу с расписанием.
data:image/s3,"s3://crabby-images/1a0f9/1a0f9a9ec64bcc22d6d548e86c5479fa5c36cea0" alt="Check not started Azure instances - 25"
Создать новое расписание с именем Run script every hour at 30 min, выставив первое время запуска в 5:30 и повторение каждый час.
data:image/s3,"s3://crabby-images/92885/92885f2936541b1b9c600e489400fd23db4b9725" alt="Check not started Azure instances - 26"
Книга запуска готова.
# ------------------------------------------------------------------------------------------------ Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "----- The script started -----") # ------------------------------------------------------------------------------------------------ # Defining variables $Subscription = "Subscription_Name" $EmailToAddress = "AzureAdmins@domain.com" $EmailSubject = "Azure not started instances" $TagsTimeZone = "Central Europe Standard Time" $TagsTimeZoneAbbreviation = "CET" $Location = "westeurope" # ------------------------------------------------------------------------------------------------ Function SendEmail($To, $Subject, $Message) { $FromEmailAddress = "noreply@domain.com" $FromName = "Azure no reply" $VaultName = "key-Infrastructure" $SecretKeyName = "2wbBs9ItQVKIaabCZqPVLQ" $SENDGRID_API_KEY = (Get-AzKeyVaultSecret -VaultName $VaultName -Name $SecretKeyName).SecretValueText $headers = New-Object "System.Collections.Generic.Dictionary[[String],[String]]" $headers.Add("Authorization", "Bearer " + $SENDGRID_API_KEY) $headers.Add("Content-Type", "application/json") $EmailBody = @{ "personalizations" = @( @{ "to" = @( @{ "email" = $To } ) "subject" = $Subject } ) "content" = @( @{ "type" = "text/html" "value" = $Message } ) "from" = @{ "email" = $FromEmailAddress "name" = $FromName } } $BodyJson = $EmailBody | ConvertTo-Json -Depth 4 Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Sending e-mail to $To") Invoke-RestMethod -Uri https://api.sendgrid.com/v3/mail/send -Method Post -Headers $headers -Body $bodyJson | Out-Null } # ------------------------------------------------------------------------------------------------ # Logging on to Azure portal Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Logging in to Azure") $AutoConnection = Get-AutomationConnection -Name AzureRunAsConnection Connect-AzAccount -ServicePrincipal -Tenant $AutoConnection.TenantID ` -ApplicationId $AutoConnection.ApplicationID ` -CertificateThumbprint $AutoConnection.CertificateThumbprint | Out-Null # ------------------------------------------------------------------------------------------------ # Executing commands in Azure portal # Making time filter Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "System time zone = " + ([TimeZoneInfo]::Local).Id) Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Current system time = " + (Get-Date -Format "dd.MM.yyyy HH:mm, ddd") ) $TagsTime = ([System.TimeZoneInfo]::ConvertTimeBySystemTimeZoneId((Get-Date), $TagsTimeZone)).ToString("dd.MM.yyyy HH:mm, ddd") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Tags time zone = $($TagsTimeZone)") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Tags time = $($TagsTime)") $START_TIME = ([System.TimeZoneInfo]::ConvertTimeBySystemTimeZoneId((Get-Date), $TagsTimeZone)).ToString('H:00') $START_DAY = ([System.TimeZoneInfo]::ConvertTimeBySystemTimeZoneId((Get-Date), $TagsTimeZone)).ToString('ddd') Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Adapting time to search for ""$($START_TIME)"" in tags") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Looking for instances where ""Schedule Start"" tag = ""$($START_TIME)"" ...") [array]$VMs = Get-AzVm -Location $Location | Where-Object {$PSItem.Tags["Schedule Start"] -eq $START_TIME} Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "$($VMs.Count) instances found") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "Processing the instances...") $FoundFlag = $false ForEach ($VM in $VMs) { Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "$($VM.Name) instance in $($VM.ResourceGroupName) resource group:") $VMTags = $VM.Tags Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " Checking the ""Schedule Days"" tag ...") If ( -not($VMTags.Keys -contains "Schedule Days") -or $VMTags["Schedule Days"].Split(',').Trim() -contains $START_DAY ) { Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " The instance is allowed to be processed today" ) Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " Checking the instance status ...") $VMStatus = (Get-AzVM -ResourceGroupName $vm.ResourceGroupName -Name $vm.Name -Status).Statuses[1].DisplayStatus If ($VMStatus -ne "VM running") { $FoundFlag = $true Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " The instance is in ""$($VMStatus)"" state") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " The instance name is added into the report") $FoundServers += "- " + [string]$vm.Name + " (" + $VM.Tags["Description"] + ")</br>" Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " Starting the instance") Start-AzVM -Name $VM.Name -ResourceGroupName $VM.ResourceGroupName -AsJob | Out-Null Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " Updating COMMENT tag for the instance") $VMTagCommentText = ("Started by Status Checker at " + ` ([System.TimeZoneInfo]::ConvertTimeBySystemTimeZoneId((Get-Date), $TagsTimeZone)).ToString("dd.MM.yyyy HH:mm") + ` " $($TagsTimeZoneAbbreviation)") If (-not($VMTags.ContainsKey("Comment"))) { $VMTags.Add("Comment", $VMTagCommentText) } Else { $VMTags["Comment"] = $VMTagCommentText } Set-AzResource -ResourceGroupName $VM.ResourceGroupName -Name $VM.Name -ResourceType "Microsoft.Compute/VirtualMachines" ` -Tag $VMTags -Force -AsJob | Out-Null } Else { Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " The instance is in ""$($VMStatus)"" state") Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " No action needed") } } Else { Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + " The instance is not allowed to be processed today" ) } } If ($FoundFlag -eq $true) { $Report = "" $Report += "<body style=""font-family: Consolas, 'Courier New', monospace; font-size: 10pt;"">" $Report += "<h2>Report for $Subscription subscription</h2>" $Report += "<h3>Not started instances:</h3>" $Report += "<div>" + $FoundServers + "</div>" $Report += "</br>" $Report += "<div>The mentioned instances were not started after sending the <i>Start-Stop Scheduler</i> start command.</br>" $Report += "The <i>Status Checker</i> tried to start the instances again.</div>" $Report += "</br>" $Report += "<div style=""color: Red;""><b>Please login to the Azure portal and check the instances states.</b></div>" $Report += "</body>" SendEmail -To $EmailToAddress -Subject $EmailSubject -Message $Report } Write-Output ((Get-Date -Format "HH:mm:ss") + ": " + "----- The script stopped -----") Write-Output (Get-Job)
Если скрипт находит незапущенный сервер, то он пытается запустить его и отправляет письмо администраторам, что необходимо проконтролировать процесс.
data:image/s3,"s3://crabby-images/d256b/d256b588e3992cabe8a59dac41659f819859968f" alt="Check not started Azure instances - 27"