日々是好日

これまで使ってきたOSSの備忘録です

ZabbixでDNSフェールオーバーを作ってみた(その2)

2.自社データセンターの障害監視

(1)  Web監視の設定

 ①「設定」ー「ホスト」ー「Zabbix server」ー「web」を開く。

 ②右上の「Webシナリオの作成」を開く。

 ③シナリオタブで、任意の名前を入力する。

 ④ステップタブを開き、「追加」をクリックする。

 ⑤Webシナリオのステップで任意の名前を入力し、URL欄に自社データセンターのWebサーバーのURLを入力する。 

f:id:sincnick:20210920223139p:plain

Webシナリオ

 ⑥追加ボタンをクリックする。

 ⑦追加ボタンをクリックする。

 

(2) トリガー条件の設定

 ①「設定」ー「ホスト」ー「Zabbix server」ー「トリガー」を開く。

 ②右上の「トリガーの作成」を開く。

 ③任意の名前を入力する。

 ④条件式の追加ボタンをクリックする

 ⑤アイテムは、上記(1)で追加したWeb監視の「Failed step of scenario・・・」を選択する

 ⑥関数は、sum()※を選択する。

  ※障害判定の例として、直近10回中5回接続に失敗した場合を障害とする。sum()ではなく、count()を利用する方法もある。

 ⑦「挿入」をクリックする

f:id:sincnick:20210920232425p:plain

トリガー条件式

 ⑧「追加」ボタンをクリックする。

 

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

【解説】

AWS Route53やAzure Traffic Managerを使わずに、Zabbixを利用するメリットは、上記2(2)の通り、細かく監視条件を指定できる点にある。特に〇回中〇回失敗した場合という条件式は、Route53やTraffic Managerではできない。(指定できるのは〇回連続で失敗した場合という条件になる)

 

私見だが、データセンターの障害は、まったく接続できなくなるというより、接続できたりできなかったりするケースのほうが多いと思っている。そのため、障害判定の条件は、連続〇回接続に失敗した場合ではなく、〇回中〇回接続に失敗した場合のほうが妥当だと思う。

 

なお、データセンターの障害監視としては、本来複数のURLを監視すべきだが、今回は説明の都合上、1URLとしている。

 

次回は、アクションの設定を説明する。