ArcGIS Enterprise 組織をアクティブに監視すると、システムの稼働時間を安定させたり、サービスのパフォーマンス上の問題やサービスの停止を特定したり、基になるアプリケーションを実行するために参加しているすべてのコンピューターに割り当てられたリソースを事前に調整したりすることができます。 監視ソリューションでは、よく使用されるエンドポイントに対して有効なチェックを実行し、応答が想定内の許容範囲を超えた場合にその旨を適切な連絡先に通知することができます。 また、監視ソリューションを使用すると、根本原因分析や事後調査の実施中にシステム ログとソフトウェア ログで裏付ける履歴情報を収集することもできます。
ArcGIS Monitor を使用して ArcGIS Enterprise 組織を監視できる一方で、サードパーティ製のツールでも同様の結果を得ることができます。 監視ソリューションを ArcGIS Enterprise と統合する方法の開始点となる情報を次に示します。
指標の監視
通常は、リソース使用率およびユーザー エクスペリエンスという 2 つの観点からエンタープライズ アプリケーションを監視できます。
リソース使用率は、エンタープライズ ソフトウェアが実行されている一連のコンピューターと支援基盤の特性に関わるという点で、システム管理ではよく知られた概念です。 この指標は通常、プラットフォームにアクセスするユーザーの数に比例してスケーリングされますが、一部のワークフローでは使用率が急上昇することもあります。
一方、ユーザー エクスペリエンスの監視では、クライアントがどのようにフロントエンド アプリケーションに接続して操作するかが明らかになります。これは、ビジネス アナリストや GIS 管理者がよく理解している概念です。 この指標は、さまざまな要求の基準となる応答時間を決定する上で有効であり、この指標を使用して、管理チームに警告が送られる閾値を設定することができます。 また、ユーザー エクスペリエンスには、SSL 認証の有効期限など、応答時間以外に考慮が必要な側面もあります。
後続のサブセクションでは、リソース使用率の観点からシステムを監視する方法を説明します。
リソース使用率
リソース使用率の観点から ArcGIS Enterprise 配置のコンピューターを監視する場合に追跡する指標を次に示します。
- プロセッサ - 参加しているコンピューターのプロセッサの容量が急増するか、100 パーセントに達すると、計算要求が未処理として保持されるため、情報が遅れて返されることがあります。 このことは、実行中のプロセスでアクティビティの処理量が急増した場合にも当てはまります。
- 物理メモリ - 物理メモリの使用率が 100 パーセントに近づくと、実行中のプロセスがメモリ領域をさらに拡張しようとするため、クラッシュが発生することがあります。 仮想メモリが存在する場合は、この状況が軽減されます。
- 仮想メモリ - 仮想メモリは、コンピューターの物理メモリと基になる格納領域との間のバッファーになります。 基になる格納領域の一部が物理メモリ外でのデータのやり取りに使用され、仮想メモリは、ディスクから直接読み込む方法よりも簡単に利用できます。 Linux システムの場合、仮想メモリの枯渇による悪影響はあまり見られませんが、スワップ領域の使用率を監視することも重要となります。
- コミット済みメモリ - システムのコミット済みメモリの容量は、コンピューターの物理メモリの容量に特定の時点での仮想メモリのサイズを加算して求められます。 仮想メモリは拡張するため、時間の経過に伴ってコミット済みメモリの制限が変化することがあります。 コンピューターでコミット済みメモリの使用率が 100 パーセントに近づいている場合は、物理メモリと仮想メモリがどちらも枯渇しかけているので、リソースを増設する必要があります。
- ディスク ボリューム空き容量 - システム、アプリケーション、またはシステム上のディスク ボリュームのいずれかのディスク空き容量が不足すると、実行中のオペレーティング システムとこれらのボリュームに依存しているアプリケーションのどちらにも重大な影響が及ぶ場合があります。 空き容量を監視すると、システムでディスク空き容量が不足していないかを確認し、使用容量が急増したタイミング (異常な公開イベントを示唆している可能性がある) を特定することができます。
システムを監視する場合は、ネットワーク上のボトルネック (エンタープライズグレードのネットワーク環境ではまれにしか発生しない) が ArcGIS Enterprise コンポーネントの最適な応答時間に影響を与える点に注意してください。 すべての ArcGIS Enterprise コンポーネント、他の登録済みデータソース、他の登録済みファイル サービスの間で複数の内部要求がやり取りされる複数コンピューター環境では、この影響がさらに大きくなる可能性があります。
可能な場合は、プロセッサとメモリをプロセスごとのリストに分割して、特定の期間に使用率が急上昇したプロセスを特定します。 このレベルの粒度を監視で使用する場合は、プロセスのコマンド ライン部分で、ArcGIS Enterprise の内部コンポーネントを互いに区別したり、リアルタイムのウイルス対策スキャンなどと区別したりすることができます。
ArcGIS Enterprise コンポーネントがインストールされているコンピューターだけでなく、操作を正しく実行するために配置が依存する可能性のあるファイル サーバーとデータベース インスタンスも監視します。 ArcGIS Enterprise アプリケーションは通常、最小のリソース消費レベルで開始されます。 アプリケーションにアクセスして使用すると、リソース消費量がリソース使用率に比例してスケーリングされます。
リソース指標の収集
デフォルトでは、ほとんどのベース Linux ディストリビューションに含まれていませんが、コンピューターのリソース指標の問い合わせと収集に対応したソフトウェア パッケージがいくつか存在します。 上記のセクションで説明したリソース使用率指標を少なくとも配置内のすべてのコンピューターに関して収集します。これには、この指標を選択したソフトウェアのカウンターとして追加します。 サービスが低下または停止した場合は、ポーリングの頻度を上げて、停止状態になる前に実行されたプロセスとイベントをさらに詳しく把握することができます。
リソース指標の分析
収集ツールを選択し、コンピューターのリソース使用率データを取得したら、リソース指標を分析できます。 リソース指標を分析する際には、次の点を考慮してください。
- 問題の存続期間 - 単発のイベントが発生したか長期的な問題が発生したかを把握することは、ほとんどの状況で最適な方策の決定に役立ちます。 リソース使用率の短期的な急上昇は、新しくリリースされたダッシュボードまたは Web アプリを追加する場合や部署をポータルに追加する場合など、特定のサービスで需要が急速に拡大した場合に発生する傾向があります。 現在の使用率に至るまで長期的に上昇している場合は、プラットフォームとそれに関連するサービスまたはアプリケーションの需要が高まっている可能性があります。 短期的な急上昇は再発する場合と再発しない場合があるので、配置の長期的な安定性を高めるためにリソースを増設する必要があるかどうかを確認する上で、該当するイベントを取り巻く状況を把握することが重要となります。
- システムのリソースの大部分を消費するプロセス - Portal for ArcGIS と ArcGIS Data Store の観点から見ると、それぞれプラットフォーム上のユーザーの数とホスト サービスの使用に比例してほぼ直線的にリソース使用率がスケーリングされます。 ArcGIS Server では、専用サービスのスケーリングとホスト サービスの使用がリソース使用率の 2 大要因になります。 ArcGIS Server サイトで専用サービスを調整して、リソース使用率を全体的に下げることができますが、時間の経過に伴って需要がピークに達すると、この処置が十分でなくなる場合があります。
- 役割の分担 - ArcGIS Enterprise 配置内の複数のコンピューター間で役割を分担させることで、コンポーネントごとにリソースをより注意深く調整したり、問題が発生した場合にその問題をより詳しく把握したりできるようになります。 目的によっては、1 台のコンピューターによるエンタープライズ配置用にリソースを増設するよりも、リレーショナル データ ストア コンピューターまたはホスティング サーバー コンピューターに専用のリソースを増設した方が有効な場合があります。 [サイトに参加] 操作で現在のサイト アーキテクチャに調整を加えると、確立済みの配置で 1 台のコンピューターから分散アーキテクチャに移行させることができます。
問題の解決
コンピューターのリソース指標を特定、追跡、分析できるようになったら、想定外のシステム応答に対処することができます。 つまり、割り当てるプロセッサ リソースの数を増やすか、RAM をさらに割り当てまたは増設するか、ディスク空き容量を増やします。 処置を取る前に、リソース使用率の問題を解決するためのベスト プラクティスを把握しておく必要があります。
プロセッサ使用率
コンピューターに割り当てるプロセッサ リソースの数を増やし、プロセッサの使用率を上げる前に、使用率の急上昇の原因となっているのが ArcGIS Enterprise コンポーネントであるかシステム上の他のソフトウェアであるかを特定します。 セキュリティ ソフトウェアでリアルタイム スキャンが有効になっていると、Web サーバーおよびデータベースの通常の操作時にプロセッサの使用率が上がることがあります。 この場合には、観測した動作をサイバーセキュリティ チームに報告してください。 仮想コンピューターでは、基になるホストがオーバープロビジョニングされ、これが仮想コンピューターで検出できないパフォーマンス上のボトルネックになる可能性があります。
物理メモリの使用率
物理メモリの使用率が 100 パーセントに近づいたら、コンピューターに RAM をさらに割り当てるか、RAM を増設することが必要となります。 上記のとおり、作業負荷を各専用コンピューターに分散させると、より細かくリソースを割り当てることが可能になり、現在のリソースの競合が軽減されますが、既存のコンピューターでメモリを増やすこともできます。 物理メモリの使用率が 100 パーセントに近づくと、使用可能な仮想メモリが枯渇することもあります。
仮想メモリとコミット済みメモリの使用率
仮想メモリとコミット済みメモリの使用率は通常、使用率が 100 パーセントに達した時点で同じパターンを示します。 仮想メモリを使用すると、システム上で利用可能なメモリよりも多くのメモリをプロセスで利用できます。また、プロビジョニングされたコンピューターを担当しているシステム管理者が静的に設定していない限り、通常は閾値まで自動的にスケーリングされます。 ページ ファイルを拡張するのに十分なディスク空き容量がある場合は、システム設定を変更して仮想メモリを増やしても構いません。
ディスク ボリューム空き容量
ディスク空き容量の枯渇は、ArcGIS Enterprise 配置で発生する可能性のある最も予測できない問題の 1 つです。 更新の試行が不完全な形で終わると、ファイルが空白になるか、切り捨てられる場合があります。この場合には、ソフトウェアを正常に開始することができません。 まず、登録済みのデータ ストアまたは他の場所に移動できる大規模なファイルを検索します。 不要なファイルを削除できない場合は、ディスク空き容量を増やす必要があります。 コンテンツ ディレクトリ (Portal for ArcGIS サイトの場合) やキャッシュ ディレクトリ (ArcGIS Server の場合) など、別の格納領域にシステム ディレクトリを移動させることもできます。
注意:
指定したディレクトリ <ディレクトリ> で上位 25 個のファイルをサイズ (バイト単位) 別に表示するには、次のコマンドを実行します。
sudo find <directory> -type f -printf '%s %p\n' | sort -nr | head -25
ルート ボリューム上での実行は長時間を要する場合があるので、このコマンドで子ディレクトリを指定しておくことをお勧めします。