ホットスポット分析—Portal for ArcGIS | ArcGIS Enterprise のドキュメント

[ホットスポット分析] ツールは、データの空間パターン内に統計的に有意なクラスターが存在するかどうかを判定します。

ワークフロー図

例

ある都市の警察は、凶悪犯罪と失業率の間に何らかの関係性があるかを判断する解析を実施しています。凶悪犯罪の件数が多く、失業率が高い地域にある高校で拡張サマージョブ計画を導入する予定です。[ホットスポット分析] を使用すると、統計的に有意な犯罪と失業のホットスポットがある地域を検索できます。
ある政治戦略家は、前回の選挙で特定の政党の支持が最も強かった地域と最も弱かった地域を調査しています。この情報は、将来の選挙活動の戦略立案に役立つ可能性があります。この政治戦略家は、共和党支持の得票数の割合から民主党支持の得票数の割合を減算し、[ホットスポット分析] を使用して、得票差の中からホットスポットとコールドスポットを特定しました。ホットスポット (赤) は共和党の支持が強いことを示し、コールドスポット (青) は民主党の支持が強いことを示します。
ある自然保護担当官は、森林への保護対策が必要な地域に優先順位を設定したり、耐性のある地域を詳しく知るために、樹木の病害を調査しています。[ホットスポット分析] ツールを使用すると、病害のある樹木 (ホットスポット) と健康な樹木 (コールドスポット) のクラスターを特定できます。

使用上の注意

入力フィーチャはポイントまたはエリアである場合があります。

[高い/低い値のクラスターを検索] パラメーターを使用すると、フィーチャの空間配置を評価できます。フィーチャがエリアの場合は、フィールドを選択する必要があります。クラスター化を決定するには、選択したフィールド内の数値を使用します。ポイントフィーチャの解析は、フィールドまたは Point Counts オプションを使用して行うことができます。Point Counts を使用すると、高いフィールド値と低いフィールド値のクラスターではなく、ポイント自体をクラスター化するかどうかが決まります。

Point Counts を使用してポイントを解析する場合は、新しい 2 つのオプションを使用できます。[範囲内のポイントのカウント] パラメーターを使用すると、[コンテンツ] (郡や郵便番号など) から Fishnet Grid、Hexagon Grid またはエリアレイヤー内のポイントを集約できます。[ポイントが存在する可能性がある場所を定義] パラメーターを使用すると、対象となる 1 つまたは複数のエリアを作成できます。このパラメーターには、[None] (すべてのポイントが使用される)、[コンテンツ] 内のエリアレイヤーで定義されたエリア、[描画] ツールで作成されたエリアという 3 つのオプションがあります。

データは [除数] パラメーターを使用して正規化できます。[Esri Population] データでは、ジオエンリッチメントが使用され、クレジットを使用する必要があります。入力レイヤーのフィールドを使用して正規化するオプションもあります。正規化に使用できる値には、世帯数やエリア数などがあります。

[オプション] を使用して、自分の分析に適した特定の [セルサイズ] または [距離バンド] の値を設定できます。

出力レイヤーには、各フィーチャの統計的有意性、p 値、Z スコアなどの情報を含む追加フィールドがあります。また、出力レイヤーには、[アイテムの詳細] の [説明] セクションでの統計解析に関する情報も含まれています。

[ホットスポット分析] の詳細

空間パターンは、ランダムであっても一定のクラスターを示します。さらに、人間の目と脳は、パターンが存在しなくても見つけようとする性質があります。したがって、そのようにして得られたデータのパターンは、実際に空間プロセスを経て得られた結果なのか、偶然得られた結果に過ぎないのかを判別するのが困難な場合があります。そのため、研究者とアナリストは、空間パターンを定量化するために [ホットスポット分析] (Getis-Ord Gi*) のような統計手法を使用しています。

ツールは、データセットの各フィーチャの Getis-Ord Gi* (発音はジー-アイ-スター) 統計値を計算します。結果として生成される Z スコアと p 値は、高い値または低い値のフィーチャが空間的にどの場所でクラスタリングされるかを示します。[ホットスポット分析] ツールは、入力データの特性に基づいて最適なデフォルト値を計算し、FDR (False Discovery Rate) 補正を自動的に適用します。各フィーチャは、隣接フィーチャのコンテキスト内で解析されます。高い値を持つフィーチャは興味深いフィーチャではあっても、統計的に有意なホットスポットではない可能性もあります。統計的に有意なホットスポットである場合は、高い値を持つフィーチャが、同じように高い値を持つ別のフィーチャに囲まれています。あるフィーチャとその近傍を対象とする特定エリアの合計値が、すべてのフィーチャの合計値と比例的に比較されます。実際の特定エリアの合計値と期待された合計値が、偶然には発生しないほど大きく異なっていれば、Z スコアは統計的に有意ということになります。

データ内から検出された統計的に有意なクラスターは、有益な情報です。クラスターが発生する位置と時期がわかると、調べているパターンを発展させるプロセスの重要な手掛かりになります。たとえば、空き巣がある特定の近隣地区で一貫して高いという情報は、効果的な防止策を作ったり、貴重な警察のリソースを割り当てたり、地区を監視するプログラムを開始したり、徹底的な犯罪調査の根拠にしたり、参考人を特定したりする必要がある場合に重要な情報になります。

エリアフィーチャ解析

エリアフィーチャには、国勢調査区、郡、選挙区、病院地区、土地区画、公園およびレクリエーション境界、集水域、土地被覆分類および気候帯など、非常に多くのデータがあります。解析レイヤーにエリアフィーチャが含まれている場合、高い値および低い値のクラスターを検索するために使用する数値フィールドを指定する必要があります。これには次のようなフィールドが考えられます。

数 (世帯数など)
比率 (学位を持っている人口比率など)
平均 (世帯収入の平均値、中央値など)
インデックス (世帯のスポーツ用品の消費額が国の平均より多い/少ないことを示すスコアなど)

[ホットスポット分析] ツールは、指定したフィールドを使用して、高い値 (ホットスポット: 赤色) と低い値 (コールドスポット: 青色) の統計的に有意なクラスターがあるエリアを表示するマップ (結果レイヤー) を作成します。

ポイントフィーチャ解析

ポイントフィーチャとして、さまざまなデータが利用できます。ポイントとしてよく表現されるフィーチャとしては、犯罪事件、学校、病院、緊急通報地点、交通事故、井戸、樹木、ボートなどがあります。分析の対象は、各ポイントフィーチャに関連付けられたデータ値 (フィールド) である場合があります。あるいは、ポイント自体のクラスター化の評価だけが対象となる場合もあります。フィールドを指定するかどうかの判断は、質問の内容によって変わります。

ポイントフィーチャに関連する値が高い/低いクラスターの検索

分析フィールドを指定したポイントの分析「高い値と低い値がクラスター化している場所はどこか？」のような疑問に答える場合は、分析フィールドを指定します。選択するフィールドは以下のいずれかを表します。

個数 (交差点での交通事故件数など)
比率 (都市の失業率など。各都市がポイントフィーチャとして表される)
平均 (学校間のテストスコアの平均計算など)
インデックス (郡内のカーディーラーの顧客満足度など)

ポイント数が多い/少ないクラスターの検索

ポイントの分析、分析フィールドなし各ポイントがイベント、インシデント、存在の有無を表すようなポイントデータの場合、使用する分析フィールドが明確に存在しません。このような場合、クラスター化が著しく (統計的に有意な程度に) 強い/弱いエリアがわかれば十分です。この分析の場合、エリアフィーチャ (ツールが作成したフィッシュネットグリッド、または指定したエリアレイヤー) がポイント上に配置され、各エリア内にあるポイント数がカウントされます。続いて、各エリアフィーチャに関連するポイント数の多いクラスターと少ないクラスターが検索されます。

ポイントが存在する可能性がある場所を定義

ポイント、分析フィールドなし、境界分析範囲インシデントポイントフィーチャが発生する可能性があるすべての位置に対して分析を実行するには、エリアレイヤーを指定するか、分析範囲を定義するエリアを描画します。このオプションでは、[ホットスポット分析] ツールは定義された分析範囲にフィッシュネットグリッドをオーバーレイして、各フィッシュネットのマス目にあるポイントをカウントします。このオプションを使用してインシデントポイントが存在する可能性がある場所を指定しない場合、[ホットスポット分析] ツールは、少なくとも 1 つのポイントを含むフィッシュネットのマス目だけを分析します。一方、このオプションを使用してポイントが存在する可能性があるすべての場所を定義した場合、定義した境界エリア内にあるすべてのフィッシュネットのマス目に対して分析が実行されます。

独自の集計エリアでのポイントのカウント

ポイント、分析フィールドなし、集計エリア国勢統計区、警察の巡回区域、土地区画などのエリアフィーチャの方が、デフォルトのフィッシュネットグリッドより分析に適している場合があります。

除数の選択

データセットの正規化ホットスポットとコールドスポットを識別するには、次の 2 つの一般的な手法があります。

カウントによる方法 - 特定のデータセットを分析するときに、分析範囲内の集計エリアごとにフィーチャ数のホットスポットおよびコールドスポットを検索します。たとえば、リソースを配置するために、犯罪件数の最も多いホットスポットや犯罪件数の最も少ないコールドスポットを検索する場合などです。
強度による方法 - 一方、特定の現象に影響する基本分布を考慮したパターンの分析と理解が意味を持つ場合もあります。この考え方は正規化とも呼ばれ、領域のサイズまたは各領域のフィーチャ数に基づいて値の差を最小化するために、数値属性を別の数値属性で割る処理です。たとえば、犯罪に関するデータを使用し、人口を考慮して犯罪件数の高いクラスターおよび低いクラスターの場所を調査するとします。この場合は、エリアごとに犯罪件数をカウントし (エリアはフィッシュネットグリッドまたは別のエリアデータセットのいずれか)、その犯罪件数の合計をそのエリアの総人口で除算します。これにより、犯罪率 (1 人あたりの犯罪件数) が得られます。1 人あたりの犯罪のホットスポットおよびコールドスポットを検索することで、意思決定に役立つ別の課題も解決されます。

分析範囲内のデータを分析する方法として、どちらも有効です。どちらの方法を使用するかは、質問の内容によって変わります。

除数として使用する属性を適切に選択することが重要です。[除数] の属性が、分析している特定の現象の分布に実際に影響のある属性であることを確認する必要があります。

[除数] として [Esri Population] を選択すると、Esri Demographics Global Coverage の人口データが使用されます。調査エリアで使用できるデータの解像度を確認し、情報を付加するエリア (指定する集計エリア、または作成しているフィッシュネットのマス目) のサイズと互換性があることを確認してください。

結果の解析

[ホットスポット分析] ツールの出力はマップです。結果レイヤーマップのポイントまたはエリアで、赤色または青色が暗く表示されるほど、クラスター化の結果が偶然でない可能性が高くなります。一方、ベージュ色のポイントまたはエリアは、統計的に有意なクラスターではありません。これらのフィーチャと関連付けられた空間パターンは、偶然の結果である可能性が高くなります。分析の結果、統計的に有意なクラスターがまったく存在しない場合があります。これは、認識しておくべき重要な情報です。空間パターンがランダムである場合、結果の原因を特定することができません。この場合、結果レイヤー内のすべてのフィーチャがベージュ色になります。一方、統計的に有意なクラスターが見つかった場合、クラスターが発生した場所は、クラスターの要因についての重要な手掛かりになります。たとえば、特定の環境有害物質に関連付けられたガンの発症に関して、統計的に有意な空間クラスターが見つかった場合、これによって人々の命を守ることを目的とした政策や活動が生まれることもあります。同様に、放課後のスポーツプログラムを促進している学校と関連付けて、子供の肥満のコールドスポットが見つかった場合、この種のプログラムをより広範に推進していくための強力な根拠にすることができます。

トラブルシューティング

[ホットスポット分析] ツールで使用される統計手法は確率理論に基づいているため、この手法では、最小数のフィーチャが効果的に機能する必要があります。また、この統計手法では、さまざまなカウント値または分析フィールド値も必要とされます。たとえば、国勢調査地区による犯罪事件の分析を行った結果、各地区の犯罪件数がまったく同じ数になった場合、このツールでは解析はできません。次の表に、[ホットスポット分析] ツールの使用時に表示されるメッセージを示します。


メッセージ	問題	解決策
選択した解析オプションには、ホットスポットとコールドスポットを計算するために最低 60 個のポイントが必要です。	ポイント解析レイヤーで信頼性のある結果を計算するには、ポイントフィーチャの数が不足しています。	確実な解決策は、ポイントを解析レイヤーに追加することです。別の方法として、境界分析エリアを定義することで、ポイントが発生している可能性がある場所に関する情報を追加してみることができます。この手法では、少なくとも 30 個のポイントが必要です。また、ポイント群をオーバーレイする集約エリアを指定してみることもできます。この分析では、それらのエリア内に少なくとも 30 個のポリゴンと 30 個のポイントが存在している必要があります。 30 個以上のポイントが存在する場合は、分析フィールドを指定することも可能です。この場合、疑問点は、「ポイントが多いまたは少ない場所はどこか。」から「分析フィールドの高い値と低い値が空間的にクラスター化している場所はどこか。」に変わります。
選択した解析オプションには、ホットスポットとコールドスポットを計算するために、解析フィールド内に最低 30 個の有効なデータを持つポイントが必要です。	解析レイヤーで信頼性のある結果を計算するには、ポイントの数、または NULL 以外の分析フィールド値に関連付けられたポイントの数が不足しています。	残念ながら、存在しているポイントが 30 個未満の場合、この分析手法はユーザーのデータには適していません。30 個を超えるポイントが存在する状況でこのメッセージが表示された場合は、指定した分析フィールドに NULL 値が含まれている可能性があります。NULL 分析フィールド値が指定されたポイントはスキップされます。この他に、[フィルター] が有効に設定されているため、分析に利用可能なポイントの数が減少している可能性もあります。
選択した解析オプションには、ホットスポットとコールドスポットを計算するために、解析フィールド内に最低 30 個の有効なデータを持つポリゴンが必要です。	解析レイヤーで信頼性のある結果を計算するには、ポリゴンエリアの数、または NULL 以外の分析フィールド値に関連付けられたエリアフィーチャの数が不足しています。	残念ながら、存在しているポリゴンエリアが 30 未満の場合、この分析手法はユーザーのデータには適していません。30 個を超えるエリアが存在する状況でこのメッセージが表示された場合は、指定した分析フィールドに NULL 値が含まれている可能性があります。NULL 分析フィールド値が指定されたポリゴンエリアはスキップされます。この他に、[フィルター] が有効に設定されているため、分析に利用可能なポリゴンエリアの数が減少している可能性もあります。
選択した解析オプションには、境界ポリゴンエリア内部に最低 30 個のポイントが必要です。	描画または指定した境界分析エリアの範囲内にあるポイントだけが分析されます。信頼性のある結果を生成するには、少なくとも 30 個のポイントが境界分析エリア内に存在している必要があります。	残念ながら、30 個以上のポイントが存在しない場合、この手法はユーザーのデータには適していません。ただし、30 個以上のフィーチャがあれば、より広範囲の別の境界分析エリアを指定することがこの場合の解決策になることがよくあります。別の方法として、30 個以上のポイントをオーバーレイする集約ポリゴンを少なくとも 30 個含んでいるエリアレイヤーを指定することもできます。集約エリアを指定すると、各エリア内のポイント数に対して分析が実行されます。
選択した解析オプションには、集約ポリゴン内部に最低 30 個のポイントが必要です。	集約ポリゴン内にあるポイントだけが分析に含まれます。信頼性のある結果を生成するには、少なくとも 30 個のポイントが指定のポリゴンエリア内に存在している必要があります。	残念ながら、30 個以上のポイントが存在しない場合、この手法はユーザーのデータには適していません。30 個以上のポイントが存在している場合は、それらのポイントのうち、30 個以上をオーバーレイする境界分析エリアを指定または描画する必要があります。境界エリアには、ポイントが発生する可能性があるすべての場所が反映されている必要があります。
選択した解析オプションには、最低 30 の集約エリアが必要です。	選択したオプションでは、ポイント群の上部に集約エリアがオーバーレイされ、各エリア内のポイントの数がカウントされます。信頼性のある結果を生成するには、少なくとも 30 の個数 (30 のエリア) が必要です。	30 以上の集約エリア内にあるポイントを少なくとも 30 個指定すると、信頼性のある結果を計算できます。集約エリアが 30 に満たない場合は、ポイントのうち、30 個以上をオーバーレイする境界分析エリアを描画または指定してみることもできます。これらの境界エリアには、ポイントが発生する可能性があるすべての場所が反映されている必要があります。
すべてのポリゴンエリア内のポイント数が同一である場合、ホットスポットとコールドスポットは計算できません。異なるポリゴンエリアまたは異なる分析オプションを使用してください。	[ホットスポット分析] ツールによって、各集約エリア内のポイント数がカウントされた結果、個数がすべて同じであることが判明しました。このツールで結果を計算するには、取得されたカウント値に少なくともある程度のばらつきがなければなりません。	すべてのエリアにまったく同じ数のポイントが含まれることがない別の集約エリアを指定できます。集約エリアではなく、境界分析エリアを描画また指定してみることもできます。あるいは、分析フィールドを指定できます。ただし、この場合、疑問点は、「ポイントが多いまたは少ない場所はどこか」から「分析フィールドの高い値と低い値が空間的にクラスター化している場所はどこか」に変更されます。
ホットスポットとコールドスポットを計算するために、ポイント位置に十分なばらつきがありません。たとえば、一致ポイントがあると空間的変動が少なくなります。境界エリア、集約エリア (最低 30)、または解析フィールドを指定して実行することができます。	このツールでは、ポイントの数とそれらのポイントの分布状況に基づいて、ポイント群をオーバーレイするためのフィッシュネットグリッドを作成します。フィッシュネットのそれぞれのマス目にあるポイント数がカウントされ、カウント値が 0 のマス目が削除された後、残ったマス目の数が 30 未満でした。このツールで信頼性のある結果を生成するには、少なくとも 30 の個数 (30 のマス目) が必要です。	ポイントが存在している一意の場所が非常に少ない場合 (多くの一致ポイントが存在している場合)、推奨される解決策は、ポイント群をオーバーレイする集約エリアを指定するか、ポイントが存在する場所とポイントが存在し得ない場所を示す境界分析エリアを指定することです。その他に、分析フィールドを指定することもできます。ただし、この場合、疑問点は、「ポイントが多いまたは少ない場所はどこか」から「分析フィールドの高い値と低い値が空間的にクラスター化している場所はどこか」に変更されます。
境界ポリゴンエリア内のポイント間に十分なばらつきがありません。より大きな境界を指定して実行できます。	このツールでは、ポイントの位置とポイントの数に基づいて、ポイント群をオーバーレイするためのフィッシュネットグリッドを作成します。フィッシュネットのそれぞれのマス目にあるポイント数がカウントされ、境界分析エリア外にあるマス目が削除された後、残ったフィッシュネットのマス目の数が 30 未満でした。このツールで信頼性のある結果を生成するには、少なくとも 30 の個数 (30 のマス目) が必要です。	ポイントが境界分析エリア内のさまざまな場所に配置されている場合は、より広範囲の境界を作成または指定するだけで十分です。ポイントが存在している一意の場所が非常に少ない場合 (多くの一致ポイントが存在している場合)、推奨される解決策は、ポイント群をオーバーレイする集約エリアを指定することです。その他に、分析フィールドを指定することもできます。ただし、この場合、疑問点は、「ポイントが多いまたは少ない場所はどこか」から「分析フィールドの高い値と低い値が空間的にクラスター化している場所はどこか」に変更されます。
解析フィールドのすべての値が同じと考えられます。解析対象のフィールド内に十分なばらつきがない場合、ホットスポットとコールドスポットは計算できません。	多くの場合、解析レイヤー内のすべてのポイントまたはエリアフィーチャについて同一の値が含まれる分析フィールドが指定されています。さまざまな値が解析の対象となっていない場合、このツールで使用される統計では解析できません。	別の分析フィールドを指定するか、ポイントフィーチャの場合は、ポイント値ではなく、点密度を分析できます。
指定されたデータに対して、ホットスポットとコールドスポットを計算できませんでした。必要であれば、解析フィールドを指定して実行してください。	通常ありえませんが、ツールによってフィッシュネットグリッドが作成され、それぞれのマス目にあるポイント数がカウントされた結果、すべてのマス目の個数が同一でした。	独自の集約エリアの指定、境界分析エリアの指定/描画、または分析フィールドの指定のいずれかが解決策になります。
セルサイズは距離バンドよりも小さくなければなりません。	距離バンドの値を各グリッドセルのサイズよりも小さい値に設定しました。	[距離バンド] と [セルサイズ] の両方に指定した単位を確認し、ツールで計算されたデフォルトの値を使用するか、1 つのグリッドセルサイズよりも大きい値を使用します。

[ホットスポット分析] ツールで採用されているアルゴリズムに関する追加情報については、「[最適化ホットスポット分析] の詳細」をご参照ください。

類似のツール

[ホットスポット分析] ツールは、データの空間パターンに、統計的に有意なクラスターが存在するかどうかを判定します。その他の役に立つツールを紹介します。

Map Viewer解析ツール

データの空間パターンにおける外れ値を見つける場合は、[外れ値の検索] ツールを使用します。

ポイントまたはラインフィーチャの密度マップを作成する場合、[密度の計算] ツールを使用します。

ArcGIS Pro 解析ツール

[ホットスポット分析] ツールは、[ホットスポット分析 (Getis-Ord Gi*)] ツールおよび [最適化ホットスポット分析] ツールで使用されるのと同じ統計を実行します。

ホットスポット分析は ArcGIS Pro でも利用できます。ツールを ArcGIS Pro から実行するには、プロジェクトのアクティブなポータルで ArcGIS Enterprise 10.5 以上を実行している必要があります。また、ポータルで標準フィーチャ解析を実行できる権限を持つアカウントで、ポータルにサインインしている必要があります。

このトピックへのフィードバック