[ポイント クラスターの検索] ツールは、空間分布または時空間分布に基づき周辺ノイズ内でポイント フィーチャのクラスターを検索します。
ワークフロー図
解析での使用 GeoAnalytics Tools
GeoAnalytics Tools を使用した解析は、複数の ArcGIS GeoAnalytics Server コンピューターやコアにまたがる分散型処理を使用して実施されます。GeoAnalytics Tools と ArcGIS Enterprise の標準的なフィーチャ解析ツールは、異なるパラメーターと機能を持ちます。これらの相違点については、「フィーチャ解析ツールの相違点」をご参照ください。
例
非政府組織が、害虫が運ぶ特定の病気を調査しており、分析範囲内の世帯を表しているポイント データセットが存在し、それらの世帯の一部が感染していて、その他の世帯が感染していない場合があります。[ポイント クラスターの検索 (Find Point Clusters)] ツールを使用することによって、アナリストは、感染した世帯のクラスターを決定し、害虫の処理および駆除を開始する必要のあるエリアを正確に示すことができます。
使用上の注意
[ポイント クラスターの検索] の入力は、単一ポイント レイヤーです。
[使用するクラスター分析手法を選択] パラメーターは、指定距離または自動調整クラスタリング アルゴリズムのいずれが使用されるかを決定します。指定距離 (DBSCAN) は、指定された検索距離に基づいて最近接にあるポイントのクラスターを検索します。自動調整 (HDBSCAN) は、DBSCAN と同様にポイントのクラスターを検索しますが、クラスターの可能性 (または安定性) に基づきさまざまな密度で、クラスターを考慮したさまざまな検索範囲を使用します。
[DBSCAN] を選択した場合、クラスターは 2 次元空間のみか、空間と時間の両方で検索できます。[時間を使ってクラスターを検索] をオンにし、入力レイヤーが時間対応かつ時間のタイプが瞬間である場合、DBSCAN は指定された検索距離および検索期間に基づいて最近接にあるポイントの時空間クラスターを検出します。
HDBSCAN では現在のところ空間クラスタリングのみがサポートされており、クラスターの検出に時間は使用されません。
すべての結果は、各フィーチャが属しているクラスターを示す CLUSTER_ID という名前のフィールド、および各クラスターが隣接するクラスターからほとんどの場合は視覚的に区別されるように、結果の描画に使用されるラベルである COLOR_ID という名前のフィールドを含みます。両方のフィールドで、-1 の値は、フィーチャがノイズとしてラベル付けされていることを示します。
[指定距離 (DBSCAN)] クラスター分析手法を時間とともに使用し、時空間クラスターを検出する場合、結果には次のフィールドも含まれます。
- FEAT_TIME - 各フィーチャの元となる瞬間の時間。
- START_DATETIME - フィーチャが含まれるクラスターの時間範囲における開始時間。
- END_DATETIME - フィーチャが含まれるクラスターの時間範囲における終了時間。
生成されるレイヤーの時間は、START_DATETIME および END_DATETIME フィールドの間隔として設定され、時間スライダーで時空間クラスターを視覚化する際は、ほとんどの場合、すべてのクラスター メンバーが一緒に描画されます。ノイズ フィーチャの場合、START_DATETIME および END_DATETIME は FEAT_TIME と等しくなります。
[自己調整 (HDBSCAN)] クラスター分析手法が使用される場合、結果には次のフィールドも含まれます。
- PROB - フィーチャが、割り当てられたクラスターに存在する可能性。
- OUTLIER - フィーチャが自身のクラスターの外れ値である可能性。値が高いほど、フィーチャが外れ値である可能性が高いことを示しています。
- EXEMPLAR - 各クラスターの最も代表的なフィーチャを示します。これらのフィーチャは値が 1 であることで示されます。
- STABILITY - さまざまな縮尺における各クラスターの持続性。スコアが大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。
[クラスターと見なす最小ポイント数] パラメーターは、選択されたクラスター分析手法に応じて異なって使用されます。
- [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから検索範囲内にある必要があるフィーチャの数を指定します。結果は、この値よりも少ないフィーチャが含まれるクラスターを含むことができます。検索範囲の距離は、[検索範囲を設定] パラメーターを使用して設定されます。時間を使用してクラスターを検出する場合、追加の検索期間が必要であり、[検索期間を設定] パラメーターを使用して設定します。クラスター メンバーを検索する際、クラスターを形成するには、指定された検索範囲と検索期間内で指定された最小フィーチャ数が見つかる必要があります。この距離および期間は、検出されたポイント クラスターの直径または時間範囲には関連しません。
- [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイント自体を含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。
HDBSCAN アルゴリズムを、300 万個を超えるフィーチャを含んでいる入力レイヤーとともに使用する場合、管理者が GeoAnalyticsTools GP サービスで javaHeapSize パラメーターの値を増やさない限り、ツールが失敗することがあります。300 万個のフィーチャにつき、おおよそ 2 GB のヒープ領域が必要です。GeoAnalytics Server によって通常は必要とされる 16 GB に加えて、javaHeapSize で指定された量の RAM が各 GeoAnalytics Server コンピューター上で利用可能である必要があります。たとえば、HDBSCAN を使用して 900 万個のフィーチャをクラスタリングする場合、javaHeapSize を 6144 MB または 6 GB 以上に設定する必要があります。その場合、各 GeoAnalytics Server コンピューターは、合計で少なくとも 22 GB の利用可能な RAM を備える必要があります。
詳細については、ArcGIS Pro のドキュメントの「密度ベースのクラスター分析 (Density-based Clustering) ツールの詳細」をご参照ください。
ArcGIS API for Python の例
[ポイント クラスターの検索] ツールは ArcGIS API for Python で使用できます。
この例では、小売場所のクラスターを検索します。
# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
from arcgis.geoanalytics import analyze_patterns
# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
print("Quitting, GeoAnalytics is not supported")
exit(1)
# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")
# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_RetailLocation")
# Look through the big data file share for points of sale
pos = next(x for x in bdfs_search.layers if x.properties.name == "POS")
# Set the tool environment settings
arcgis.env.verbose = True
# Run the Find Point Clusters tool
output = analyze_patterns.find_point_clusters(pos, 10, "Kilometers", "POS_Clusters")
# Visualize the tool results if you are running Python in a Jupyter Notebook
processed_map = portal.map('USA')
processed_map.add_layer(output)
processed_map
類似のツール
[ポイント クラスターの検索 (ポイント クラスターの検索)] ツールを使用して、空間分布に基づき周辺ノイズ内でポイント フィーチャのクラスターを検索します。その他の役に立つツールを紹介します。
Map Viewer 解析ツール
データの空間パターンにおいて、統計的に有意なクラスターがあるかどうかを判断する場合、[ホット スポット分析 (Find Hot Spots)] ツールを使用します。
ポイントまたはライン フィーチャの密度マップを作成する場合、[密度の計算 (Calculate Density)] ツールを使用します。
データの空間パターンにおいて、統計的に有意な範囲外ポイントがあるかどうかを判断する場合、[範囲外ポイントの検索 (Find Outliers)] ツールを使用します。
ArcGIS Desktop 解析ツール
密度ベースのクラスタリング ジオプロセシング ツールは、[ポイント クラスターの検索 (ポイント クラスターの検索)] ツールと同じ関数を実行します。
GeoAnalytics Tools の [ポイント クラスターの検索 (ポイント クラスターの検索)] は ArcGIS Pro でも利用できます。