포인트 군집 찾기 도구는 공간 또는 시공간 분포에 따라 주변 노이즈 내 포인트 피처의 군집을 찾습니다.
워크플로 다이어그램
GeoAnalytics Tools를 사용하여 분석
GeoAnalytics Tools를 사용하는 분석은 여러 ArcGIS GeoAnalytics Server 머신 및 코어에서 분산 처리를 사용하여 실행됩니다. ArcGIS Enterprise의 GeoAnalytics Tools 및 표준 피처 분석 도구에는 다양한 매개변수와 기능이 있습니다. 이러한 차이점에 대한 자세한 내용은 피처 분석 도구의 차이점을 참고하세요.
사례
비영리 기관은 특정 해충으로 인한 질병을 연구하는 중이며 연구 영역의 가정을 대표하는 포인트 데이터셋을 보유하고 있는데 일부는 감염되어 있으며 일부는 감염되지 않았습니다. 포인트 군집 찾기 도구를 사용하여 분석 기관에서는 감염된 가구의 군집을 파악하여 해충의 치료 및 박멸을 시작할 지역을 정확하게 찾을 수 있습니다.
사용 참고 사항
포인트 군집 찾기에 대한 입력은 단일 포인트 레이어입니다.
사용할 군집화 방법 선택 매개변수는 정의된 거리나 자체 조정 군집화 알고리즘의 사용 여부를 결정합니다. 정의된 거리(DBSCAN)는 지정된 검색 범위를 기준으로 근접해 있는 포인트의 군집을 찾습니다. 자체 조정(HDBSCAN)은 DBSCAN과 유사한 포인트 군집을 찾지만 군집 확률(또는 안정성) 기반의 다양한 밀도 군집이 허용되는 다양한 검색 범위를 사용합니다.
DBSCAN을 선택한 경우 2차원 공간에서만 또는 공간과 시간 모두에서 군집을 찾을 수 있습니다. 군집 찾기에 시간 사용을 선택하고 입력 레이어에 인스턴트 유형의 시계열이 있는 경우 DBSCAN이 지정된 검색 거리 및 검색 기간에 따라 가까운 거리에 있는 시공간 포인트 군집을 찾아냅니다.
HDBSCAN은 현재 공간 군집화만 지원하며 군집을 찾는 데 시간을 사용하지 않습니다.
모든 결과에는 각 피처가 속한 군집을 나타내는 CLUSTER_ID 필드와 각 군집이 주변 군집과 대부분의 경우 시각적으로 구별되도록 결과를 그리는 데 사용되는 레이블인 COLOR_ID 필드가 포함됩니다. 두 필드 모두 -1 값은 피처가 노이즈로 레이블이 지정되어 있음을 나타냅니다.
정의된 거리(DBSCAN) 군집화 방법이 시공간 군집을 찾는 데 시간을 사용할 경우에는 다음 필드도 결과에 포함됩니다.
- FEAT_TIME - 각 피처의 기존 인스턴트 시간입니다.
- START_DATETIME - 피처가 속한 군집에 대한 시간 범위의 시작 시간입니다.
- END_DATETIME - 피처가 속한 군집에 대한 시간 범위의 종료 시간입니다.
결과 레이어의 시간이 START_DATETIME 및 END_DATETIME 필드에 표시된 간격으로 설정되므로 대부분의 경우 시간 슬라이더를 사용해 시공간 군집을 시각화하면 모든 군집 구성원이 함께 그려집니다. 노이즈 피처의 경우 START_DATETIME 및 END_DATETIME이 FEAT_TIME과 같아집니다.
자체 조정(HDBSCAN) 군집화 방법이 사용될 경우에는 다음 필드도 결과에 포함됩니다.
- PROB - 피처가 할당된 군집에 속할 확률입니다.
- OUTLIER - 피처가 자체 군집 내에서 이상치일 가능도입니다. 값이 클수록 피처가 이상치일 가능성이 커집니다.
- EXEMPLAR - 각 군집의 가장 대표적인 피처를 나타냅니다. 이러한 피처는 1 값으로 나타납니다.
- STABILITY - 다양한 척도 전반에서 각 군집의 지속성입니다. 점수가 클수록 군집이 지속되는 거리 척도의 범위가 더 커짐을 나타냅니다.
군집으로 간주될 최소 포인트 수 매개변수는 선택한 군집화 방법에 따라 다르게 사용됩니다.
- 정의된 거리(DBSCAN) - 해당 포인트가 군집 형성을 시작하기 위해 포인트의 검색 범위 내에 있어야 하는 피처의 수를 지정합니다. 피처 수가 해당 값보다 적은 군집이 결과에 포함될 수 있습니다. 검색 범위 거리는 다음으로 검색 범위 제한 매개변수를 사용하여 설정됩니다. 클러스터를 찾는 데 시간을 사용할 경우 추가 검색 기간이 필요하며 해당 기간은 다음으로 검색 기간 제한 매개변수를 사용해 설정합니다. 군집 구성원을 검색할 경우 군집을 형성하기 위해 지정된 검색 범위 및 검색 기간 내에서 지정된 최소 피처 수를 찾아야 합니다. 이 거리 및 기간은 검색된 포인트 군집의 직경 또는 시간 범위와 관련이 없습니다.
- 자체 조정(HDBSCAN) - 밀도를 추정할 때 고려할 각 포인트에 인접한 피처 수를 지정합니다(포인트 자체 포함). 이 숫자는 군집을 추출할 때 허용되는 최소 군집 크기이기도 합니다.
피처가 300만 개 이상 있는 입력 레이어를 HDBSCAN 알고리즘에 사용할 경우에는 관리자가 GeoAnalyticsTools GP 서비스에 대한 javaHeapSize 매개변수의 값을 늘리지 않으면 도구가 실패할 수 있습니다. 대략 피처 300만 개당 2GB의 힙 공간이 필요합니다. 각 GeoAnalytics Server 머신에는 GeoAnalytics Server에 일반적으로 필요한 16GB 외에 javaHeapSize에서 지정된 RAM 용량이 있어야 합니다. 예를 들어, HDBSCAN 방법으로 900만 개의 피처를 군집화하려면 javaHeapSize를 6144MB(6GB) 이상으로 설정해야 합니다. 이 경우 각 GeoAnalytics Server 머신에는 총 22GB 이상의 RAM이 있어야 합니다.
자세한 내용은 밀도 기반 군집화 작동 방식에 대한 ArcGIS Pro 설명서를 참고하세요.
ArcGIS API for Python 예시
포인트 군집 찾기 도구는 ArcGIS API for Python을 통해 제공됩니다.
이 예시에서는 리테일 위치의 군집을 찾습니다.
# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
from arcgis.geoanalytics import analyze_patterns
# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
print("Quitting, GeoAnalytics is not supported")
exit(1)
# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")
# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_RetailLocation")
# Look through the big data file share for points of sale
pos = next(x for x in bdfs_search.layers if x.properties.name == "POS")
# Set the tool environment settings
arcgis.env.verbose = True
# Run the Find Point Clusters tool
output = analyze_patterns.find_point_clusters(pos, 10, "Kilometers", "POS_Clusters")
# Visualize the tool results if you are running Python in a Jupyter Notebook
processed_map = portal.map('USA')
processed_map.add_layer(output)
processed_map
유사한 도구
포인트 군집 찾기를 사용하여 공간 분포에 따라 주변 노이즈 내 포인트 피처의 군집을 찾습니다. 다음과 같은 기타 도구를 사용할 수 있습니다.
Map Viewer 분석 도구
데이터의 공간 패턴에 통계적으로 유의한 군집이 있는지 확인하려면 핫 스팟 찾기 도구를 사용합니다.
포인트 또는 라인 피처의 밀도 맵을 생성하려면 밀도 계산 도구를 사용합니다.
데이터의 공간 패턴에 이상치가 있는지 통계적으로 확인하려면 이상치 찾기 도구를 사용합니다.
ArcGIS Desktop 분석 도구
밀도 기반 군집 지오프로세싱 도구는 포인트 군집 찾기와 같은 기능을 수행합니다.
포인트 군집 찾기 GeoAnalytics Tools은 ArcGIS Pro에서 제공됩니다.