Skip To Content

포인트 군집 찾기(Find Point Clusters)

포인트 군집 찾기 도구 아이콘포인트 군집 찾기 도구는 공간 분포에 따라 주변 노이즈 내 포인트 피처의 군집을 찾습니다.

워크플로 다이어그램

포인트 군집 찾기(Find Point Clusters)

GeoAnalytics 도구를 사용하여 분석

GeoAnalytics 도구를 사용하는 분석은 여러 ArcGIS GeoAnalytics Server 머신 및 코어에서 분산 처리를 사용하여 실행됩니다. GeoAnalytics 도구 ArcGIS Enterprise의 표준 피처 분석 도구에는 다양한 매개변수와 기능이 있습니다. 이러한 차이점에 대한 자세한 내용은 피처 분석 도구의 차이점을 참고하세요.

사례

비영리 기관은 특정 해충으로 인한 질병을 연구하는 중이며 연구 영역의 가정을 대표하는 포인트 데이터셋을 보유하고 있는데 일부는 감염되어 있으며 일부는 감염되지 않았습니다. 포인트 군집 찾기 도구를 사용하여 분석 기관에서는 감염된 가구의 군집을 파악하여 해충의 치료 및 박멸을 시작할 지역을 정확하게 찾을 수 있습니다.

사용 참고 사항

포인트 군집 찾기에 대한 입력은 단일 포인트 레이어입니다.

사용할 군집화 방법 선택 매개변수는 정의된 거리나 자체 조정 군집화 알고리즘의 사용 여부를 결정합니다. 정의된 거리(DBSCAN)는 지정된 검색 범위를 기준으로 근접해 있는 포인트의 군집을 찾습니다. 자체 조정(HDBSCAN)은 DBSCAN과 유사한 포인트 군집을 찾지만 군집 확률(또는 안정성) 기반의 다양한 밀도 군집이 허용되는 다양한 검색 범위를 사용합니다.

모든 결과에는 각 피처가 속한 군집을 나타내는 CLUSTER_ID 필드와 각 군집이 주변 군집과 시각적으로 구별되도록 결과를 그리는 데 사용되는 레이블인 COLOR_ID 필드가 포함됩니다. 두 필드 모두 -1 값은 피처가 노이즈로 레이블이 지정되어 있음을 나타냅니다.

자체 조정(HDBSCAN) 군집화 방법이 사용될 경우에는 다음 필드도 결과에 포함됩니다.

  • PROB - 피처가 할당된 군집에 속할 확률입니다.
  • OUTLIER - 피처가 자체 군집 내에서 이상치일 가능도입니다. 값이 클수록 피처가 이상치일 가능성이 커집니다.
  • EXEMPLAR - 각 군집의 가장 대표적인 피처를 나타냅니다. 이러한 피처는 1 값으로 나타납니다.
  • STABILITY - 다양한 척도 전반에서 각 군집의 지속성입니다. 점수가 클수록 군집이 지속되는 거리 척도의 범위가 더 커짐을 나타냅니다.

군집으로 간주될 최소 포인트 수 매개변수는 선택한 군집화 방법에 따라 다르게 사용됩니다.

  • 정의된 거리(DBSCAN) - 해당 포인트가 군집 형성을 시작하기 위해 포인트의 검색 범위 내에 있어야 하는 피처의 수를 지정합니다. 피처 수가 해당 값보다 적은 군집이 결과에 포함될 수 있습니다. 검색 범위 거리는 다음으로 검색 범위 제한 매개변수를 사용하여 설정됩니다.
  • 자체 조정(HDBSCAN) - 밀도를 추정할 때 고려할 각 포인트에 인접한 피처 수를 지정합니다(포인트 자체 포함). 이 숫자는 군집을 추출할 때 허용되는 최소 군집 크기이기도 합니다.

피처가 300만 개 이상 있는 입력 레이어를 HDBSCAN 알고리즘에 사용할 경우에는 관리자가 GeoAnalyticsTools GP 서비스에 대한 javaHeapSize 매개변수의 값을 늘리지 않으면 도구가 실패할 수 있습니다. 대략 피처 300만 개당 2GB의 힙 공간이 필요합니다. 각 GeoAnalytics Server 머신에는 GeoAnalytics Server에 일반적으로 필요한 16GB 외에 javaHeapSize에서 지정된 RAM 용량이 있어야 합니다. 예를 들어 HDBSCAN 방법으로 900만 개의 피처를 군집화하려면 javaHeapSize를 6144MB(6GB) 이상으로 설정해야 합니다. 이 경우 각 GeoAnalytics Server 머신에는 총 22GB 이상의 RAM이 있어야 합니다.

자세한 내용은 밀도 기반 군집화 작동 방식에 대한 ArcGIS Pro 설명서를 참고하세요.

ArcGIS API for Python 예시

포인트 군집 찾기 도구는 ArcGIS API for Python을 통해 제공됩니다.

이 예시에서는 리테일 위치의 군집을 찾습니다.


# Import the required ArcGIS API for Python modules import arcgis from arcgis.gis import GIS from arcgis.geoanalytics import analyze_patterns
# Connect to your ArcGIS Enterprise portal and check that GeoAnalytics is supported portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False) if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")    exit(1)   
# Find the big data file share dataset you're interested in using for analysis search_result = portal.content.search("", "Big Data File Share")
# Look through search results for a big data file share with the matching name bd_file = next(x for x in search_result if x.title == "bigDataFileShares_RetailLocation")
# Look through the big data file share for points of sale pos = next(x for x in bd_file.layers if x.properties.name == "POS")
# Set the tool environment settings arcgis.env.verbose = True
# Run the tool Find Point Clusters output = analyze_patterns.find_point_clusters(pos, 10, "Kilometers", "POS_Clusters")
# Visualize the tool results if you are running Python in a Jupyter Notebook processed_map = portal.map('USA') processed_map.add_layer(output) processed_map

유사한 도구

포인트 군집 찾기를 사용하여 공간 분포에 따라 주변 노이즈 내 포인트 피처의 군집을 찾습니다. 다음과 같은 기타 도구를 사용할 수 있습니다.

Map Viewer 분석 도구

데이터의 공간 패턴에 통계적으로 유의한 군집이 있는지 확인하려면 핫 스팟 찾기 도구를 사용합니다.

포인트 또는 라인 피처의 밀도 맵을 생성하려면 밀도 계산 도구를 사용합니다.

데이터의 공간 패턴에 이상치가 있는지 통계적으로 확인하려면 이상치 찾기 도구를 사용합니다.

ArcGIS Desktop 분석 도구

밀도 기반 군집 지오프로세싱 도구는 포인트 군집 찾기와 같은 기능을 수행합니다.

포인트 군집 찾기 GeoAnalytics 도구ArcGIS Pro에서 제공됩니다.