Skip To Content

포인트 클러스터 찾기

비고:

현재 이 기능은 Map Viewer Classic(이전의 Map Viewer)에서만 지원됩니다. Map Viewer 후속 릴리즈에서 제공됩니다.

포인트 클러스터 찾기 도구 아이콘 포인트 클러스터 찾기 도구는 공간 또는 시공간 분포에 따라 주변 노이즈 내 포인트 피처의 클러스터를 찾습니다.

워크플로 다이어그램

포인트 클러스터 찾기

GeoAnalytics Tools를 사용하여 분석

GeoAnalytics Tools를 사용하는 분석은 여러 ArcGIS GeoAnalytics Server 머신 및 코어에서 분산 처리를 사용하여 실행됩니다. ArcGIS EnterpriseGeoAnalytics Tools 및 표준 피처 분석 도구에는 다양한 매개변수와 기능이 있습니다. 이러한 차이점에 대한 자세한 내용은 피처 분석 도구의 차이점을 참고하세요.

예시

비영리 기관은 특정 해충으로 인한 질병을 연구하는 중이며 연구 영역의 가정을 대표하는 포인트 데이터셋을 보유하고 있는데 일부는 감염되어 있으며 일부는 감염되지 않았습니다. 포인트 클러스터 찾기 도구를 사용하여 분석 기관에서는 감염된 가구의 클러스터를 파악하여 해충의 치료 및 박멸을 시작할 지역을 정확하게 찾을 수 있습니다.

사용 참고 사항

포인트 클러스터 찾기에 대한 입력은 단일 포인트 레이어입니다.

사용할 클러스터링 방법 선택 매개변수는 정의된 거리나 자체 조정 클러스터링 알고리즘의 사용 여부를 결정합니다. 정의된 거리(DBSCAN)는 지정된 검색 범위를 기준으로 근접해 있는 포인트의 클러스터를 찾습니다. 자체 조정(HDBSCAN)은 DBSCAN과 유사한 포인트 클러스터를 찾지만 클러스터 확률(또는 안정성) 기반의 다양한 밀도 클러스터가 허용되는 다양한 검색 범위를 사용합니다.

DBSCAN을 선택한 경우 2차원 공간에서만 또는 공간과 시간 모두에서 클러스터를 찾을 수 있습니다. 클러스터 찾기에 시간 사용을 선택하고 입력 레이어에 인스턴트 유형의 시계열이 있는 경우 DBSCAN이 지정된 검색 거리 및 검색 기간에 따라 가까운 거리에 있는 시공간 포인트 클러스터를 찾아냅니다.

HDBSCAN은 현재 공간 클러스터링만 지원하며 클러스터를 찾는 데 시간을 사용하지 않습니다.

모든 결과에는 각 피처가 속한 클러스터를 나타내는 CLUSTER_ID 필드와 각 클러스터가 주변 클러스터와 대부분의 경우 시각적으로 구별되도록 결과를 그리는 데 사용되는 레이블인 COLOR_ID 필드가 포함됩니다. 두 필드 모두 -1 값은 피처가 노이즈로 레이블이 지정되어 있음을 나타냅니다.

정의된 거리(DBSCAN) 클러스터링 방법이 시공간 클러스터를 찾는 데 시간을 사용할 경우에는 다음 필드도 결과에 포함됩니다.

  • FEAT_TIME- 각 피처의 기존 인스턴트 시간입니다.
  • START_DATETIME- 피처가 속한 클러스터에 대한 시간 범위의 시작 시간입니다.
  • END_DATETIME- 피처가 속한 클러스터에 대한 시간 범위의 종료 시간입니다.

결과 레이어의 시간이 START_DATETIMEEND_DATETIME 필드에 표시된 간격으로 설정되므로 대부분의 경우 시간 슬라이더를 사용해 시공간 클러스터를 시각화하면 모든 클러스터 구성원이 함께 그려집니다. 노이즈 피처의 경우 START_DATETIMEEND_DATETIME이(가) FEAT_TIME과(와) 같아집니다.

자체 조정(HDBSCAN) 클러스터링 방법이 사용될 경우에는 다음 필드도 결과에 포함됩니다.

  • PROB- 할당된 클러스터에 피처가 속할 확률입니다.
  • OUTLIER- 피처가 자체 클러스터 내에서 이상치일 가능도입니다. 값이 클수록 피처가 이상치일 가능성이 커집니다.
  • EXEMPLAR- 각 클러스터의 가장 대표적인 피처를 나타냅니다. 이러한 피처는 1 값으로 나타납니다.
  • STABILITY- 다양한 척도 전반에서 각 클러스터의 지속성입니다. 점수가 클수록 클러스터가 지속되는 거리 척도의 범위가 더 커짐을 나타냅니다.

클러스터로 간주될 최소 포인트 수 매개변수는 선택한 클러스터링 방법에 따라 다르게 사용됩니다.

  • 정의된 거리(DBSCAN) - 해당 포인트가 클러스터 형성을 시작하기 위해 포인트의 검색 범위 내에 있어야 하는 피처의 수를 지정합니다. 피처 수가 해당 값보다 적은 클러스터가 결과에 포함될 수 있습니다. 검색 범위 거리는 다음으로 검색 범위 제한 매개변수를 사용하여 설정됩니다. 클러스터를 찾는 데 시간을 사용할 경우 추가 검색 기간이 필요하며 해당 기간은 다음으로 검색 기간 제한 매개변수를 사용해 설정합니다. 클러스터 구성원을 검색할 경우 클러스터를 형성하기 위해 지정된 검색 범위 및 검색 기간 내에서 지정된 최소 피처 수를 찾아야 합니다. 이 거리 및 기간은 검색된 포인트 클러스터의 직경 또는 시간 범위와 관련이 없습니다.
  • 자체 조정(HDBSCAN) - 밀도를 추정할 때 고려할 각 포인트에 인접한 피처 수를 지정합니다(포인트 자체 포함). 이 숫자는 클러스터를 추출할 때 허용되는 최소 클러스터 크기이기도 합니다.

피처가 300만 개 이상 있는 입력 레이어를 HDBSCAN 알고리즘에 사용할 경우에는 관리자가 GeoAnalyticsTools GP 서비스에 대한 javaHeapSize 매개변수의 값을 늘리지 않으면 도구가 실패할 수 있습니다. 대략 피처 300만 개당 2GB의 힙 공간이 필요합니다. 각 GeoAnalytics Server 머신에는 GeoAnalytics Server에 일반적으로 필요한 16GB 외에 javaHeapSize에서 지정된 RAM 용량이 있어야 합니다. 예를 들어, HDBSCAN 방법으로 900만 개의 피처를 클러스터하려면 javaHeapSize을(를) 6144MB(6GB) 이상으로 설정해야 합니다. 이 경우 각 GeoAnalytics Server 머신에는 총 22GB 이상의 RAM이 있어야 합니다.

자세한 내용은 ArcGIS Pro 문서를 참고하세요.

ArcGIS API for Python 예시

포인트 클러스터 찾기 도구는 ArcGIS API for Python을 통해 제공됩니다.

이 예시에서는 리테일 위치의 클러스터를 찾습니다.


# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
from arcgis.geoanalytics import analyze_patterns

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password")
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_RetailLocation")

# Look through the big data file share for points of sale
pos = next(x for x in bdfs_search.layers if x.properties.name == "POS")

# Set the tool environment settings
arcgis.env.verbose = True

# Run the Find Point Clusters tool 
output = analyze_patterns.find_point_clusters(pos, 10, "Kilometers", "POS_Clusters")

# Visualize the tool results if you are running Python in a Jupyter Notebook
processed_map = portal.map('USA')
processed_map.add_layer(output)
processed_map

유사한 도구

포인트 클러스터 찾기를 사용하여 공간 분포에 따라 주변 노이즈 내 포인트 피처의 클러스터를 찾습니다. 다음과 같은 기타 도구를 사용할 수 있습니다.

Map Viewer Classic 분석 도구

데이터의 공간 패턴에 통계적으로 유의한 클러스터링이 있는지 확인하려면 핫스팟 찾기 도구를 사용합니다.

포인트 또는 라인 피처의 밀도 맵을 생성하려면 밀도 계산 도구를 사용합니다.

데이터의 공간 패턴에 이상치가 있는지 통계적으로 확인하려면 이상치 찾기 도구를 사용합니다.

ArcGIS Pro 분석 도구

밀도 기반 클러스터링 지오프로세싱 도구는 포인트 클러스터 찾기와 같은 기능을 수행합니다.

포인트 클러스터 찾기 도구는 ArcGIS Pro에서 제공됩니다.