포인트 클러스터 찾기 도구는 공간 분포에 따라 주변 노이즈 내 포인트 피처의 클러스터를 식별합니다.
예시
이 도구에 대한 사용 예시는 다음과 같습니다.
- 특정 해충으로 인한 질병을 연구하는 한 기관에서는 연구 영역의 어느 부분에서 치료 및 해당 해충의 박멸을 시작할지 파악하고자 합니다. 한 분석가는 연구 영역에서 감염된 가정 및 감염되지 않은 가정을 나타내는 포인트 데이터셋을 가지고 있습니다. 이 분석가는 포인트 클러스터 찾기 도구를 사용하여 감염된 가구의 가장 큰 클러스터를 찾습니다.
- 재난대응 기관에서는 자연재해 후 구조 및 대피를 위해 리소스를 어디에 배치해야 할지 판단해야 합니다. 한 분석가는 포인트 클러스터 찾기 도구를 사용하여 이 사건을 언급하는 지리적 위치 트윗의 클러스터를 찾습니다. 기관에서는 클러스터의 크기와 위치를 사용하여 영향을 받은 영역을 매핑하고 구호 활동을 알립니다.
사용 참고사항
포인트 클러스터 찾기 도구에는 입력 피처, 클러스터 설정, 결과 레이어에 대한 구성이 포함됩니다.
입력 피처
입력 피처 그룹에는 입력 레이어 매개변수가 포함되어 있으며, 이는 공간 분포에 따라 클러스터로 그룹화될 포인트 피처가 있는 레이어입니다.
레이어 이름 아래에 피처 수가 표시됩니다. 해당 개수에는 필터를 사용하여 제거된 피처를 제외한 레이어의 모든 피처가 포함됩니다. 프로세싱 범위 등의 환경 설정은 피처 수에 반영되지 않습니다.
비고:
Web Mercator는 공간 분석에 적절한 투영이 아닙니다. 입력 레이어의 공간 기준 체계가 WGS 1984 Web Mercator(Auxiliary Sphere)인 경우 데이터는 분석에 현형 거리를 사용하기 위해 지리 좌표계로 변환됩니다.
클러스터 설정
클러스터 설정 그룹에는 다음 매개변수가 포함됩니다.
- 클러스터링 방법은 클러스터를 식별하는 데 사용될 방법입니다.
- 정의된 거리(DBSCAN) — 지정된 검색 거리 내에서 검색하여 클러스터를 식별합니다. 이 방법은 모든 의미 있는 클러스터의 밀도가 유사한 경우 적합합니다.
- 자체 조정(HDBSCAN) — 거리 범위를 사용하여 밀도가 희박한 노이즈에서 여러 밀도 클러스터를 분리합니다. 이 방법은 클러스터링 방법 중 가장 데이터에 밀접하게 기반한 방법이므로 검색 거리가 필요하지 않습니다.
- 다중 축척(OPTICS) — 인접 피처 및 연결 가능성 플롯 간의 거리를 사용하여 클러스터를 식별합니다. 이 방법은 먼저 모든 포인트에 대한 최소 연결 가능성 거리를 결정합니다. 최소 연결 가능성 거리는 포인트에서 아직 검색으로 방문하지 않은 가장 가까운 인접 피처까지의 거리입니다. 모든 포인트에 대한 최소 연결 가능성 거리가 결정되면 도구는 연결 가능성 플롯을 구성합니다. 연결 가능성 플롯은 각 포인트의 연결 가능성 순서 및 해당 연결 가능성 거리를 표시하여 포인트의 클러스터링 구조를 드러냅니다. 그런 다음 이 방법은 클러스터 민감도 값을 사용하여 클러스터를 식별합니다. HDBSCAN 방법과 유사하게, OPTICS 방법은 다양한 밀도의 클러스터를 식별할 수 있습니다.
- 클러스터별 최소 포인트는 포인트 그룹을 클러스터로 간주하는 데 사용되는 최소 포인트 수입니다. 일반적으로 값이 작을수록 더 많은 클러스터가 감지됩니다. 이 값은 레이어의 포인트 수보다 작거나 동일해야 합니다. 지원되는 최소값은 2입니다.
- 검색 거리는 검토할 각 포인트 주변으로 최대 거리를 지정합니다. 클러스터링 방법 값이 정의된 거리(DBSCAN)인 경우 검색 거리는 클러스터에 포함될 수 있는 포인트를 검색하기 위해 클러스터의 각 포인트 피처 주변으로 최대 거리를 지정합니다. 특정 포인트의 검색 거리 내에서 최소 포인트 수를 찾을 수 있는 경우, 해당 포인트는 핵심 포인트로 간주됩니다. 특정 포인트의 검색 거리 내에서 최소 포인트 수를 찾을 수 없지만 해당 포인트가 코어 포인트의 검색 거리 내에 속한 경우, 해당 포인트는 경계 포인트로 간주됩니다. 클러스터는 핵심 포인트 및 경계 포인트 모두로 구성됩니다. 클러스터링 방법 값이 다중 축척(OPTICS)인 경우 검색 거리는 연결 가능성 거리를 할당하기 위해 포인트를 찾기 위한 각 포인트 주변의 최대 거리입니다. 연결 가능성 거리는 포인트에서 아직 검색으로 방문하지 않은 가장 가까운 인접 피처까지의 거리입니다. 포인트의 코어 거리 내에 있는 포인트에는 연결 가능성 거리로 코어 거리가 할당됩니다. 포인트의 코어 거리는 각 포인트에서 정의된 최소 수의 피처까지 이동하는 데 필요한 거리 측정값입니다.
- 검색 거리 단위는 검색 거리 값의 단위입니다.
- 시간 필드는 각 피처에 대한 타임스탬프가 포함된 입력 레이어의 필드입니다. 이 매개변수는 클러스터링 방법 값이 정의된 거리(DBSCAN) 또는 다중 축척(Optics)인 경우에 사용할 수 있습니다. 시간 필드 값이 지정된 경우 검색 거리 및 검색 거리 단위 값도 입력해야 합니다.
- 검색 시간 간격은 피처가 시공간 클러스터를 형성하는지 여부를 결정하는 데 사용할 시간 간격입니다. 검색 시간 간격은 각 피처의 시간 전후에 걸쳐 있습니다. 예를 들어, 피처 주변의 3일 검색 시간 간격에는 피처의 시간 3일 전에 시작되어 3일 후에 종료되는 모든 피처가 포함됩니다.
- 검색 시간 단위는 검색 시간 간격의 단위입니다.
- 클러스터 민감도는 연결 가능성 플롯 내의 피크 모양(경사 및 높이 모두)이 클러스터를 분리하는 데 사용되는 방법입니다. 연결 가능성 플롯은 포인트의 연결 가능성 순서 및 해당 연결 가능성 거리를 플롯합니다. 매우 높은 클러스터 민감도 값(100에 가까움)은 연결 가능성 플롯의 가장 작은 피크까지도 클러스터 간 분리로 처리합니다. 매우 낮은 클러스터 민감도 값(0에 가까움)은 연결 가능성 플롯의 가장 가파르고 높은 피크만을 클러스터 간 분리로 처리합니다. 빈칸으로 남겨두면 도구는 Kullback-Leibler Divergence를 사용하여 민감도 값을 찾습니다.
결과 레이어
결과 레이어 그룹에는 다음 매개변수가 포함됩니다.
- 결과 이름은 생성되어 맵에 추가되는 레이어의 이름을 결정합니다. 이름은 고유해야 합니다. 기관에 동일한 이름의 레이어가 이미 있는 경우 도구를 사용할 수 없으며 다른 이름을 사용하라는 메시지가 표시됩니다.
- 폴더에 저장은 결과가 저장되는 내 콘텐츠의 폴더 이름을 지정합니다.
환경
분석 환경 설정은 도구의 결과에 영향을 주는 추가 매개변수입니다. 환경 설정 매개변수 그룹에서 도구의 분석 환경 설정에 접근할 수 있습니다.
이 도구는 다음과 같은 분석 환경을 적용합니다.
결과
이 도구는 포인트 레이어를 결과로 생성합니다. 클러스터링 방법 매개변수 값이 자체 조정(HDBSCAN) 또는 다중 축척(OPTICS)인 경우 도구는 차트도 결과로 생성합니다. 모든 클러스터링 방법 옵션의 결과 레이어에는 Cluster ID, Source ID, Color ID 필드가 포함됩니다. Cluster ID 필드는 각 포인트가 속한 클러스터를 식별합니다. 노이즈 포인트의 값은 -1입니다. Source ID 필드 값은 고유 식별자입니다. Color ID 필드 값은 포인트 및 해당 클러스터에 할당된 색상을 나타냅니다. 결과 레이어에 9개를 초과하는 클러스터가 포함된 경우, 각 색상에 여러 클러스터가 할당됩니다. 하지만 시각적으로 뚜렷하게 구분할 수 있도록, 인접한 클러스터에는 서로 다른 색상이 할당됩니다. 클러스터링 방법 매개변수 값이 자체 조정(HDBSCAN)인 경우 결과 포인트 레이어에는 다음과 같은 추가 필드가 포함됩니다.
- Probability 할당된 클러스터에 포인트가 속할 확률을 나타내는 0과 1 사이의 값입니다. 노이즈 포인트의 값은 0입니다.
- Outlier 포인트가 자체 클러스터 내에서 이상치일 수 있는지 여부를 나타내는 0과 1 사이의 값입니다. 노이즈 포인트는 단일 클러스터로 간주됩니다. 값이 크면 포인트가 이상치일 가능성이 더 높다는 뜻입니다.
- Exemplar 클러스터의 가장 대표적인 포인트인지 여부를 나타내는 0과 1 사이의 값입니다.
- Stability 다양한 척도 전반에서 각 클러스터의 지속성을 반영하는 값입니다. 값이 클수록 클러스터가 지속되는 거리 척도의 범위도 넓어집니다.
클러스터링 방법 매개변수 값이 다중 축척(OPTICS)인 경우 결과 레이어에 다음 추가 필드가 포함됩니다.
- Reachability order 분석을 위해 입력 피처의 순서가 지정된 방법입니다.
- Reachability distance 각 포인트와 방문하지 않은 가장 가까운 인접 피처 간의 거리입니다.
클러스터링 방법 매개변수 값이 자체 조정(HDBSCAN) 또는 다중 축척(OPTICS)인 경우 도구는 차트를 결과로 생성합니다. 다중 축척(OPTICS)은 각 클러스터의 밀도를 평가하는 데 사용할 수 있는 도달 가능성 플롯을 결과로 생성합니다. 자체 조정(HDBSCAN)은 할당된 클러스터에 피처가 속할 확률의 분포를 나타내는 멤버십 확률 차트의 분포를 결과로 생성합니다. 차트를 보려면 콘텐츠 도구모음에서 차트를 클릭합니다.
시간 필드 값이 지정된 경우 결과에 각 시공간 클러스터의 시간 범위를 표시하는 클러스터당 시간 범위 차트가 포함됩니다. 차트를 보려면 콘텐츠 도구모음에서 차트를 클릭합니다. 또한 결과 레이어에 각 포인트가 속한 클러스터의 시간 범위를 요약하는 다음 필드가 포함됩니다.
- 시작 시간은 피처가 속한 클러스터의 시작 시간입니다.
- 종료 시간은 피처가 속한 클러스터의 종료 시간입니다.
- 평균 시간은 피처가 속한 클러스터의 평균 시간입니다.
- 시간 과장
결과 레이어의 항목 페이지에서 분석의 추가 세부정보를 확인할 수 있습니다. 레이어의 항목 페이지에 접근하려면 설정 도구모음에서 분석 을 클릭합니다. 히스토리를 클릭하고 성공적으로 완료된 도구 실행을 찾아 클릭합니다. 분석 세부정보가 결과 탭에서 열립니다. 결과 레이어 옆에 있는 옵션 버튼을 클릭하고 세부정보 보기를 클릭합니다.
라이선싱 요구사항
이 도구에는 다음과 같은 라이선싱 및 구성이 필요합니다.
- Creator 또는 GIS Professional 사용자 유형
- Publisher, Administrator 역할 또는 동급의 사용자 설정 역할
리소스
다음과 같은 리소스를 사용하여 자세히 알아보세요.
- ArcGIS Pro의 밀도 기반 클러스터링
- ArcGIS REST API의 포인트 클러스터 찾기
- ArcGIS API for Python의 find_point_clusters