이상치 찾기 도구는 Anselin Local Moran's I 통계를 사용하여 통계적으로 유의한 핫스팟, 콜드스팟, 공간 이상치를 식별합니다.
예시
한 경찰 관할 구역에서는 해당 구역에서 절도 건수가 꾸준히 높은 지역을 파악하고자 합니다. 해당 구역에서는 이상치 찾기 도구를 사용하여 핫스팟에 해당하는 도로와 높은 값이 있는 이상치를 식별합니다. 경찰관은 해당 결과를 사용하여 예방 전략을 세우고, 부족한 인력을 배정하고, 이웃 감시 프로그램을 시작합니다.
사용 참고사항
이상치 찾기 도구에는 입력 피처, 이상치 설정, 결과 레이어에 대한 구성이 포함됩니다.
입력 피처
입력 피처 그룹에는 클러스터 및 이상치 분석이 수행될 포인트 또는 폴리곤 레이어인 입력 레이어 매개변수가 포함됩니다.
레이어 이름 아래에 피처 수가 표시됩니다. 해당 개수에는 필터를 사용하여 제거된 피처를 제외한 레이어의 모든 피처가 포함됩니다. 프로세싱 범위 등의 환경 설정은 피처 수에 반영되지 않습니다.
비고:
Web Mercator는 공간 분석에 적절한 투영이 아닙니다. 입력 레이어의 공간 기준 체계가 WGS 1984 Web Mercator(Auxiliary Sphere)인 경우 데이터는 분석에 현형 거리를 사용하기 위해 지리 좌표계로 변환됩니다.
이상치 설정
이상치 설정 그룹에는 다음 매개변수가 포함됩니다.
- 변수 유형은 분석이 피처 개수에 대해 수행될지 아니면 값에 대해 수행될지를 결정합니다. 옵션은 다음과 같습니다.
- 필드 — 분석이 분석 필드에 지정된 필드의 값에 적용됩니다.
- 포인트 개수 — 포인트 피처가 폴리곤 또는 셀로 집계되어 계산됩니다. 분석이 집계된 포인트 개수에 적용됩니다. 이 옵션은 입력 레이어가 포인트 피처인 경우 사용할 수 있습니다.
- 집계 모양 유형은 포인트 피처가 집계될 셀의 모양을 지정합니다. 이 매개변수는 변수 유형에 포인트 개수가 지정된 경우 사용할 수 있습니다. 다음과 같은 모양 옵션이 제공됩니다.
- 그물망 셀 — 포인트 피처가 그물망(사각형) 셀 내에 집계됩니다.
- 육각형 셀 — 포인트 피처가 육각형 셀 내에 집계됩니다.
- 폴리곤 레이어 — 포인트 피처가 집계 폴리곤 레이어에 의해 지정된 폴리곤 피처 내에 집계됩니다.
- 집계 폴리곤 레이어는 포인트가 집계될 폴리곤 피처가 포함된 레이어를 지정합니다. 이 매개변수는 집계 모양 유형에 폴리곤 레이어가 지정된 경우 사용할 수 있습니다.
- 포인트 발생 가능 위치 정의는 분석의 범위를 정의할 레이어입니다. 레이어 버튼을 사용하여 레이어를 선택하거나 입력 피처 그리기 버튼을 사용하여 입력으로 사용할 스케치 레이어를 생성할 수 있습니다. 레이어의 경계를 벗어나는 포인트는 분석에 포함되지 않습니다. 이 매개변수는 집계 모양 유형에 그물망 셀 또는 육각형 셀이 지정된 경우 사용할 수 있습니다.
- 분석 필드는 이상치를 결정하기 위해 분석될 필드를 지정합니다. 이 매개변수는 변수 유형에 필드가 지정된 경우 사용할 수 있습니다.
- 다음으로 나누기는 분석 필드 값 또는 집계된 포인트 개수를 나누는 방법을 결정합니다. 옵션은 다음과 같습니다.
- 필드 — 분석 필드 값을 나누는 데 사용할 입력 레이어의 필드입니다.
- 데이터 보강 — Esri 인구가 지정된 경우 Esri 인구 데이터로 피처 또는 집계 모양을 보강하고 분석 필드 값 또는 집계된 포인트 개수를 인구로 나눕니다. Esri 인구 데이터의 원본은 Esri 인구 통계 글로벌 커버리지입니다. 이 옵션을 사용할 경우 GeoEnrichment 서비스 및 크레딧이 추가로 소비됩니다.
집계 모양 유형은 포인트 피처가 집계될 셀의 모양을 지정합니다. 이 매개변수는 변수 유형에 포인트 개수가 지정된 경우 사용할 수 있습니다.
옵션은 다음과 같습니다.- 그물망 셀 — 포인트 피처가 그물망 셀 내에 집계됩니다.
- 육각형 셀 — 포인트 피처가 육각형 셀 내에 집계됩니다.
- 폴리곤 레이어 — 포인트 피처가 집계 폴리곤 레이어에 의해 지정된 폴리곤 피처 내에 집계됩니다.
- 최적화 옵션은 선택될 순열의 수가 도구의 성능(속도), 가상 P-Value의 정밀도(정밀도), 또는 둘 다(균형) 중 어떤 요소를 최적화할지 지정합니다. 관측된 Local Moran's I 값을 평가하고 대상 피처 주변에서 관측된 공간 분포를 찾을 가능성을 판단하기 위해 대상 피처의 인접 영역에 있는 피처가 순열로 배치됩니다. 순열은 대상 피처의 인접 영역에 있는 피처를 임의로 재배열하고 Local Moran's I 값을 계산합니다. 여러 순열을 사용하면 대상 피처에 대해 Local Moran's I 값의 분포가 결과로 생성됩니다. 그런 다음 관측된 Local Moran's I 값을 Local Moran's I 값의 분포와 비교하여 가상 P-Value가 계산됩니다. 다음과 같은 최적화 옵션이 제공됩니다.
- 속도 — 199회의 순열을 실행하여 도구가 실행되는 속도를 최적화합니다. 가능한 최소 가상 P-Value는 0.005입니다.
- 밸런스 — 499회의 순열을 실행하여 속도 및 정밀도를 모두 최적화합니다. 가능한 최소 가상 P-Value는 0.002입니다.
- 정밀도 — 999회의 순열을 실행하여 가상 P-Value의 정밀도를 최적화합니다. 가능한 최소 가상 P-Value는 0.001입니다.
- 랜덤 번호 시드는 랜덤 번호 생성기를 시작하는 정수(Integer) 값입니다. 랜덤 번호 생성기는 Local Moran I 값을 계산하기 전에 각 대상 피처의 인접 영역에 있는 피처를 순열하는 데 사용됩니다.
- 셀 크기는 각 셀의 측면 길이를 정의하는 숫자 값입니다.
- 셀 크기 단위는 셀 크기에 사용될 단위입니다. 지원되는 단위는 피트, 마일, 미터, 킬로미터입니다.
- 거리 밴드는 대상 피처의 인접 영역에 포함될 대상 피처로부터의 거리를 정의하는 숫자 값입니다. 거리 밴드 내에 속하는 모든 피처는 대상 피처의 인접 영역에 포함됩니다. 대상 피처가 높은 값이 포함된 클러스터의 일부인지 아니면 낮은 값이 포함된 클러스터의 일부인지, 그리고 피처가 이상값인지 여부를 판단하는 데 전체 인접 영역이 사용됩니다.
- 거리 밴드 단위는 거리 밴드의 단위입니다. 지원되는 단위는 피트, 마일, 미터, 킬로미터입니다.
결과 레이어
결과 레이어 그룹에는 다음 매개변수가 포함됩니다.
- 결과 이름은 생성되어 맵에 추가되는 레이어의 이름을 결정합니다. 이름은 고유해야 합니다. 기관에 동일한 이름의 레이어가 이미 있는 경우 도구를 사용할 수 없으며 다른 이름을 사용하라는 메시지가 표시됩니다.
- 폴더에 저장은 결과가 저장되는 내 콘텐츠의 폴더 이름을 지정합니다.
제한사항
이 도구에는 다음과 같은 제한 사항이 적용됩니다.
- 변수 유형이 포인트 개수로 지정된 경우 다음과 같은 제한 사항이 적용됩니다
- 입력 레이어에는 최소 60개의 포인트 피처가 포함되어야 합니다.
- 최소 30개의 집계 셀 또는 폴리곤에 하나 이상의 포인트 피처가 포함되어 있어야 합니다.
- 집계 셀 또는 폴리곤 내의 포인트 개수는 같을 수 없습니다. 집계 셀 또는 폴리곤 간의 포인트 개수에는 편차가 있어야 합니다.
- 변수 유형이 분석 필드로 지정된 경우 다음과 같은 제한 사항이 적용됩니다
- 최소 30개의 피처에는 지정된 분석 필드의 Null이 아닌 값이 포함되어 있어야 합니다.
- 지정된 분석 필드의 값은 같을 수 없습니다. 값 간에 편차가 있어야 합니다.
- 최소 30개의 포인트가 포인트 발생 가능 위치 정의에 지정된 경계 영역 내에 있어야 합니다.
- 셀 크기 값은 거리 밴드를 초과할 수 없습니다.
- Esri 인구 데이터 가용성은 입력 피처의 위치에 따라 달라집니다.
- 기관에 사용자 설정 GeoEnrichment서비스가 구성된 경우 다음으로 나누기 매개변수에 Esri 인구 데이터를 사용할 수 없습니다.
환경
분석 환경 설정은 도구의 결과에 영향을 주는 추가 매개변수입니다. 환경 설정 매개변수 그룹에서 도구의 분석 환경 설정에 접근할 수 있습니다.
이 도구는 다음과 같은 분석 환경을 적용합니다.
크레딧
ArcGIS Enterprise 포털이 ArcGIS GeoEnrichment Service를 사용하도록 구성되고 다음으로 나누기에 Esri 인구가 선택된 경우 크레딧이 사용됩니다.
자세한 내용은 공간 분석을 위한 크레딧 이해하기를 참고하세요.
결과
이 도구는 클러스터 및 이상치 분석의 결과를 사용하여 레이어의 결과를 생성합니다. 레이어에는 개수, 클러스터-이상치 유형, Local Moran's I 값, P-Value, Z-Score, 인접 피처의 수, 공간 시차, 각 피처의 z-변환에 대한 필드가 포함됩니다. 클러스터-이상치 유형 필드는 통계적으로 유의한 높은 값 클러스터(HH), 낮은 값 클러스터(LL), 낮은 값으로 둘러싸여 있는 높은 값 이상치(HL), 높은 값으로 둘러싸여 있는 낮은 값 이상치(LH), 유의하지 않은 결과(NS)로 구분됩니다. Local Moran's I 값은 피처 및 인접 영역에 유사한 값(양수) 또는 다른 값(음수)이 있는지 나타냅니다. 이상치는 Local Moran's Index 음수값을 가집니다.
결과 레이어의 항목 페이지에서 분석의 추가 세부정보를 확인할 수 있습니다. 레이어의 항목 페이지에 접근하려면 설정 도구모음에서 분석 을 클릭합니다. 히스토리를 클릭하고 성공적으로 완료된 도구 실행을 찾아 클릭합니다. 분석 세부정보가 결과 탭에서 열립니다. 결과 레이어 옆에 있는 옵션 버튼을 클릭하고 세부정보 보기를 클릭합니다.
라이선싱 요구사항
이 도구에는 다음과 같은 라이선싱 및 구성이 필요합니다.
- Creator 또는 GIS Professional 사용자 유형
- Publisher, Administrator 역할 또는 동급의 사용자 설정 역할
Esri 인구 데이터를 사용하려면 다음과 같은 권한 및 서비스가 필요합니다.
- GeoEnrichment 권한
- ArcGIS GeoEnrichment Service 또는 사용자 설정 GeoEnrichment 서비스
리소스
다음과 같은 리소스를 사용하여 자세히 알아보세요.
- ArcGIS Pro의 최적화된 이상치 분석
- ArcGIS Pro의 클러스터 및 이상치 분석(Anselin Local Morans I)
- ArcGIS REST API의 이상치 찾기
- ArcGIS API for Python의 find_outliers