비고:
현재 이 기능은 Map Viewer Classic(이전의 Map Viewer)에서만 지원됩니다.
핫스팟 찾기 도구는 데이터의 공간 패턴에 통계적으로 유의한 클러스터링이 있는지 확인합니다.
워크플로 다이어그램
GeoAnalytics Tools를 사용하여 분석
GeoAnalytics Tools를 사용하는 분석은 여러 ArcGIS GeoAnalytics Server 머신 및 코어에서 분산 처리를 사용하여 실행됩니다. ArcGIS Enterprise의 GeoAnalytics Tools 및 표준 피처 분석 도구에는 다양한 매개변수와 기능이 있습니다. 이러한 차이점에 대한 자세한 내용은 피처 분석 도구의 차이점을 참고하세요.
예시
다음은 도구의 사용 예시입니다.
한 도시의 경찰서에서 강력 범죄와 실업률 간에 관계가 있는지를 확인하기 위한 분석을 수행하려고 합니다. 강력 범죄 발생률과 실업률이 높은 지역의 고등학교를 대상으로 하계 단기 고용 프로그램을 연장 구현할 예정입니다. 핫스팟 찾기를 사용하여 통계적으로 유의한 범죄 및 실업 핫스팟이 있는 영역을 찾으려고 합니다.
자연보호관은 처리가 필요한 숲의 우선순위를 정하고 내성이 나타나는 영역에 대해 자세히 파악하기 위해 수병을 연구하고 있습니다. 핫스팟 찾기 도구를 사용하면 수병에 감염된(핫스팟) 나무와 정상 상태(콜드스팟)의 나무 클러스터를 찾을 수 있습니다.
사용 참고 사항
입력 피처는 반드시 포인트여야 합니다. 포인트는 사각형 격자(그룹) 내에 집약된 피처에 의해 분석됩니다.
결과 레이어에는 각 피처의 통계적 유의도, p 값, z-점수 등의 정보가 들어 있는 추가 필드가 포함됩니다.
핫스팟 찾기에서는 시간 단계를 사용하여 분석을 선택적으로 수행할 수 있습니다. 각 시간 단계는 시간 단계 외부의 피처와 독립적으로 분석됩니다. 시간 단계를 사용하려면 입력 데이터에 시간이 활성화되어 있고 인스턴트 시간을 나타내야 합니다. 시간 단계가 적용되면 결과 피처는 START_DATETIME 필드와 END_DATETIME 필드에서 나타낸 시간 간격입니다.
핫스팟 찾기를 사용하려면 영역 레이어에 투영 좌표계가 사용되어야 합니다. 데이터에 투영 좌표계가 사용되지 않고 투영 처리 좌표계를 설정하지 않은 경우 World Cylindrical Equal Area(WKID 54034)가 사용됩니다.
현재 맵 범위 사용을 선택한 경우 현재 맵 범위 내에 보이는 피처만 분석됩니다. 선택하지 않으면 현재 맵 범위 외부에 있는 피처를 포함하여 입력 레이어에 있는 모든 입력 피처가 분석됩니다.
핫스팟 찾기 작동 방식
무작위 공간 패턴도 어느 정도의 클러스터링을 나타냅니다. 또한 사람의 눈과 뇌는 아무 것도 없는 경우에도 자연적으로 패턴을 찾으려고 시도합니다. 따라서 데이터의 패턴이 실제 공간 프로세스의 결과인지 아니면 단순히 우연의 일치인지 구분하기가 어려울 수 있습니다. 이러한 이유로 연구 기관과 분석 기관에서는 핫스팟 찾기(Getis-Ord Gi*)와 같은 통계 방법을 사용하여 공간 패턴을 정량화합니다.
이 도구는 데이터셋의 각 피처에 대해 Getis-Ord Gi*("G-i-star"로 발음함) 통계를 계산합니다. 결과 z-점수와 p 값을 통해 높은 값 또는 낮은 값을 가진 피처가 공간적으로 클러스터되는 위치를 파악할 수 있습니다. 각 피처는 네이버후드 피처의 컨텍스트 내에서 분석됩니다. 높은 값을 가진 피처는 관심 영역에 속하지만 통계적으로 유의한 핫스팟이 아닐 수 있습니다. 통계적으로 유의한 핫스팟이 되기 위해서는 피처가 높은 값을 가질 뿐 아니라 높은 값을 가진 다른 피처로 둘러싸여 있어야 합니다. 피처 및 해당 네이버에 대한 로컬 합계를 전체 피처 합계 대비 비율로 비교하여 로컬 합계가 예상 로컬 합계와 매우 다른 경우, 그리고 그 차이가 너무 커서 무작위적 우연의 결과가 될 수 없는 경우에 통계적으로 유의한 z-score가 결과로 생성됩니다.
데이터에서 통계적으로 유의한 클러스터링을 찾으면 중요한 정보를 얻게 됩니다. 클러스터링이 발생한 위치와 시점을 알면 확인한 패턴을 생성하는 프로세스에 대한 중요한 단서를 얻을 수 있습니다. 예를 들어 특정 거주 지역에서 주거 침입 사건이 지속적으로 증가하는 것을 안다는 것은 효과적인 예방 전략을 수립하거나, 부족한 경찰 인력을 배정하거나, 거주 지역 감시 프로그램을 시작하거나, 강도 높은 수사를 승인하거나, 잠재적 용의자를 파악해야 하는 경우에 매우 중요한 정보입니다.
포인트 피처 분석
다양한 데이터를 포인트 피처로 사용할 수 있습니다. 포인트로 가장 자주 표현되는 피처의 예시에는 범죄 사건, 학교, 병원, 긴급 통화, 교통 사고, 우물, 나무, 보트 등이 있습니다. 경우에 따라 각 포인트 피처와 연관된 데이터 값(필드)을 분석하거나, 포인트 자체의 클러스터링만 평가할 수도 있습니다. 필드 제공 여부에 대한 결정은 질문에 따라 달라집니다.
높은 포인트 개수 및 낮은 포인트 개수의 클러스터 찾기
일부 포인트 데이터의 경우 일반적으로 각 포인트가 이벤트, 사건 또는 존재/부재의 암시를 나타내면 사용할 명확한 분석 필드가 없는 것입니다. 이러한 경우 클러스터링이 비정상적으로(통계적으로 유의) 강하거나 약한 곳만 파악할 수 있습니다. 이 분석에서는 영역 피처(도구에 의해 생성되는 그룹 그리드)가 포인트 위에 배치되고 각 영역에 속한 포인트 수가 계산됩니다. 그런 다음 도구에서는 각 영역 피처와 연관된 높은 포인트 개수 및 낮은 포인트 개수를 찾습니다.
결과 해석
핫스팟 찾기 도구의 결과는 맵입니다. 이 결과 레이어 맵의 포인트 또는 영역에 대해 표시되는 빨간색 또는 파란색의 색상이 진할수록 클러스터링이 무작위적 우연의 결과가 아니라는 점을 더욱 확신할 수 있습니다. 반면, 연하게 나타난 포인트나 영역은 통계적으로 유의한 클러스터에 속하지 않습니다. 이러한 피처와 연관된 공간 패턴은 무작위적 우연의 결과일 수도 있습니다. 경우에 따라 분석 결과에 통계적으로 유의한 클러스터가 없음을 나타낼 수도 있습니다. 이는 중요한 정보입니다.
무작위적인 공간 패턴이 주어진 경우 기본 원인에 대한 단서가 없습니다. 이러한 경우에는 결과 레이어의 모든 피처가 연하게 나타납니다. 그러나 통계적으로 유의한 클러스터링을 찾을 때 클러스터링이 발생한 위치는 클러스터링 생성 원인에 대한 중요한 단서를 제공합니다. 예를 들어 특정 환경 독성물과 연관된 암에 대한 통계적으로 유의한 클러스터링을 찾으면 사람들을 보호하기 위한 정책과 방침을 수립하는 데 도움이 될 수 있습니다. 마찬가지로 방과 후 스포츠 프로그램을 권장하는 학교와 연관된 아동 비만에 대한 콜드스팟을 찾으면 이러한 유형의 프로그램을 보다 폭넓게 권장할 수 있는 강력한 타당성을 제공할 수 있습니다.
제한 사항
입력에는 포인트 레이어가 포함되어야 하며 입력은 분석에 앞서 지정한 크기의 그룹으로 집약됩니다. 집계 없이 핫스팟을 찾으려는 경우 또는 입력이 폴리곤 레이어인 경우에는 표준 피처 분석 도구인 핫스팟 찾기를 사용합니다.
ArcGIS API for Python 예시
핫 스팟 찾기 도구는 ArcGIS API for Python을 통해 제공됩니다.
이 예시에서는 범죄 유형이 국내인 범죄의 핫 스팟을 찾습니다.
# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
from arcgis.geoanalytics import analyze_patterns
# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password")
if not portal.geoanalytics.is_supported():
print("Quitting, GeoAnalytics is not supported")
exit(1)
# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")
# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_PoliceData")
# Look through the big data file share for Crimes
crimes = next(x for x in bdfs_search.layers if x.properties.name == "Crimes")
# Set the tool environment settings and apply a filter to crimes
arcgis.env.verbose = True
crimes.filter = "Domestic = 'TRUE'"
# Find hot spot of domestic crime occurrence with hot spot cell size of 1 mile
hot_spots_result = analyze_patterns.find_hot_spots(point_layer = crimes,
bin_size = 1,
bin_size_unit = 'Miles',
neighborhood_distance = 5,
neighborhood_distance_unit = 'Miles',
output_name = "Crimes_Hotspots")
# Visualize the tool results if you are running Python in a Jupyter Notebook
processed_map = portal.map('City, State', 10)
processed_map.add_layer(hot_spots_result)
processed_map
유사한 도구
핫스팟 찾기를 사용하여 데이터의 공간 패턴에 통계적으로 유의한 클러스터링이 있는지 확인합니다. 다음과 같은 기타 도구를 사용할 수 있습니다.
Map Viewer Classic 분석 도구
표준 분석 도구를 사용하여 영역 내의 핫스팟을 찾으려는 경우 핫스팟 찾기를 참고하세요.
데이터의 공간 패턴에 이상치가 있는지 확인하려는 경우 이상치 찾기 표준 도구를 사용합니다.
포인트 또는 라인 피처를 사용하여 밀도 맵을 생성하려는 경우에는 GeoAnalytics Tools 밀도 계산 또는 밀도 계산 표준 도구를 사용합니다.
ArcGIS Pro 분석 도구
GeoAnalytics Tools 핫스팟 찾기는 ArcGIS Pro에서 제공됩니다.
핫스팟 찾기는 핫스팟 분석(Getis-Ord Gi*)과 최적화된 핫스팟 분석 도구에서 사용되는 것과 동일한 통계를 실행합니다.