Skip To Content

커널 밀도 작동 방식

Image Server에서 이용 가능

밀도 계산 도구는 해당 피처 주변 인접 영역의 피처 밀도를 계산합니다. 포인트 및 라인 피처 모두에 대해 계산할 수 있습니다.

가능한 용도로는 커뮤니티 계획 목적을 위한 주택 밀도 또는 범죄 발생 분석 및 도로 또는 유틸리티 라인이 야생동물 서식지에 미치는 영향 조사가 있습니다. 인구 필드는 일부 피처에 다른 피처보다 가중치를 더 많이 적용하거나 하나의 포인트가 여러 관측을 나타낼 수 있도록 하는 데 사용할 수 있습니다. 예를 들어, 하나의 주소가 6개 단위로 구성된 콘도를 나타낼 수도 있고 전체 범죄 수준을 결정하는 데 있어 일부 범죄에 다른 범죄보다 가중치를 더 많이 적용할 수도 있습니다. 라인 피처의 경우 분할된 고속도로가 좁은 비포장 도로보다 더 큰 영향을 미칠 수 있습니다.

커널 밀도 계산 방법

커널 밀도는 피처에 따라 다르게 계산됩니다.

포인트 피처

밀도 계산은 각 결과 래스터 셀 주변의 포인트 피처 밀도를 계산합니다.

개념적으로는, 매끄러운 곡선 표면이 각 포인트에 맞게 조정됩니다. 표면 값은 포인트 위치에서 가장 높으며 포인트로부터 거리가 증가함에 따라 작아집니다. 포인트로부터 검색 반경 거리에서는 0이 됩니다. 원형 인접 영역만 가능합니다. 표면 아래의 부피는 포인트에 대한 인구 필드 값과 같거나 NONE이 지정된 경우 1입니다. 각 결과 래스터 셀의 밀도는 래스터 셀 중심을 중첩하는 모든 커널 표면의 값을 추가하여 계산됩니다. 커널 함수는 Silverman(1986, 76페이지, 방정식 4.5)에 설명된 4차 커널 함수를 기반으로 합니다.

NONE 이외의 인구 필드 설정을 사용하는 경우 각 항목의 값에 따라 포인트를 계산하는 횟수가 결정됩니다. 예를 들어 값이 3이면 포인트가 3포인트로 계산됩니다. 값은 정수 또는 부동 소수점일 수 있습니다.

기본 설정에 따라 단위는 입력 포인트 피처 데이터의 투영 정의의 선형 단위를 기반으로 선택되거나 결과 좌표계 환경 설정에 지정된 대로 선택됩니다.

결과 면적 단위 계수를 선택한 경우 결과 래스터에 작성하기 전에 셀에 대해 계산된 밀도에 적절한 계수를 곱합니다. 예를 들어 입력 단위가 미터인 경우 결과 면적 단위는 제곱킬로미터로 기본 설정됩니다. 미터의 단위 크기 계수를 킬로미터와 비교한 최종 결과는 1,000,000(1,000미터 × 1,000미터)의 승수만큼 값이 달라집니다.

라인 피처

커널 밀도는 각 결과 래스터 셀 인접 영역에 있는 선형 피처의 밀도를 계산할 수도 있습니다.

개념적으로는, 매끄러운 곡선 표면이 각 라인에 맞게 조정됩니다. 해당 값은 라인에서 가장 크며 라인에서 멀어짐에 따라 작아져 라인으로부터 지정된 검색 반경 거리에서는 0이 됩니다. 표면은 표면 아래의 부피가 라인 길이와 인구 필드 값의 곱과 같도록 정의됩니다. 각 결과 래스터 셀의 밀도는 래스터 셀 중심을 중첩하는 모든 커널 표면의 값을 추가하여 계산됩니다. 라인에 대한 커널 함수 사용은 Silverman(1986, 76페이지, 방정식 4.5)에 설명된 포인트 밀도에 대한 4차 커널 함수에서 응용됩니다.

라인 피처에 대한 커널 밀도
라인 세그먼트 및 그 위에 맞게 조정된 커널 표면이 표시됩니다.

위의 설명에서는 라인 세그먼트 및 그 위에 맞게 조정된 커널 표면을 보여줍니다. 밀도에 대한 라인 세그먼트의 기여는 래스터 셀 중심에서 커널 표면의 값과 같습니다.

기본 설정에 따라 단위는 입력 포인트 피처 데이터의 투영 정의의 선형 단위를 기반으로 선택되거나 결과 좌표계 환경 설정에 지정된 대로 선택됩니다.

결과 면적 단위 계수가 지정되면, 길이 및 면적 모두의 단위가 변환됩니다. 예를 들어 입력 단위가 미터인 경우 결과 면적 단위는 제곱킬로미터로 기본 설정되며, 결과 라인 밀도 단위는 제곱킬로미터당 킬로미터로 변환됩니다. 미터의 단위 크기 계수를 킬로미터와 비교한 최종 결과는 1,000의 승수만큼 밀도 값이 달라집니다.

적절한 계수를 수동으로 선택하여 포인트 및 라인 피처 모두에 대한 밀도 단위를 제어할 수 있습니다. 밀도를 제곱미터당 미터로 설정하려면(기본값인 제곱킬로미터당 킬로미터 대신) 면적 단위를 제곱미터로 설정합니다. 마찬가지로, 결과 밀도 단위를 제곱마일당 마일로 설정하려면 면적 단위를 제곱마일로 설정합니다.

NONE 이외의 인구 필드가 사용되는 경우, 라인의 길이는 실제 길이와 해당 라인의 인구 필드 값의 곱으로 간주됩니다.

커널 밀도 계산 공식

다음 공식은 포인트의 커널 밀도가 계산되는 방법 및 커널 밀도 공식 내에서 기본 검색 반경이 결정되는 방법을 정의합니다.

포인트의 밀도 예측

새로운 (x,y) 위치에서의 예측 밀도는 다음 공식에 따라 결정됩니다.

예측된 밀도 공식

여기서 각 항목 정보는 다음과 같습니다.

  • i = 1,…,n은 입력 포인트입니다. 포인트가 (x,y) 위치의 반경 거리 내에 있는 경우에만 합계에 포인트를 포함합니다.
  • popi는 매개변수 옵션인 포인트 i의 인구 필드 값입니다.
  • disti는 포인트 i와 (x,y) 위치 사이의 거리입니다.

그런 다음 계산된 밀도에 포인트 수 또는 인구 필드의 합계(제공된 경우)를 곱합니다. 이러한 보정을 통해 공간 적분이 항상 1이 아닌 포인트의 수(또는 인구 필드의 합계)와 동일하게 됩니다. 이 구현에서는 Quartic 커널(Silverman, 1986)을 사용합니다. 밀도를 추정하려는 모든 위치에 대해 공식을 계산해야 합니다. 계산은 래스터가 생성되기 때문에 계산은 결과 래스터의 모든 셀 중심에 적용됩니다.

기본 검색 반경(대역폭)

대역폭이라고도 하는 기본 검색 반경을 결정하는 데 사용되는 알고리즘은 다음을 수행합니다.

  1. 입력 포인트의 평균 중심을 계산합니다. 인구 필드가 제공된 경우 해당 필드 및 다음의 모든 계산에 해당 필드 값에 따라 가중치가 적용됩니다.
  2. 모든 포인트에 대한 (가중치) 평균 중심으로부터의 거리를 계산합니다.
  3. 이러한 거리의 (가중치) 중앙값인 Dm을 계산합니다.
  4. (가중치) 표준 거리인 SD를 계산합니다.
  5. 다음 공식을 적용하여 대역폭을 계산합니다.

커널 밀도에 대한 기본 검색 반경 계산 공식

여기서 각 항목 정보는 다음과 같습니다.

  • Dm은 (가중치) 평균 중심으로부터의 (가중치) 중앙값 거리입니다.
  • n은 인구 필드가 사용되지 않은 경우 포인트 수이며, 인구 필드가 제공된 경우 n은 인구 필드 값의 합계입니다.
  • SD는 표준 거리입니다.

방정식의 min 부분은 두 옵션인 SD 또는 검색 반경 방정식의 옵션 2의 결과 중 더 작은 값이 사용된다는 것을 의미합니다.

표준 거리를 계산하는 방법에는 비가중치 및 가중치 두 가지가 있습니다.

비가중치 거리

비가중치 거리 방정식

여기서 각 항목 정보는 다음과 같습니다.

  • x i , y i , z i 는 피처 i 의 좌표입니다.
  • {x̄, ȳ, z̄}는 피처의 평균 중심을 나타냅니다.
  • n 은 총 피처 수와 같습니다.

가중치 거리

가중치 거리 방정식

여기서 각 항목 정보는 다음과 같습니다.

  • wi는 피처 i 의 가중치입니다.
  • {x w, y w, z w}는 가중치 평균 중심을 나타냅니다.

방법론

검색 반경을 선택하기 위한 이 방법론은 Silverman의 Rule-of-thumb 대역폭 추정 공식을 기반으로 하지만 2차원에 맞게 조정되었습니다. 기본 반경을 계산하는 이러한 접근 방식은 일반적으로 희박한 데이터셋에서 자주 발생하는 포인트 주변의 링 현상을 방지하고 나머지 포인트에서 멀리 떨어져 있는 몇 개의 포인트인 공간 이상치에 저항합니다.

경계가 밀도 계산에 미치는 영향

경계는 결과 래스터 셀에 대한 커널 밀도를 계산하는 동안 피처의 영향을 변경합니다. 경계는 폴리라인 또는 폴리곤 피처 레이어일 수 있습니다. 경계는 피처와 밀도가 계산되는 셀 사이의 거리를 늘리거나 계산에서 피처를 제외하는 두 가지 방식으로 밀도 계산에 영향을 미칠 수 있습니다.

경계가 없으면 피처와 셀 사이의 거리는 가능한 가장 짧은 거리, 즉 포인트 사이의 직선이 됩니다. 일반적으로 폴리라인으로 표시되는 개방된 경계가 있으면, 피처와 셀 사이의 경로는 경계의 영향을 받습니다. 이 경우 다음 그림과 같이 경계 주변의 우회로 인해 피처와 셀 사이의 거리가 연장됩니다. 따라서 셀에서 밀도를 추정하는 동안 피처의 영향이 줄어듭니다. 경계 주변 경로는 입력 포인트 피처에서 셀까지 경계를 우회하는 일련의 직선을 연결하여 생성됩니다. 역시 경계 주변의 최단 거리이지만 경계가 없는 경우의 거리보다 깁니다. 일반적으로 몇 개의 피처를 완전히 에워싸는 폴리곤으로 표시되는 폐쇄된 경계가 있으면 경계 한쪽에 있는 셀의 밀도 계산에서 경계의 다른 쪽에 있는 피처가 완전히 제외됩니다.

경계가 있거나 없는 커널 밀도의 거리 계산에 대한 개념 그림입니다.
셀과 입력 포인트 피처 사이의 거리 계산에 대한 개념 그림이 표시됩니다. 좌측이 경계가 없는 커널 밀도이고 우측이 경계가 있는 커널 밀도입니다.

경계가 있는 커널 밀도 연산은 경계가 없는 커널 밀도 연산에 비해 어떤 상황에서는 보다 사실적이고 정확한 결과를 제공할 수 있습니다. 예를 들어, 양서류 종의 분포 밀도를 살펴볼 때 절벽이나 도로의 존재가 이동에 영향을 미칠 수 있습니다. 절벽이나 도로를 경계로 사용하여 밀도를 더 잘 추정할 수 있습니다. 마찬가지로, 도시를 통과하는 강이 경계로 간주되는 경우 도시의 범죄율에 대한 밀도 분석 결과가 달라질 수 있습니다.

다음 그림에서는 로스앤젤레스에서 심야 교통사고의 커널 밀도 결과를 보여줍니다(로스앤젤레스 카운티 GIS 데이터 포털에서 데이터 제공). 좌측(1)이 경계가 없는 밀도 추정이고 우측(2)이 도로 양쪽에 경계가 있는 밀도 추정입니다. 이 도구는 사건 위치 사이의 최단 거리를 사용하는 대신 도로 네트워크를 따라 거리가 측정되는 경계를 사용하여 훨씬 더 나은 밀도 추정을 제공합니다.

경계가 있거나 없는 커널 밀도
경계가 없는 커널 밀도 추정(1) 및 도로 양쪽에 경계가 있는 커널 밀도 추정(2)이 표시됩니다.

참조

Silverman, B. W. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall, 1986.