Skip To Content

Geograficznie ważona regresja

Notatka:

Ta funkcja jest aktualnie obsługiwana tylko w przeglądarce map Map Viewer Classic (wcześniej noszącej nazwę Map Viewer). Będzie ona dostępna w przyszłej wersji nowej przeglądarki map Map Viewer.

Regresja ważona geograficznieWykonuje regresję ważoną geograficznie (Geographically Weighted Regression — GWR), która jest lokalną formą regresji liniowej używaną do modelowania relacji zróżnicowanych przestrzennie.

Diagram procedury wykonywania zadań

Diagram procedury wykonywania zadań regresji ważonej geograficznie

Analiza z użyciem narzędzi GeoAnalytics Tools

Analiza z użyciem narzędzi GeoAnalytics Tools jest uruchamiana przy zastosowaniu przetwarzania rozproszonego na wielu komputerach i rdzeniach ArcGIS GeoAnalytics Server. Narzędzia GeoAnalytics Tools oraz narzędzia do standardowej analizy obiektowej w oprogramowaniu ArcGIS Enterprise mają różne parametry i możliwości. Więcej informacji o tych różnicach można znaleźć w sekcji Różnice między narzędziami analizy obiektowej.

Przykłady

Poniżej podano przykładowe zastosowania tego narzędzia:

  • Czy relacja między poziomem wykształcenia i dochodem jest stała dla całego analizowanego obszaru?
  • Jakie są kluczowe zmienne wyjaśniające wysoką częstotliwość pożarów lasów?
  • Gdzie znajdują się okręgi, w których dzieci osiągają wysokie wyniki testów? Jakie charakterystyki wyglądają na powiązane? W którym miejscu każda z tych charakterystyk jest najbardziej istotna?

Uwagi dotyczące korzystania

To narzędzie wykonuje regresję ważoną geograficznie, lokalną formę regresji używaną do modelowania relacji zróżnicowanych przestrzennie. Narzędzie GWR udostępnia lokalny model zmiennej lub procesu, w przypadku których celem jest zrozumienie lub prognozowanie, dopasowując równanie regresji do każdego obiektu w zestawie danych. Narzędzie Regresja ważona geograficznie (GWR) tworzy te oddzielne równania, łącząc zmienne zależne i objaśniające obiektów w sąsiedztwie każdego obiektu docelowego. Kształt i zasięg każdego analizowanego sąsiedztwa bazują na danych wejściowych parametru Wybierz sposób określania sąsiedztwa.

Ponadto narzędzie Regresja ważona geograficznie (GWR) generuje obiekty wynikowe i diagnostykę. Wynikowe warstwy obiektowe są automatycznie dodawane do mapy ze schematem wyświetlania stosowanym do modelowania błędów. Poniżej podano pełne wyjaśnienie poszczególnych wyników.

Powszechną praktyką jest globalna eksploracja danych za pomocą narzędzia Generalizowana regresja liniowa przed przystąpieniem do lokalnej eksploracji danych za pomocą narzędzia GWR.

Parametry Wybierz pole do modelowania oraz Wybierz pola opisujące powinny być polami liczbowymi zawierającymi różne wartości. Wartości te powinny być zróżnicowane zarówno w skali globalnej, jak i lokalnej. Z tego powodu nie należy używać atrap zmiennych objaśniających do reprezentowania różnych systemów przestrzennych w modelu GWR (np. przypisywać wartości 1 do obwodów spisowych spoza rdzenia miasta, podczas gdy wszystkie pozostałe mają przypisaną wartość 0). Ponieważ narzędzie GWR umożliwia zróżnicowanie współczynników zmiennych objaśniających, te zmienne objaśniające system przestrzenny są zbędne, a jeśli zostaną dołączone, spowodują problemy z lokalną wieloliniowością.

W modelach regresji globalnej, takich jak Generalizowana regresja liniowa, wyniki są niewiarygodne, gdy co najmniej dwie zmienne wykazują wieloliniowość (gdy co najmniej dwie zmienne są nadmiarowe lub razem dają taką samą narrację). Narzędzie GWR tworzy lokalne równanie regresji dla każdego obiektu w zestawie danych. Gdy wartości konkretnej zmiennej objaśniającej łączą się przestrzennie, prawdopodobnie występują problemy z lokalną wieloliniowością. Pole liczbowe warunku (COND_ADG) w wynikowej klasie obiektów wskazuje, gdy wyniki są niestabilne z powodu lokalnej wieloliniowości. Co do zasady, należy być sceptycznym względem wyników dla obiektów z numerem warunku większym niż 30; równym Null lub (w przypadku plików shape) równym -1.7976931348623158e+308.

Należy zachować ostrożność przy włączaniu danych nominalnych lub jakościowych do modelu GWR. Gdy kategorie łączą się przestrzennie, istnieje duże ryzyko wystąpienia problemów z lokalną wieloliniowością. Numer warunku zawarty w danych wynikowych GWR wskazuje, gdy problemem jest lokalna współliniowość (numer warunku mniejszy niż zero, większy niż 30 lub o wartości Null). Wyniki w obecności lokalnej wieloliniowości są niestabilne.

Model regresji jest nieprawidłowo określony, jeśli brakuje mu kluczowej zmiennej objaśniającej. Istotna statystycznie autokorelacja przestrzenna błędów resztkowych regresji lub nieoczekiwane zróżnicowanie przestrzenne między współczynnikami jednej lub większej liczby zmiennych objaśniających sugerują, że dany model został określony nieprawidłowo. Należy dołożyć wszelkich starań (np. poprzez analizę błędów GLR i analizę wariacji współczynnika GWR), aby odkryć, jakie są te kluczowe brakujące zmienne, tak aby można je było włączyć do modelu.

Zawsze należy zadać sobie pytanie, czy ma sens, aby zmienna objaśniająca była niestacjonarna. Jako przykład weźmy modelowanie zagęszczenia poszczególnych gatunków roślin jako funkcję kilku zmiennych, w tym zmiennej EKSPOZYCJA. Jeśli zauważysz, że współczynnik dla zmiennej EKSPOZYCJA zmienia się w całym analizowanym obszarze, prawdopodobnie widzisz dowody na brak kluczowej zmiennej objaśniającej (na przykład może to być przewaga roślinności konkurencyjnej). Należy dołożyć wszelkich starań, aby włączyć wszystkie kluczowe zmienne objaśniające do danego modelu regresji.

Poważne problemy z projektowaniem modelu lub błędy wskazujące, że lokalne równania nie obejmują wystarczającej liczby sąsiadów, często wskazują na problem z globalną lub lokalną wieloliniowością. Aby określić źródło problemu, uruchom model globalny z użyciem generalizowanej regresji liniowej i sprawdź wartość VIF dla każdej zmiennej objaśniającej. Jeśli niektóre z wartości VIF są duże (np. powyżej 7,5), globalna wieloliniowość uniemożliwia rozwiązanie GWR. Bardziej prawdopodobne jest jednak, że problemem jest lokalna wieloliniowość. Spróbuj utworzyć mapę tematyczną dla każdej zmiennej objaśniającej. Jeśli mapa ujawnia grupowanie przestrzenne identycznych wartości, należy rozważyć usunięcie tych zmiennych z modelu lub połączenie tych zmiennych z innymi zmiennymi objaśniającymi w celu zwiększenia wariacji wartości. Przykładowo przy modelowaniu wartości w domu, jeśli istnieją zmienne dla sypialni i łazienek, można je połączyć w celu zwiększenia wariacji wartości lub przedstawić je w postaci powierzchni łazienka/sypialnia. Podczas tworzenia modeli GWR należy unikać stosowania atrap zmiennych systemów przestrzennych, przestrzennego grupowania zmiennych jakościowych lub nominalnych oraz korzystania ze zmiennych o bardzo niewielu możliwych wartościach.

Regresja ważona geograficznie (Geographically Weighted Regression — GWR) to model liniowy objęty takimi samymi wymaganiami jak Generalizowana regresja liniowa. Aby poprawnie określić model GWR, należy uważnie przejrzeć diagnostyki wyjaśnione w sekcji Jak działa narzędzie Regresja ważona geograficznie. Sekcja Jak się psują modele regresji w temacie Podstawy analizy regresji również zawiera informacje przydatne do zapewnienia dokładności modelu.

Parametrami zmiennej zależnej i zmiennej objaśniającej powinny być pola liczbowe obejmujące zakres wartości. To narzędzie nie może wyznaczyć rozwiązania, gdy zmienne mają takie same wartości (na przykład wtedy, gdy wszystkie zmienne dla pola mają wartość 9.0).

Obiekty z jedną lub większą liczbą wartości pustych lub z pustymi wartościami ciągów znakowych w polach prognozy lub opisujących zostaną wykluczone z danych wynikowych. Jeśli to konieczne, możesz zmodyfikować wartości za pomocą narzędzia Oblicz pole.

Należy dokonać wizualnej kontroli przeszacowań i niedoszacowań w błędach resztkowych regresji, aby sprawdzić, czy dostarczają informacje o potencjalnych brakujących zmiennych w modelu regresji.

Gdy punkty przecięcia, oszacowania współczynników, wartości prognozowane, błędy i liczby warunków mają wartość NULL, model potencjalnie ma nieprawidłowe dopasowanie. Może to występować dla jednego lub większej liczby obiektów w modelu i być spowodowane następującymi przyczynami:

  • Niewystarczająca liczba sąsiadów. Obiekty bez co najmniej dwóch sąsiadów nie będą mieć dopasowania modelu.
  • Wieloliniowość w modelu.

W powyższych przypadkach model powinien być oceniany poprzez badanie diagnostyk wynikowych i potencjalnie uzupełniany o różne parametry i współczynniki.

Dane wynikowe

Narzędzie Regresja ważona geograficznie generuje różnorodne dane wynikowe. Podsumowanie modelu GWR i podsumowania statystyczne są dostępne na stronie elementu portalu i jako zasób w warstwie. Aby uzyskać dostęp do podsumowania wyników, kliknij opcję Pokaż wyniki Pokaż wyniki pod wynikową warstwą w przeglądarce map Map Viewer Classic. Narzędzie generuje jedną warstwę wynikową. Obiekty wynikowe są automatycznie dodawane do przeglądarki map Map Viewer Classic ze schematem wyświetlania zimno/gorąco zastosowanym do modelowania błędów. Generowana diagnostyka zależy od typu modelu obiektów wejściowych. Opis znajduje się poniżej.

Ciągły (gaussowski)

Interpretowanie komunikatów i diagnostyki

  • AICc — AICc stosuje korekcję odchylenia do miary AIC dla małych próbek. Miara AICc będzie zbliżała się do miary AIC wraz ze wzrostem liczby obiektów w danych wejściowych.
  • R kwadrat — R kwadrat jest miarą dokładności dopasowania. Jej wartość należy do zakresu od 0,0 do 1,0, przy czym preferowane są większe wartości. Można ją interpretować jako proporcję wariancji wyliczonej dla zmiennej zależnej w stosunku do modelu regresji. Denominatorem dla obliczeń R kwadrat jest suma kwadratów wartości zmiennej zależnej. Dodanie dodatkowej zmiennej objaśniającej do modelu nie zmienia denominatora, ale zmienia licznik; sprawia to wrażenie udoskonalenia dopasowania modelu, ale może tak nie być. Patrz Dostosowany R kwadrat poniżej.

Ograniczenia

Implementacja regresji ważonej geograficznie dostępna w narzędziach GeoAnalytics ma następujące ograniczenia:

  • Nie można prognozować na inną warstwę ani utworzyć warstw współczynników rastra.
  • Nie można modelować zmiennej binarnej (logistycznej) ani zmiennej licznika (wartość Poissona).
  • Nie można zdefiniować wyszukiwania w sąsiedztwie metodą złotego podziału lub przedziałów ręcznych.

Przykład użycia interfejsu ArcGIS API for Python

Narzędzie Regresja ważona geograficznie jest dostępne za pośrednictwem interfejsu ArcGIS API for Python.

W tym przykładzie znajdowane są relacje dotyczące sprzedaży w sklepach w całym kraju.


# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password")
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Search for and list the big data file shares in your portal
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for the big data file share of interest
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_SalesData")

# Look through the big data file share for 2018 sales
sales_2018 = next(x for x in bdfs_search.layers if x.properties.name == "2018_Sales")

# Run the GWR tool
gwr_result = arcgis.geoanalytics.analyze_patterns.gwr(input_layer = sales_2018, 
    explanatory_variables = "population, customers",
    dependent_variable = "total_sales"
    model_type = "Continuous",
    neighborhood_type = "NumberOfNeighbors",
    neighborhood_selection_method = "UserDefined",
    number_of_neighbors = "100",
    local_weighting_scheme = "BiSquare",
    output_trained_name = "GWR_results")

# Visualize the results if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(gwr_result)
processed_map

Podobne narzędzia

Za pomocą narzędzia Regresja ważona geograficznie serwera ArcGIS GeoAnalytics Server można modelować relacje zróżnicowane przestrzennie. Do rozwiązywania podobnych, ale nieco innych problemów, mogą być przydatne inne narzędzia.

Narzędzia analizy Map Viewer Classic

Generalizowane liniowe modele i prognozy można tworzyć za pomocą narzędzia Generalizowana regresja liniowa serwera ArcGIS GeoAnalytics Server.

Narzędzie Klasyfikacja i regresja oparta na zespołach drzew decyzyjnych serwera ArcGIS GeoAnalytics Server umożliwia tworzenie modeli i prognoz.

Narzędzia analizy aplikacji ArcGIS Pro

Aby możliwe było uruchomienie tego narzędzia z poziomu aplikacji ArcGIS Pro, aktywny portal musi być w wersji Enterprise 10.8 lub nowszej. Należy zalogować się do portalu przy użyciu konta z uprawnieniami do wykonywania analizy obiektowej w ramach analizy geoprzestrzennej.

Podobne operacje regresji można wykonać w aplikacji ArcGIS Pro, używając narzędzia geoprzetwarzania Regresja ważona geograficznie dostępnego w ramach skrzynki narzędziowej Statystyki przestrzenne.

Modele i prognozy można tworzyć przy użyciu dostosowanego algorytmu losowych zespołów drzew decyzyjnych (lasów) opracowanego przez Leo Breimana w aplikacji ArcGIS Pro, korzystając z narzędzia geoprzetwarzania Klasyfikacja i regresja oparta na zespołach drzew decyzyjnych dostępnego w ramach skrzynki narzędziowej Statystyki przestrzenne.