Skip To Content

Географически взвешенная регрессия

Географически взвешенная регрессия выполняет Географически взвешенную регрессию (ГВР) - локальную форму линейной регрессии, используемую для моделирования пространственных отношений.

Схема рабочего процесса

Схема рабочего процесса инструмента Географически взвешенная регрессия

Анализ с помощью GeoAnalytics Tools

Анализ, выполняемый с помощью GeoAnalytics Tools работает с использованием распределенной обработки по нескольким компьютерам ArcGIS GeoAnalytics Server и ядрам. GeoAnalytics Tools и стандартные инструменты анализа ArcGIS Enterprise имеют различные параметры и возможности. Более подробно об этих различиях см. в разделе Различия между инструментами анализа объектов.

Примеры

  • Имеется ли связь между уровнем образования и доходом в изучаемой области?
  • Какие ключевые переменные объясняют высокую частоту лесных пожаров?
  • В каких районах учащиеся показывают высокие результаты на экзаменах и олимпиадах? Какие особенности могут быть с этим связаны? Где каждая из характеристик имеет наибольшее значение?

Примечания по использованию

Инструмент выполняет Географически взвешенную регрессию, локальную форму линейной регрессии, используемую для моделирования пространственных отношений. Метод ГВР создает локальную модель переменной или процесса, которые вы прогнозируете или изучаете, применяя уравнение регрессии к каждому пространственному объекту в наборе данных. Географически взвешенная регрессия (ГВР) создает отдельные уравнения путем включения зависимых и независимых переменных объектов, попадающих в окрестности каждого целевого объекта. Форма и экстент каждой окрестности анализируется на основании входных данных для параметров Выбрать, как будет определяться окрестность.

Инструмент Географически взвешенная регрессия (ГВР) также создает выходные объекты и результаты диагностики. Выходные слои объектов автоматически добавляется на карту со схемой отображения, применяемой к модели невязок. Полное пояснение по каждому результату приведено ниже.

К общепринятым рекомендациям относится глобальное изучение данных с использованием инструмента Обобщенная линейная регрессия перед локальным исследованием с помощью инструмента ГВР.

Параметры Выбрать поле для моделирования и Выбрать описательные поля должны быть числовыми полями, которые содержат разные значения. Эти значения должны различаться как на глобальном, так и на локальном уровне. Поэтому не стоит использовать "фиктивные» независимые переменные, чтобы представить различные пространственные режимы в модели ГВР (например, переписным районам вне городского ядра назначают значения 1, в то время как всем другим назначают значение 0). Поскольку ГВР допускает изменение коэффициентов независимых переменных, эти независимые переменные пространственного режима являются ненужными, а их включение создаст проблемы с локальной мультиколлинеарностью.

В глобальных регрессионных моделях, таких как (Обобщенная линейная регрессия), результаты ненадежны, когда у двух или более переменных наблюдается мультиколлинеарность (когда 2 или более переменных избыточны или вместе "рассказывают одну и ту же историю). Инструмент ГВР строит уравнение локальной регрессии для каждого объекта в наборе данных. Когда значения для конкретной независимой переменной кластеризованы в пространстве, вы вероятнее всего будете иметь проблемы с локальной мультиколлинеарностью. Поле числа обусловленности (COND_ADG) в выходном классе объектов указывает на нестабильность результатов вследствие локальной мультиколлинеарности. В общем случае, не стоит доверять результатам для объектов с числом обусловленности более 30, равным 0 или Null, для шейп-файлов, равным 1.7976931348623158e+308.

При включении номинальных или категорийных данных в модели ГВР необходимо быть очень внимательным. Где категории кластеризуются в пространстве, есть сильный риск столкновения с локальными проблемами мультиколлинеарности. Число обусловленности, включенное в результаты Географически взвешенной регрессии, указывает, когда локальная коллинеарность – проблема (число обусловленности меньше чем ноль, больше чем 30, или Null). Результаты в присутствии локальной мультиколлинеарности непостоянны.

Регрессионная модель – определена некорректно, если отсутствует ключевая независимая переменная. Статистически существенная пространственная автокорреляция невязок регрессии и/или неожиданное пространственное изменение среди коэффициентов одной или более независимых переменных предполагают, что ваша модель определена некорректно. Вы должны приложить все усилия (используя анализ невязок ОЛР и коэффициентов вариационного анализа ГВР), чтобы обнаружить эти ключевые недостающие переменные и включить их в модель.

Постоянный вопрос, имеет ли смысл для независимой переменной быть нестационарной. Например, предположите, что вы моделируете плотность определенного вида растений, как функцию нескольких переменных, включая ASPECT. Если вы находите, что коэффициент для переменной ASPECT изменяется в области исследования, вы, вероятно, видите доказательства недостатка ключевой независимой переменной (возможно, распространенность конкурирующей растительности, например). Вы должны приложить все усилия, чтобы включать все ключевые независимые переменные в вашу регрессионную модель.

Серьезные проблемы в схеме модели или ошибки выявления локальных уравнений, не содержащих в своих описаниях достаточное количество соседей, зачастую указывают на проблемы с глобальной или локальной мультиколлинеарностью. Чтобы обнаружить, где встретилась проблема, запустите глобальную модель, используя Обобщенную линейную регрессию и проверьте значение фактора, увеличивающего дисперсию для каждой переменной величины. Если некоторые из значений Фактора, увеличивающего дисперсию, – большие (выше 7,5, например), глобальная мультиколлинеарность не позволяет работать методу ГВР (географически взвешенная регрессия). Однако вероятнее всего, проблемой является локальная мультиколлинеарность. Попытайтесь создать тематическую карту для каждой независимой переменной. Если карта раскрывает пространственную кластеризацию идентичных значений, следует рассмотреть вариант исключения тех переменных из модели или комбинирования тех переменных с другими независимыми переменными для увеличения вариации значений. Если, например, вы моделируете значения для дома и имеете переменные для спален и ванных комнат отдельно, вы, возможно, захотите объединить их, чтобы увеличить вариацию значений или представить их как ванная комната/спальня. При конструировании моделей Географически взвешенной регрессии избегайте использования фиктивных значений, пространственной кластеризации категорий или номинальных переменных, или переменных с очень малым числом возможных значений.

Географически взвешенная регрессия (ГВР) - это линейная модель, к которой предъявляются те же требования, что и к Обобщенной линейной регрессии. Просмотрите подобный разбор показателей проверки в разделе Как работает Географически взвешенная регрессия, чтобы убедиться, что ваша модель ГВР определена корректно. Раздел Плохо работает модель регрессии в статье Основы регрессионного анализа также содержит информацию, которая поможет вам в точной настройке модели.

Параметры зависимой и описательной переменных должны быть заданы числовыми полями, содержащими диапазоны значений. Инструмент не может работать, когда все переменные имеют одинаковые значения (например, все значения для поля равны 9.0).

Пространственные объекты, имеющие одно или более значений null или пустые строковые значения в полях прогноза или в описательных полях, будут исключены из результатов. Если необходимо, вы можете изменить значения, используя инструмент Вычислить поле.

Вы должны визуально оценить все очевидные отклонения прогнозов в большую и меньшую сторону в невязках вашей регрессии, чтобы увидеть, дают ли они представления о потенциальных недостающих переменных в вашей регрессионной модели.

Если отрезок прямой, оценочные коэффициенты, прогнозные значения, невязки и числа обусловленности равны null, модель может оказаться неподходящей. Это может иметь место для одного или нескольких объектов модели и может быть вызвано следующими причинами:

  • Недостаточное число соседей. Объекты с числом соседей менее двух не подходят для модели.
  • Мультиколлинеарность в модели.

В вышеупомянутых случаях модель должна быть оценена путем выполнения выходной диагностики и возможного ее использования с другими параметрами и коэффициентами.

Выходные данные

Инструмент Географически взвешенная регрессия производит множество различных результатов. Сводка по модели ГВР и статистическая сводка доступны на странице описания элемента и как ресурс на слое. Чтобы получить доступ к сводке результатов, щелкните Показать результаты Показать результаты под полученным слоем в Map Viewer. Инструментом генерируется один выходной слой. Выходные объекты автоматически добавляется в Map Viewer со схемой отображения от горячего к холодному, применяемой в моделировании невязок. Полученные диагностические данные зависят от типа модели входных объектов, и описаны ниже.

Непрерывная (Гауссова)

Интерпретация сообщений и показателей диагностики

  • AICc - AICc применяет к AIC поправку на смещение для небольших выборок. AICc приближается к AIC при возрастании числа объектов во входных данных.
  • Множественный R-2 - R-квадрат показывает, насколько модель соответствует действительности. Его значение изменяется от 0.0 до 1.0, чем больше значение, тем лучше. Его можно интерпретировать как долю дисперсии зависимой переменной, которая объясняется моделью регрессии. Знаменателем при вычислении Множественного R-2 является сумма квадратов значений зависимых переменных. При добавлении каждой независимой переменной знаменатель модели не будет меняться, однако числитель будет меняться, создавая ошибочное впечатление, что модель близка к действительности. См. Скорректированный R-2 ниже.

Ограничения

Географически взвешенная регрессия в GeoAnalytics имеет следующие ограничения:

  • Вы не можете выполнять предсказание в другом слое или создавать слои растровых коэффициентов.
  • Смоделируйте бинарную (логическую) или количественную (Пуассона) переменную.
  • Задайте поиск окрестностей, используя Золотой поиск или Интервал вручную.

Пример ArcGIS API for Python

Инструмент Географически взвешенная регрессия доступен в ArcGIS API for Python.

Этот пример находит соотношения продаж в магазинах по всей стране.

# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Search for and list the big data file shares in your portal
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for the big data file share of interest
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_SalesData")

# Look through the big data file share for 2018 sales
sales_2018 = next(x for x in bdfs_search.layers if x.properties.name == "2018_Sales")

# Run the GWR tool
gwr_result = arcgis.geoanalytics.analyze_patterns.gwr(input_layer = sales_2018, 
    																																																		explanatory_variables = "population, customers",
    																																																		dependent_variable = "total_sales"
    																																																		model_type = "Continuous",
    																																																		neighborhood_type = "NumberOfNeighbors",
    																																																		neighborhood_selection_method = "UserDefined",
    																																																		number_of_neighbors = "100",
    																																																		local_weighting_scheme = "BiSquare",
    																																																		output_trained_name = "GWR_results")

# Visualize the results if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(gwr_result)
processed_map

Похожие инструменты

Воспользуйтесь инструментом Географически взвешенная регрессия ArcGIS GeoAnalytics Server для моделирования для моделирования пространственных отношений. Другие инструменты могут применяться для решения похожих, но немного отличающихся задач.

Инструменты анализа Map Viewer

Создавайте генерализованные линейные модели и предсказания инструментом Географически взвешенная регрессия ArcGIS GeoAnalytics Server.

Создайте модели и прогнозы с помощью инструмента ArcGIS GeoAnalytics Server Классификация на основе леса и регрессия.

Инструменты анализа ArcGIS Desktop

Для запуска этого инструмента из ArcGIS Pro, вашим активным порталом должен быть Enterprise 10.8 или более поздний. Вход необходимо выполнить под учетной записью, имеющей права доступа для выполнения Анализа объектов GeoAnalytics.

Выполните схожие операции регрессии в ArcGIS Pro с помощью инструмента геообработки Географически взвешенная регрессия из набора Пространственная статистика.

Создайте модели и прогнозы, используя адаптацию метода контролируемого машинного обучения произвольного леса Лео Бреймана в ArcGIS Pro с помощью инструмента Классификация на основе леса и регрессия из набора Пространственная статистика.