Realiza una Regresión ponderada geográficamente (GWR), que es una forma local de regresión lineal que se utiliza para modelar las relaciones que varían espacialmente.
Diagrama de flujo de trabajo
Análisis mediante GeoAnalytics Tools
El análisis mediante GeoAnalytics Tools se ejecuta con el procesamiento distribuido en varios equipos y núcleos de ArcGIS GeoAnalytics Server. Las GeoAnalytics Tools y las herramientas de análisis de entidades estándar de ArcGIS Enterprise tienen parámetros y capacidades diferentes. Para obtener más información sobre las diferencias, consulte Diferencias de las herramientas de análisis de entidades.
Ejemplos
- ¿La relación entre resultados académicos e ingresos es uniforme en toda el área de estudio?
- ¿Cuáles son las variables clave que explican la alta frecuencia de incendio forestal?
- ¿Dónde se encuentran los distritos en los que los niños están alcanzando las notas de examen más altas? ¿Qué características parecen estar asociadas? ¿Dónde es más importante cada característica?
Notas de uso
Esta herramienta realiza una Regresión ponderada geográficamente, una forma local de regresión que se utiliza para modelar las relaciones que varían espacialmente. La herramienta GWR ofrece un modelo local de la variable o el proceso que trata de comprender o predecir ajustando una ecuación de regresión a todas las entidades del dataset. La herramienta Regresión ponderada geográficamente (GWR) crea dichas ecuaciones separadas incorporando las variables dependientes y explicativas de entidades que se encuentran dentro de la vecindad de cada entidad de destino. La forma y extensión de todas las vecindades que se analizan se basan en la entrada del parámetro Elegir cómo se determinará el vecindario.
La herramienta Regresión ponderada geográficamente (GWR) también produce diagnósticos y entidades de salida. Las capas de entidades de salida se agregan automáticamente al mapa con un esquema de representación en pantalla que se aplica a los residuales del modelo. A continuación, se proporciona una explicación completa de cada salida.
Es una práctica habitual explorar sus datos globalmente con la herramienta Regresión lineal generalizada antes de explorar sus datos localmente con la herramienta GWR.
Los parámetros Elegir el campo que se va a modelar y Elegir los campos explicativos deben ser campos numéricos con una serie de valores. Estos valores deben variar tanto globalmente como localmente. Por este motivo, no utilice variables explicativas falsas para representar regímenes espaciales diferentes en un modelo GWR (como asignar un valor de 1 a los distritos censales que están fuera del núcleo urbano, mientras que al resto se les asigna un valor de 0). Ya que la herramienta GWR permite que los coeficientes de la variable explicativa varíen, estas variables explicativas del régimen espacial no son necesarias, y si se incluyen, crearán problemas con la multicolinealidad local.
En los modelos de regresión global, como la Regresión lineal generalizada, los resultados son poco fiables cuando dos o más variables exhiben multicolinealidad (cuando dos o más variables son redundantes o cuentan la misma historia). La herramienta GWR construye una ecuación de regresión local para cada entidad del dataset. Cuando los valores para una variable explicativa particular se agrupan espacialmente en clústeres, es muy probable que tenga problemas con la multicolinealidad local. El campo del número de condición (COND_ADG) de la clase de entidad de salida indica el momento en el que los resultados son inestables debido a la multicolinealidad local. Como regla general, sospeche de resultados para entidades con un número de condición mayor que 30, igual que Nulo o, para los shapefiles, igual que -1,7976931348623158e+308.
Tenga cuidado al incluir datos nominales o categóricos en un modelo GWR. Donde las categorías se agrupan espacialmente, existe un gran riesgo de encontrar problemas de multicolinealidad local. El número de condición incluido en la salida de GWR indica cuando la colinealidad local es un problema (un número de condición menor que cero, mayor que 30 o establecido en Nulo). Cuando existe una multicolinealidad local, los resultados son inestables.
Un modelo de regresión está mal especificado si falta una variable explicativa clave. Si la autocorrelación espacial de los residuales de regresión o la variación espacial no esperada entre los coeficientes de una o más variables explicativas son estadísticamente significativas, se puede intuir que el modelo está mal especificado. Debe hacer todo lo posible (por ejemplo, a través del análisis de residual GLR y el análisis de variación del coeficiente GWR) para descubrir cuáles son las variables clave que faltan para poder incluirlas en el modelo.
Pregúntese siempre si tiene sentido que una variable explicativa sea no estacionaria. Por ejemplo, supongamos que está modelando la densidad de una especie de planta en particular como función de muchas variables incluida la de la ORIENTACIÓN. Si descubre que el coeficiente de la variable ORIENTACIÓN en el área de estudio cambia, es probable que sea la evidencia de que falta una variable explicativa clave (tal vez, la prevalencia de una vegetación rival, por ejemplo). Debe hacer todo el esfuerzo posible para incluir todas las variables explicativas clave en el modelo de regresión.
Los problemas graves de diseño del modelo o los errores que indican que las ecuaciones locales no incluyen suficientes vecinos por lo general señalan que existe un problema con la multicolinealidad global o local. Para determinar dónde está el problema, ejecute un modelo global con Regresión lineal generalizada y examine el valor VIF para cada variable explicativa. Si algunos de los valores VIF son grandes (por ejemplo, mayores que 7,5), la multicolinealidad global impide que se resuelva la RPG. Sin embargo, es más probable que la multicolinealidad local sea el problema. Intente crear un mapa temático para cada variable explicativa. Si el mapa muestra un clustering espacial de valores idénticos, considere eliminar esas variables del modelo o combinarlas con otras variables explicativas para amentar la variación del valor. Por ejemplo, si está modelando valores de viviendas y tiene variables tanto para los dormitorios como para los cuartos de baño, es posible que desee combinarlas para aumentar la variación del valor o para representarlas como metros cuadrados de cuarto de baño/dormitorio. Evite utilizar variables falsas del régimen espacial, el clustering espacial de variables categóricas o nominales o el uso de variables con pocos valores posibles al construir modelos GWR.
Regresión ponderada geográficamente (GWR) es un modelo lineal sujeto a los mismos requisitos que Regresión lineal generalizada. Consulte atentamente los diagnósticos explicados en Cómo funciona Regresión ponderada geográficamente para asegurarse de que su modelo de GWR esté especificado correctamente. La sección Cómo dejan de funcionar los modelos de regresión de Conceptos básicos del análisis de regresión también tiene información para asegurarse de que su modelo sea preciso.
Los parámetros variable dependiente y variable explicativa deben ser campos numéricos con un rango de valores. Esta herramienta no puede resolver cuando las variables tienen los mismos valores (por ejemplo, si todos los valores de un campo son 9,0).
Las entidades con uno o varios valores nulos o valores de cadena de caracteres vacíos en campos explicativos o de predicción se ejecutarán desde la salida. Si lo necesita, puede modificar los valores con Calcular campo.
Debe inspeccionar visualmente las sobrepredicciones y las subpredicciones que sean evidentes en los residuales de regresión para ver si proporcionan pistas acerca de las posibles variables que están ausentes en el modelo de regresión.
Cuando la interceptación, los coeficientes estimados, los valores predichos, los residuales y los números de condiciones son nulos, el modelo puede tener un ajuste deficiente. Esto puede darse en una o varias entidades del modelo y puede deberse a los siguientes motivos:
- Vecinos insuficientes. Las entidades con menos de dos vecinos no tendrán ningún ajuste de modelo.
- Multicolinealidad en el modelo.
En los casos anteriores, el modelo se debe evaluar examinando los diagnósticos de salida y posiblemente reajustar con distintos parámetros y coeficientes.
Salidas
La herramienta Regresión ponderada geográficamente produce una variedad de salidas. Dispone de unos resúmenes del modelo GWR y de las estadísticas en la página de elemento del portal como recurso para su capa. Para acceder a un resumen de sus resultados, haga clic en Mostrar resultados bajo la capa resultante en Map Viewer. La herramienta genera una capa de salida. Las entidades de salida se agregan automáticamente a Map Viewer con un esquema de representación en pantalla de cálido a frío que se aplica a los residuales del modelo. Los diagnósticos generados dependen del tipo de modelo de las entidades de entrada y se describen a continuación.
Continuo (Gausiano)
Interpretar mensajes y diagnósticos
- AICc: AICc aplica una corrección sesgada a AIC para tamaños de muestra pequeños. AICc tomará AIC como la cantidad de entidades del aumento de entrada.
- R cuadrado: R cuadrado es una medida de la bondad de ajuste. Su valor varía de 0,0 a 1,0; se prefieren los valores más altos. Se puede interpretar como la proporción de varianza de la variable dependiente que da cuenta el modelo de regresión. El denominador para el cómputo de R cuadrado es la suma de los valores de la variable dependiente al cuadrado. Agregar una variable explicativa extra al modelo no altera el denominador pero sí altera el numerador; esto brinda la impresión de mejora en el ajuste del modelo que puede no ser real. Consulte R cuadrado ajustado a continuación.
Limitaciones
La implementación en GeoAnalytics de Regresión ponderada geográficamente presenta las siguientes limitaciones:
- No puede realizar una predicción en otra capa ni crear capas de coeficiente ráster.
- No puede modelar una variable binaria (logística) ni una variable de recuento (valor Poisson).
- No puede definir la búsqueda en la vecindad con Búsqueda dorada ni Intervalos manuales.
Ejemplo de ArcGIS API for Python
La herramienta Regresión ponderada geográficamente está disponible a través de ArcGIS API for Python.
En este ejemplo se buscan relaciones entre ventas de tiendas de todo el país.
# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
print("Quitting, GeoAnalytics is not supported")
exit(1)
# Search for and list the big data file shares in your portal
search_result = portal.content.search("", "Big Data File Share")
# Look through the search results for the big data file share of interest
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_SalesData")
# Look through the big data file share for 2018 sales
sales_2018 = next(x for x in bdfs_search.layers if x.properties.name == "2018_Sales")
# Run the GWR tool
gwr_result = arcgis.geoanalytics.analyze_patterns.gwr(input_layer = sales_2018,
explanatory_variables = "population, customers",
dependent_variable = "total_sales"
model_type = "Continuous",
neighborhood_type = "NumberOfNeighbors",
neighborhood_selection_method = "UserDefined",
number_of_neighbors = "100",
local_weighting_scheme = "BiSquare",
output_trained_name = "GWR_results")
# Visualize the results if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(gwr_result)
processed_map
Herramientas similares
Utilice la herramienta Regresión ponderada geográficamente de ArcGIS GeoAnalytics Server para modelar relaciones que varían espacialmente. Existen otras herramientas que pueden resultar de utilidad para solucionar problemas similares, aunque ligeramente diferentes.
Herramientas de análisis del Map Viewer
Cree modelos lineales generalizados y predicciones con la herramienta Regresión lineal generalizada de ArcGIS GeoAnalytics Server.
Cree modelos y predicciones con la herramienta Clasificación y regresión basadas en bosque de ArcGIS GeoAnalytics Server.
Herramientas de análisis de ArcGIS Desktop
Para ejecutar esta herramienta desde ArcGIS Pro, su portal activo debe ser Enterprise 10.8 o posterior. Debe iniciar sesión utilizando una cuenta que tenga privilegios para realizar análisis de entidades de GeoAnalytics.
Realice operaciones de regresión similares en ArcGIS Pro con la herramienta de geoprocesamiento Regresión ponderada geográficamente como parte de la caja de herramientas Estadísticas espaciales.
Cree modelos y predicciones con una adaptación del algoritmo de bosque aleatorio de Leo Breiman en ArcGIS Pro con la herramienta de geoprocesamiento Clasificación y regresión basadas en bosque como parte de la caja de herramientas Estadísticas espaciales.