La herramienta Buscar puntos calientes determinará si hay algún clustering estadísticamente significativo en el patrón espacial de los datos.
Diagrama de flujo de trabajo
Ejemplos
El departamento de policía de una ciudad está realizando un análisis para determinar si existe una relación entre los delitos violentos y las tasas de desempleo. Se implementará un programa de trabajo de verano ampliado para los institutos de las zonas con una tasa elevada de delitos violentos y de desempleo. Buscar puntos calientes se usará para buscar áreas con puntos calientes estadísticamente significativos de delito y desempleo.
Un estratega político quiere saber qué regiones mostraron el respaldo más fuerte o más débil a un partido político en las últimas elecciones. Esta información podría ser útil para guiar las estrategias de las campañas de futuras elecciones. El estratega resta la proporción de votos demócratas de la proporción de votos republicanos y utiliza Buscar puntos calientes para buscar los puntos calientes y fríos en las diferencias. Los puntos calientes (en rojo) denotan un fuerte apoyo a los republicanos, mientras que los puntos fríos (azules) denotan un fuerte apoyo a los demócratas.
Un oficial de conservación está estudiando enfermedades en los árboles para dar prioridad a las áreas del bosque que deben recibir tratamiento y aprender más sobre las áreas que muestran alguna resistencia. La herramienta Buscar puntos calientes se puede usar para buscar clusters de árboles enfermos (puntos calientes) y sanos (puntos fríos).
Notas de uso
Las entidades de entrada pueden ser puntos o áreas.
El parámetro Buscar clusters de concentraciones altas y bajas de puntos se usa para evaluar la distribución espacial de las entidades. Si las entidades son áreas, debe elegirse un campo. El clustering se determinará usando los números del campo elegido. Las entidades de puntos se pueden analizar usando un campo o la opción Point Counts. Si se usa Point Counts, la herramienta determinará si los propios puntos están agrupados, más que las agrupaciones de valores de campo altos y bajos.
Si los puntos se analizan con Point Counts, habrá dos nuevas opciones disponibles. El parámetro Recuentos de puntos permite que los puntos se agreguen dentro de un Fishnet Grid, Hexagon Grid o una capa de área del Contenido, como condados o códigos postales. El parámetro Definir ubicación posible de puntos se usa para crear un área o varias áreas de interés. Las tres opciones para este parámetro son None, que significa que se usan todos los puntos, un área definida por una capa de área de Contenido y áreas creadas usando la herramienta Dibujar.
Sus datos se pueden normalizar usando el parámetro Dividir por. Los datos de Esri Population usan Geoenriquecimiento y requieren el uso de créditos. Otra opción es normalizar usando un campo de la capa de entrada. Entre los valores que se pueden usar para la normalización se incluyen el número de viviendas o el área.
Las Opciones pueden usarse para definir un Tamaño de celda o una Banda de distancia para el análisis.
La capa de salida tendrá campos adicionales que contienen información como la significancia estadística de cada entidad, el valor p y la puntuación z. La capa de salida también contiene información sobre el análisis estadístico en la sección Descripción de sus Detalles del elemento.
Cómo funciona Buscar puntos calientes
Incluso los patrones espaciales aleatorios presentan cierto grado de clustering. Además, nuestros ojos y nuestros cerebros intentan, de forma natural, encontrar patrones aunque no exista ninguno. En consecuencia, puede ser difícil saber si los patrones de los datos son el resultado de procesos espaciales reales en acción o de una simple casualidad aleatoria. Esta es la razón por la que los investigadores y analistas utilizan métodos estadísticos como Buscar puntos calientes (Getis-Ord Gi*) para cuantificar los patrones espaciales.
La herramienta calcula la estadística Getis-Ord Gi* (que se pronuncia G-i-estrella) para cada entidad en un dataset. Las puntuaciones z y los valores p resultantes le informan de dónde se agrupan espacialmente las entidades con valores altos o bajos. Cada entidad se analiza dentro del contexto de las entidades vecinas. Una entidad con un valor alto es interesante, pero es posible que no sea un punto caliente estadísticamente significativo. Para ser un punto caliente estadísticamente significativo, una entidad debe tener un valor alto y también estar rodeada por otras entidades con valores altos. La suma local de una entidad y sus vecinas se compara proporcionalmente con la suma de todas las entidades, cuando la suma local es muy distinta de la suma local esperada y cuando esa diferencia es demasiado grande para ser el resultados de una probabilidad aleatoria, el resultado es una puntuación z estadísticamente significativa.
Cuando encuentras un clustering estadísticamente significativo en tus datos, dispones de una información valiosa. Saber dónde y cuándo se produce el clustering puede proporcionar pistas importantes sobre los procesos que producen los patrones que se están viendo. Saber que los robos residenciales, por ejemplo, son por sistema más frecuentes en ciertas vecindades es una información vital si se tienen que diseñar estrategias de prevención eficaces, asignar recursos policiales escasos, iniciar programas de vigilancia vecinal, autorizar investigaciones criminales en profundidad o identificar sospechosos potenciales.
Analizar entidades de área
Muchos de los datos están disponibles para entidades de área como distritos censales, condados, distritos de voto, regiones hospitalarias, parcelas, límites de parques y zonas de recreo, cuencas hidrográficas, clasificaciones de cobertura de suelo y áreas climáticas. Cuando la capa de análisis contenga entidades de área, deberás especificar un campo de numérico que se usará para encontrar clusters de valores altos y bajos. Este campo podría representar:
- Recuentos (como el número de hogares)
- Tasas (como la proporción de población que tiene un título universitario)
- Medias (como la media o la mediana de ingresos por hogar)
- Índices (como el valor que indica si el gasto por hogar en artículos deportivos es superior o inferior a la media nacional)
Con el campo de análisis que ha proporcionado, la herramienta Buscar puntos calientes creará un mapa (la capa de resultado) que muestra las áreas con clusters estadísticamente significativos de valores altos (puntos calientes: rojos) y valores bajos (puntos fríos: azules).
Analizar entidades de punto
Hay disponibles diversos datos como entidades de punto. Algunos ejemplos de entidades frecuentemente representadas como puntos son incidentes criminales, escuelas, hospitales, eventos de llamadas de emergencia, accidentes de tráfico, pozos de agua, árboles y embarcaciones. En ocasiones te puede interesar analizar valores de datos (un campo) asociados con cada entidad de puntos. En otros casos, quizá solo te interese evaluar la formación de clusters en los propios puntos. La decisión de proporcionar o no un campo dependerá de la pregunta que se esté formulando.
Buscar agrupaciones de valores altos y bajos asociadas con entidades de puntos
Seguramente querrá proporcionar un campo de análisis para responder a preguntas como: ¿Dónde se agrupan los valores altos y bajos entre los puntos? El campo que seleccione podría representar alguna de las opciones siguientes:
- Recuentos (como el número de accidentes de tráfico en las intersecciones de calles)
- Tasas (como desempleo urbano, en la que cada ciudad se representa como una entidad de punto)
- Medias (como la nota media en los exámenes de matemáticas entre escuelas)
- Índices (como el índice de satisfacción del consumidor para concesionarios de coches en el país)
Buscar agrupaciones de recuentos de puntos altos y bajos
Para algunos datos de puntos, normalmente cuando cada punto representa un evento, incidente o indicación de presencia o ausencia, no habrá ningún campo de análisis obvio que se pueda usar. En estos casos, solo tienes que saber dónde se da una creación de clusters inusualmente intensa o escasa (estadísticamente significativa). Para este análisis, las entidades de área (una cuadrícula que la herramienta crea o una capa de área que usted proporciona) se sitúan sobre los puntos y se hace un recuento del número de puntos incluido dentro de cada área. La herramienta encuentra los clusters de recuentos de puntos altos y bajos asociados con cada entidad de área.
Definir ubicación posible de puntos
Especifique una capa de área o dibuje áreas que definan un área de estudio si desea que el análisis se realice en todas las ubicaciones en las que podrían producirse entidades de puntos del incidente. Para esta opción, la herramienta Buscar puntos calientes superpondrá una cuadrícula de red en el área de estudio definida y contará los puntos contenidos en cada cuadrado de la red. Cuando no se indique dónde pueden darse los puntos de incidentes usando esta opción, la herramienta Buscar puntos calientes solo analizará los cuadrados de la red que contengan al menos un valor de punto. Sin embargo, cuando haga uso de esta opción para definir dónde son posibles los puntos, se hará el análisis de todos los cuadrados de malla que se encuentren en las áreas de límite que defina.
Contar puntos dentro de las áreas de agregación
En algunos casos, las entidades de área, como los distritos censales, las zonas de patrullaje o las parcelas, tendrán más sentido para el análisis que la cuadrícula de red predeterminada.
Elegir dividir por
Existen dos métodos frecuentes para identificar puntos calientes y fríos:
- Por recuento: cuando analizas un dataset concreto, normalmente lo que quieres es encontrar los puntos calientes y fríos del número de entidades de cada área de agregación del área de estudio. Por ejemplo, puede que estés buscando los puntos calientes donde se han producido el mayor número de delitos y los puntos fríos donde se han producido el menor número de delitos con el fin de asignar recursos.
- Por intensidad: analizar y comprender patrones que tienen en cuenta las distribuciones subyacentes que influyen en un fenómeno concreto también puede resultar interesante. Este concepto se denomina en muchos casos normalización o el proceso de dividir un valor de atributo numérico por otro para reducir las diferencias en los valores según el tamaño de las áreas o el número de entidades de cada área. Por ejemplo, si volvemos al ejemplo de los delitos, puede que quieras saber dónde están los clusters del número de delitos mayor y menor que tienen en cuenta la población subyacente. En este caso, harías un recuento del número de delitos de cada área (si esa área área es una cuadrícula o un dataset de un área diferente) y dividir ese número total de delitos por la población total del área. Esto te proporcionaría un índice de criminalidad o el número de delitos per cápita. Encontrar los puntos calientes y fríos de los delitos per cápita responde a una pregunta diferente que también puede ayudar en la toma de decisiones.
Las dos formas de analizar los datos del área de estudio son válidas; la elección solo depende de la pregunta que se esté formulando.
La elección del atributo adecuado que se va a utilizar para dividir es muy importante. Debe asegurarse de que el atributo Dividir por es un atributo que influye, de hecho, en la distribución del fenómeno que se está analizando.
Cuando se elige Dividir por Esri Population, se usan los datos de población de Esri Demographics Global Coverage. Asegúrate de consultar la resolución de datos disponible para el área que te interesa para garantizar que sea compatible con el tamaño de las áreas que se están enriqueciendo (ya sean áreas de agregación que tú proporciones o cuadrados de la malla que se están creando).
Interpretar los resultados
La salida de la herramienta Buscar puntos calientes es un mapa. En los puntos o las áreas de este mapa de capa de resultados, cuanto más oscuros aparezcan el color rojo o azul, más seguridad podrás tener de que el clustering no es el resultado de una casualidad aleatoria. Los puntos o áreas que aparecen en color beis, por otro lado, no forman parte de ningún cluster estadísticamente significativo; el patrón espacial asociado con estas entidades podría muy bien ser resultado del azar. Algunas veces, los resultados de tu análisis indicarán que no hay ningún cluster estadísticamente significativo. Esta es información importante. Cuando un patrón espacial es aleatorio, no tendrá pista alguna sobre las causas subyacentes. En estos casos, todas las entidades de la capa de resultados aparecerán en beis. Sin embargo, cuando encuentra agrupaciones estadísticamente significativas, las ubicaciones en las que se producen dichas agrupaciones son pistas importantes sobre los motivos que podrían haber generado dicha agrupación. Por ejemplo, encontrar un clustering espacial estadísticamente significativo de cáncer asociado con determinadas toxinas medioambientales puede promover políticas y medidas destinadas a proteger a la población. De un modo similar, encontrar puntos fríos de obesidad infantil asociada con escuelas que fomenten programas de deporte extraescolar puede proporcionar una sólida justificación para promocionar este tipo de programas a escala más amplia.
Solución de problemas
El método estadístico empleado por la herramienta Buscar puntos calientes se basa en la teoría de la probabilidad y, en consecuencia, necesita un número mínimo de entidades para funcionar con eficacia. Este método estadístico también requiere varios recuentos o valores de campo de análisis. Si, por ejemplo, estás analizando delitos por distrito censal y por casualidad obtienes exactamente el mismo número de delitos en cada distrito, la herramienta no puede solucionar el problema. La tabla siguiente ofrece una explicación de los mensajes que se puede encontrar cuando usa la herramienta Buscar puntos calientes:
Mensaje | Problema | Solución |
---|---|---|
Las opciones de análisis que has seleccionado necesitan un mínimo de 60 puntos para poder calcular los puntos calientes y fríos. | No hay suficientes entidades de punto en tu capa de análisis de puntos para obtener unos resultados fiables. | La solución lógica es agregar más puntos a la capa de análisis. Como alternativa, puedes intentar definir áreas de análisis de límite y, a partir de aquí, agregar información sobre dónde habrían podido mostrarse los puntos. Para este método, necesitará como mínimo 30 puntos. También puedes proporcionar áreas de agregación que superpongan tus puntos. Para este análisis, necesitarás como mínimo 30 áreas poligonales y 30 puntos dentro de las áreas. Si cuenta con 30 puntos como mínimo, puede especificar un campo de análisis. Esto obliga a reformular la pregunta de ¿dónde se encuentran muchos o pocos puntos? a la pregunta ¿dónde se agrupan espacialmente los valores altos y bajos? |
Las opciones de análisis que has seleccionado necesitan un mínimo de 30 puntos con datos válidos en el campo de análisis para poder calcular los puntos calientes y fríos. | No hay suficientes puntos o suficientes puntos asociados con valores de campo de análisis que no sean NULL en la capa de análisis para calcular resultados fiables. | Lamentablemente, si tienes menos de 30 puntos, este método de análisis no es el adecuado para tus datos. Si tiene más de 30 puntos y aparece este mensaje, es posible que el campo de análisis que ha especificado tenga valores NULL. Los puntos con valores de campo de análisis NULL se omitirán. Otra posibilidad es que tenga activo un filtro que reduzca el número de puntos disponible para el análisis. |
Las opciones de análisis que ha seleccionado necesitan un mínimo de 30 polígonos con datos válidos en el campo de análisis para poder calcular los puntos calientes y fríos.. | No hay suficientes áreas de polígonos o suficientes entidades de área asociadas con valores de campo de análisis que no sean NULL en la capa de análisis para calcular resultados fiables. | Lamentablemente, si tienes menos de 30 áreas poligonales, este método de análisis no es el adecuado para tus datos. Si tiene más de 30 áreas y aparece este mensaje, es posible que el campo de análisis que ha especificado tenga valores NULL. Las áreas de polígono con valores de campo de análisis NULL se omitirán. Otra posibilidad es que tenga activo un filtro que reduzca el número de áreas de polígono disponibles para el análisis. |
La opción de análisis que has seleccionado necesita un mínimo de 30 puntos para situarse en el interior de las áreas poligonales de límite. | Solo se analizarán aquellos puntos situados dentro de las áreas de análisis de límite que dibujes o proporciones. Para obtener unos resultados fiables, como mínimo 30 puntos deben estar situados dentro de las áreas poligonales de límite. | Lamentablemente, si no tienes como mínimo 30 puntos, este método de análisis no es el adecuado para tus datos. Con un mínimo de 30 entidades, esta solución proporcionará áreas de análisis de límite diferentes y quizá mayores. Otra opción consiste en proporcionar una capa de área con un mínimo de 30 polígonos de agregación que superpongan al menos 30 de tus puntos. Cuando proporcionas áreas de agregación, el análisis se realiza en los recuentos de punto dentro de cada área. |
La opción de análisis que has seleccionado necesita un mínimo de 30 puntos para situarse en el interior de los polígonos de agregación. | Solo los puntos situados en el interior de los polígonos de agregación se incluirán en el análisis. Para obtener unos resultados fiables, como mínimo 30 puntos deben estar situados dentro de las áreas poligonales que has proporcionado. | Lamentablemente, si no tienes como mínimo 30 puntos, este método de análisis no es el adecuado para tus datos. De lo contrario, deberías trazar o proporcionar áreas de análisis de límite que superpongan al menos 30 de tus puntos. Las áreas de límite deberían reflejar todas las ubicaciones donde puedan situarse los puntos. |
La opción de análisis que has seleccionado necesita un mínimo de 30 áreas de agregación. | La opción que ha seleccionado se superpondrá a las áreas de agregación por encima de los puntos y después contará el número de puntos situados dentro de cada área. Se necesitan como mínimo 30 recuentos (30 áreas) para proporcionar unos resultados fiables. | Solo se pueden obtener unos resultados fiables si proporcionas como mínimo 30 puntos situados como mínimo dentro de 30 áreas de agregación. Si no tienes 30 áreas de agregación, puedes trazar o proporcionar áreas de análisis de límite que superpongan al menos 30 de tus puntos. Estas áreas de límite deberían reflejar todas las ubicaciones donde puedan situarse los puntos. |
Los puntos calientes y fríos no se pueden calcular si el número de puntos de cada área poligonal es idéntico. Inténtalo con áreas poligonales diferentes o selecciona opciones de análisis diferentes. | Cuando la herramienta Buscar puntos calientes contó el número de puntos de cada área de agregación, descubrió que todos los recuentos eran idénticos. Para calcular los resultados, esta herramienta requiere al menos alguna variación en los valores de recuento obtenidos. | Puedes proporcionar áreas de agregación alternativas donde no todas las áreas tendrán el mismo número exacto de puntos. En lugar de áreas de agregación, también puede trazar o proporcionar áreas de análisis de límite. Como alternativa, puedes especificar un campo de análisis. Sin embargo, esto obliga a reformular la pregunta de ¿dónde se encuentran muchos o pocos puntos? a la pregunta ¿dónde se agrupan espacialmente los valores altos y bajos? |
No existe una variación suficiente en cuanto a puntos de ubicación para calcular los puntos calientes y fríos. Los puntos que coinciden, por ejemplo, reducen la variación espacial. Puedes intentar especificar un área límite, áreas de agregación (un mínimo de 30) o un campo de análisis. | Según el número de puntos y de lo diseminados que se encuentren, la herramienta crea una cuadrícula para superponer los puntos. Después de contar el número de puntos incluido en cada cuadrado de la malla y de eliminar los cuadrados con recuentos que incidan cero, han quedado menos de 30 cuadrados. Esta herramienta necesita como mínimo 30 recuentos (30 cuadrados) para proporcionar unos resultados fiables. | Si los puntos ocupan muy pocas ubicaciones únicas (hay muchos puntos que coinciden), una buena solución consiste en proporcionar áreas de agregación que superpongan los puntos, o trazar y proporcionar áreas de análisis de límite que indiquen dónde pueden situarse los puntos y dónde no. Otra opción consiste en especificar un campo de análisis. Sin embargo, esto obliga a reformular la pregunta de ¿dónde se encuentran muchos o pocos puntos? a la pregunta ¿dónde se agrupan espacialmente los valores altos y bajos? |
No existe la variación suficiente entre los puntos dentro de las áreas poligonales de límite. Puedes intentar especificar unos límites mayores. | En función de las ubicaciones y el número de los puntos, la herramienta crea una cuadrícula para superponer los puntos. Después de contar el número de puntos incluido en cada cuadrado de la malla y de eliminar los cuadrados situados fuera de las áreas de análisis de límite, han quedado menos de 30 cuadrados de malla. Esta herramienta necesita como mínimo 30 recuentos (30 cuadrados) para proporcionar unos resultados fiables. | Si tus puntos están situados en distintas ubicaciones dentro de las áreas de análisis de límite, bastarán con crear o proporcionar unos límites mayores. Si tus puntos ocupan muy pocas ubicaciones únicas (hay muchos puntos que coinciden), una buena solución consiste en proporcionar áreas de agregación que superpongan tus puntos Otra opción consiste en especificar un campo de análisis. Sin embargo, esto obliga a reformular la pregunta de ¿dónde se encuentran muchos o pocos puntos? a la pregunta ¿dónde se agrupan espacialmente los valores altos y bajos? |
Todos los valores de tu campo de análisis son probablemente los mismos. Los puntos calientes y fríos no se pueden calcular si no existe una variación en el campo que se está analizando. | Es posible que hayas especificado un campo de análisis que tiene el mismo valor para todos los puntos o áreas en esta capa de análisis. La estadística usada por esta herramienta no puede resolver el problema a no ser que existan varios valores para trabajar con ellos. | Puedes especificar un campo de análisis diferente o, para las entidades de punto, analizar las densidades de los puntos en lugar de los valores de los puntos. |
No se han podido calcular los puntos calientes y fríos de los datos que has proporcionado. Intenta especificar un campo de análisis cuando corresponda. | Aunque es poco probable, cuando la herramienta ha creado una cuadrícula y ha contado el número de puntos incluido en cada cuadrado, los recuentos de todos los cuadrados eran idénticos. | La solución consiste en proporcionar áreas de agregación propias, trazar o proporcionar áreas de análisis de límite, o especificar un campo de análisis. |
El tamaño de celda debe ser menor que la banda de distancia. | Puede proporcionar un valor de Banda de distancia que sea menor que el tamaño de cada celda de la cuadrícula. | Active las unidades especificadas para Banda de distancia y Tamaño de celda, use el valor predeterminado calculado por la herramienta o use un valor que sea mayor que el tamaño de una sola celda de cuadrícula. |
Se puede encontrar información adicional sobre los algoritmos empleados por la herramienta Buscar puntos calientes en Cómo funciona Análisis de puntos calientes optimizado.
Herramientas similares
Use Buscar puntos calientes para determinar si hay algún clustering estadísticamente significativo en el patrón espacial de sus datos. Otras herramientas que pueden ser útiles son las siguientes:
Herramientas de análisis del visor de mapas
Si le interesa encontrar valores atípicos en el patrón especial de los datos, use la herramienta Buscar valores atípicos.
Si le interesa crear un mapa de densidad de las entidades de puntos o líneas, use la herramienta Calcular densidad.
Herramientas de análisis de ArcGIS Desktop
Buscar puntos calientes ejecute la misma estadística usada en las herramientas Análisis de puntos calientes (Getis-Ord Gi*) y Análisis de punto caliente optimizado.
Buscar puntos calientes también está disponible en ArcGIS Pro. Para ejecutar la herramienta desde ArcGIS Pro, en el portal activo de su proyecto se debe estar ejecutando Portal for ArcGIS 10.5 o superior. También debe iniciar sesión en el portal utilizando una cuenta que tenga privilegios para realizar análisis de entidades estándar en el portal.