L'outil Trouver des points chaudsdétermine si le modèle spatial de vos données présente des agrégations statistiquement significatives.
Diagramme de workflow
Exemples
Le commissariat de police d'une ville réalise une analyse afin de déterminer s'il existe une relation entre les crimes violents et le taux de chômage. Un programme d'emplois saisonniers sera mis en place à destination des lycéens ans les zones où les taux de crimes violents et de chômage sont élevés. L'outil Trouver des points chauds permet de trouver des zones présentant des points chauds de crimes et chômage statistiquement significatifs.
Un stratège politique souhaite savoir quelles régions ont manifesté un soutien plus fort ou plus faible pour un parti politique lors des dernières élections. Cette information peut aider à orienter des stratégies de campagnes électorales à venir. Il soustrait la proportion des votes démocrates de la proportion des votes républicains, puis utilise Trouver des points chauds pour trouver les points chauds et froids dans ces écarts. Les points chauds (rouge) représentent un soutien fort aux Républicains, et les points froids (bleu) un soutien fort aux Démocrates.
Un agent des services de protection de l'environnement étudie les maladies des arbres pour accorder les priorités aux zones forestières à traiter et pour en savoir plus sur les zones qui montrent une certaine résistance. L'outil Trouver des points chauds permet de localiser les groupes d'arbres malades (points chauds) et d'arbres sains (points froids).
Remarques sur l'utilisation
Les entités en entrée peuvent être des points ou des surfaces.
Le paramètre Rechercher des grappes de valeurs élevées et faibles permet d'évaluer la disposition spatiale de vos entités. Si vos entités sont des surfaces, un champ doit être sélectionné. L'agrégation sera déterminée en utilisant les nombres contenus dans le champ sélectionné. Les entités ponctuelles peuvent être analysées grâce à un champ ou à l'option Point Counts. Si Point Counts est utilisé, l'outil détermine si les points même sont agrégés, plutôt que si des grappes de valeurs élevées et faibles sont présentes.
Si des points sont en cours d'analyse avec Point Counts, deux nouvelles options seront disponibles. Le paramètre Comptabiliser les points dans permet d'agréger des points dans une Fishnet Grid, une Hexagon Grid ou une couche de zones à partir de votre Contenu, par exemple des comtés ou des codes postaux. Le paramètre Définir où des points sont possibles permet de créer une ou plusieurs zones d'intérêt. Les trois options de ce paramètre sont None, ce qui signifie que tous les points sont utilisés, qu'une zone est définie par une couche de zones provenant de votre Contenu et que des zones sont créées avec l'outil Dessiner.
Vous pouvez normaliser vos données en utilisant le paramètre Diviser par. Les données Esri Population utilisent l'Enrichissement géographique et entraînent la consommation de crédits. Une autre option consiste à normaliser en utilisant un champ provenant de la couche en entrée. Certaines valeurs possibles pouvant être utilisées pour la normalisation sont le nombre de foyers ou la zone.
Vous pouvez utiliser des Options pour définir une Taille de cellule ou Canal de distance pour votre analyse.
La couche en sortie comportera des champs supplémentaires contenant des informations telles que la signification statistique de chaque entité, la valeur de p et le score z. La couche en sortie contient également des informations concernant l'analyse statistique dans la section Description de ses Détails des éléments.
Fonctionnement de Trouver des points chauds
Même les modèles spatiaux aléatoires présentent un certain degré d'agrégation. En outre, nos yeux et notre cerveau tentent naturellement d'identifier des modèles même si aucun n'existe. Par conséquent, il peut être difficile de savoir si les modèles de vos données sont le résultat de processus spatiaux réels en cours ou s'ils découlent simplement du hasard. C'est pourquoi les chercheurs et les analystes utilisent des méthodes statistiques, telles que Trouver des points chauds (Getis-Ord Gi*) pour quantifier les modèles spatiaux.
L'outil permet de calculer les statistiques Getis-Ord Gi* de chaque entité d'un jeu de données. Les scores z et valeurs p obtenus vous indiquent l'endroit où les entités de valeurs élevées ou faibles sont agrégées spatialement. L’outil Trouver des points chauds calcule les valeurs par défaut optimales selon les caractéristiques des données en entrée et applique automatiquement une correction FDR (False Discovery Rate). Chaque entité est analysée dans le contexte des entités voisines. Une entité dotée d'une valeur élevée est intéressante, mais il ne s'agit pas forcément d'un point chaud statistiquement significatif. Pour être un point chaud statistiquement significatif, une entité doit avoir une valeur élevée et être entourée d'autres entités également dotées de valeurs élevées. La somme locale d'une entité et de ses voisins est comparée proportionnellement à la somme de toutes les entités. Lorsque la somme locale est très différente de la somme locale attendue, et si la différence est trop importante pour n'être que le fruit du hasard, un score z statistiquement significatif est généré.
La réalisation d'une agrégation statistiquement significative sur vos données permet d'obtenir des informations précieuses. Le fait de savoir où et quand l'agrégation se produit peut fournir des indications importantes sur les processus qui favorisent les modèles auxquels vous assistez. Par exemple, savoir que le nombre de cambriolages résidentiels est plus élevé dans certains quartiers constitue une information clé si vous devez mettre en place des stratégies de prévention efficaces, allouer des ressources policières limitées, initier des programmes de surveillance de quartier, autoriser des enquêtes criminelles approfondies ou identifier des suspects potentiels.
Analyser les entités surfaciques
Une quantité importante de données est disponible pour les entités surfaciques telles que les secteurs de recensement, les comtés, les circonscriptions électorales, les secteurs hospitaliers, les parcelles, les limites de parcs et de zones de loisirs, les bassins versants, les classifications d'occupation du sol et les zones climatiques. Lorsque votre couche d'analyse contient des entités surfaciques, vous devez définir un champ numérique qui sera utilisé pour rechercher des grappes de valeurs élevées et faibles. Ce champ peut représenter les éléments suivants :
- Des nombres (par exemple, le nombre de ménages)
- Des taux (par exemple, la proportion de la population détentrice d'une licence universitaire)
- Des moyennes (par exemple, le revenu moyen ou médian des ménages)
- Des indices (par exemple, un score indiquant si les dépenses des ménages en équipement sportif se situe en-deçà ou au-delà de la moyenne nationale)
Grâce au champ que vous fournissez, l'outil Trouver des points chauds crée une carte (la couche de résultat) qui montre les zones présentant des grappes statistiquement significatives de valeurs élevées (points chauds : rouges) et de valeurs faibles (points froids : bleus).
Analyser les entités ponctuelles
Diverses données sont disponibles comme entités ponctuelles. Parmi les exemples d'entités fréquemment représentées par des points, citons les incidents criminels, les écoles, les hôpitaux, les appels d'urgence, les accidents de la route, les puits d'eau, les arbres et les bateaux. Vous pouvez souhaiter analyser des valeurs de données (champ) associées à chaque entité ponctuelle. Dans d'autres cas, vous vous intéressez uniquement à l'évaluation des grappes de points. La décision de fournir ou non un champ dépend de la question que vous posez.
Rechercher des grappes de valeurs élevées et faibles associées à des entités ponctuelles
Vous pouvez fournir un champ d'analyse pour répondre à des questions telles que « Où les valeurs élevées et faibles s'agrègent-elles ? » Le champ que vous sélectionnez peut représenter certains des éléments suivants :
- Des nombres (par exemple le nombre d'accidents de circulation aux intersections de rues)
- Des taux (par exemple, le chômage urbain, où chaque ville est représentée en tant qu'entité ponctuelle)
- Des moyennes (par exemple, le résultat moyen des écoles)
- Des indices (par exemple, de satisfaction des clients pour les concessions automobiles à travers le pays)
Rechercher des grappes de nombres de points élevées et faibles
Dans le cas de certaines données ponctuelles, généralement lorsque chaque point représente un événement, un incident ou une indication de présence/absence, il n'existe pas de champ d'analyse qui coule de source. Vous pouvez souhaiter savoir où l'agrégation est inhabituellement (statistiquement significative) intense ou faible. Pour cette analyse, les entités surfaciques (une grille que l'outil crée ou une couche de surface que vous fournissez) sont placées par dessus les points et le nombre de points dans chaque surface est compté. L'outil recherche ensuite de grappes de nombres de points élevées et faibles associées à chaque entité surfacique.
Définir où des points sont possibles
Spécifiez une couche surfacique ou dessinez des zones définissant une zone d'étude dans laquelle vous souhaitez que l'analyse soit effectuée dans tous les emplacements où les entités ponctuelles d'incidents peuvent se produire. Pour cette option, l'outil Trouver les points chauds superpose sur votre zone d'étude définie une grille et compte les points se trouvant dans chaque carré du maillage. Si vous n'indiquez pas par cette option où les points d'incidents peuvent se trouver, l'outil Trouver les points chauds analyse uniquement les carrés du maillage qui contiennent au moins un point. Lorsque vous utilisez cette option pour définir où les points peuvent se trouver, l'analyse est effectuée sur tous les carrés du maillage se trouvant dans les zones délimitées que vous définissez.
Compter les points au sein de vos propres zones d'agrégation
Dans certains cas, les entités surfaciques telles que les secteurs de recensements, les secteurs de police ou les parcelles ont plus de sens pour l'analyse que la grille par défaut.
Choisir l'option de division
Il existe deux méthodes courantes d'identification des points chauds ou froids :
- Par nombre : lorsque vous analysez un jeu de données particulier, vous pouvez souhaiter trouver les points chauds et froids du nombre d'entités au sein de chaque zone d'agrégation de votre zone d'étude. Vous pouvez, par exemple, souhaiter trouver les points chauds dans lesquels le plus grand nombre de délits a été perpétré et les points froids dans lesquels le plus faible nombre de délits est survenu, afin d'allouer des ressources.
- Par intensité : il peut s'avérer utile d'analyser et de comprendre les modèles en tenant compte des répartitions sous-jacentes qui ont une incidence sur un phénomène particulier. C'est ce que l'on appelle souvent la normalisation, soit le processus de division d'une valeur attributaire numérique par une autre valeur afin de réduire les différences de valeurs selon la taille des surfaces ou le nombre d'entités de chaque surface. Par exemple, dans le cas de la criminalité, vous pouvez souhaiter connaître la répartition des grappes de forts et faibles taux de criminalité en tenant compte de la population sous-jacente. Dans ce cas, vous comptez le nombre de délits dans chaque zone (que cette zone soit un maillage ou un jeu de données surfacique différent) et divisez ce total par la population totale de la zone. Cela donne un taux de criminalité, soit le nombre de délits par personne. La recherche de points chauds et froids de criminalité par personne répond à une question différente qui permet également de prendre des décisions avisées.
Les deux façons d'analyser les données au sein de votre zone d'analyse sont valides. Tout dépend de la question que vous posez.
Le choix de l'attribut adéquat en fonction duquel effectuer la division est très important. Vous devez vous assurer que l'attribut Diviser par est un attribut qui a une incidence dans les faits sur la répartition d'un phénomène donné que vous analysez.
Lorsque vous sélectionnez l'option Diviser par Esri Population, les données relatives à la population issues de Esri Demographics Global Coverage sont utilisées. Vérifiez la résolution des données disponibles pour la zone qui vous intéresse, afin de vous assurer qu'elle est compatible avec la taille des zones en cours d'enrichissement (soit des zones d'agrégation que vous fournissez soit des carrés de quadrillage en cours de création).
Interpréter les résultats
La sortie de l'outil Trouver les points chauds est une carte. Pour les points ou les surfaces dans cette carte de couche de résultat, plus la couleur rouge ou bleue est foncée et plus vous pouvez être certain que l'agrégation n'est pas le fruit du hasard. Les points ou surfaces qui s'affichent en beige, d'un autre côté, ne font pas partie d'une grappe statistiquement significative. Le modèle spatial associé à ces entités pourrait très bien être le fruit du hasard. Il peut arriver que les résultats de votre analyse n'indiquent aucune grappe statistiquement significative. Ces informations sont importantes. Lorsqu'un motif spatial est aléatoire, vous n'avez aucune indication des causes sous-jacentes. Dans ce cas, toutes les entités de la couche de résultat apparaissent en beige. Cependant, lorsque vous détectez une agrégation statistiquement significative, les emplacements où surviennent l'agrégation sont des indications importantes quant à ses origines. Par exemple, la recherche d'agrégations spatiales statistiquement significatives de cas de cancers associés à certaines toxines présentes dans l'environnement, par exemple, peut contribuer à la mise en place de stratégies et de campagnes de protection de la population. De la même façon, les points froids d'obésité infantile associés à des programmes d'incitation à la pratique de sport en dehors de l’école peuvent justifier la promotion à plus grande échelle de ce type de programmes.
Dépanner
La méthode statistique utilisée par l'outil Trouver des points chauds repose sur la loi des probabilités et, par conséquent, nécessite un nombre minimal d'entités pour être efficace. Cette méthode statistique requiert également différents nombres ou valeurs de champ d'analyse. Si vous analysez les délits par secteur de recensement, par exemple, et que vous obtenez exactement le même nombre de délits dans chaque secteur, l'outil ne peut pas fonctionner. Le tableau suivant offre une explication des messages susceptibles d'apparaître lorsque vous utilisez l'outil Trouver des points chauds :
Message | Problème | Solution |
---|---|---|
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 60 points pour calculer les points chauds et froids. | Votre couche d'analyse des points ne comporte pas assez d'entités ponctuelles pour parvenir à des résultats fiables. | La solution la plus évidente consiste à ajouter des points à votre couche d'analyse. Vous pouvez également définir des zones d'analyse adjacentes et ajouter ainsi des informations sur l'endroit où des points auraient pu se produire. Cette méthode nécessite un minimum de 30 points. Vous pouvez également fournir des zones d'agrégation qui superposent vos points. Vous aurez besoin d'un minimum de 30 zones surfaciques et de 30 points au sein de ces zones pour cette analyse. Si vous possédez 30 points au moins, vous pouvez spécifier un champ d'analyse. Dans ce cas, la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 30 points avec des données valides dans le champ d'analyse afin de calculer les points chauds et froids. | Votre couche d'analyse ne comporte pas assez de points, ou pas assez de points associés à des valeurs de champ d'analyse autres que NULL, pour parvenir à des résultats fiables. | Malheureusement, si vous avez moins de 30 points, cette méthode d'analyse ne convient pas à vos données. Si vous avez plus de 30 points et que vous voyez ce message, le champ d'analyse que vous avez spécifié comporte peut-être des valeurs NULL. Les points comportant des valeurs de champ d'analyse NULL seront ignorés. Il est également possible qu'un filtre actif réduise le nombre de points disponibles pour l'analyse. |
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 30 polygones avec des données valides dans le champ d'analyse afin de calculer les points chauds et froids. | Votre couche d'analyse ne comporte pas assez de zones surfaciques, ou pas assez d'entités surfaciques associées à des valeurs de champ d'analyse autres que NULL, pour parvenir à des résultats fiables. | Malheureusement, si vous avez moins de 30 zones surfaciques, cette méthode d'analyse ne convient pas à vos données. Si vous avez plus de 30 zones et que vous voyez ce message, le champ d'analyse que vous avez spécifié comporte peut-être des valeurs NULL. Les zones surfaciques comportant des valeurs de champ d'analyse NULL seront ignorées. Il est également possible qu'un filtre actif réduise le nombre de zones surfaciques disponibles pour l'analyse. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 points à l'intérieur des zones surfaciques d'emprise. | Seuls les points qui se trouvent à l'intérieur des zones d'analyse d'emprise que vous dessinez ou fournissez sont analysés. Pour obtenir des résultats fiables, 30 points au moins doivent se trouver à l'intérieur des zones d'analyse d'emprise. | Malheureusement, si vous n'avez pas 30 points au moins, cette méthode ne convient pas à vos données. Avec un minimum de 30 entités toutefois, la solution consiste souvent dans ce cas à indiquer des zones d'analyse d'emprise différentes, voire plus grandes. Vous pouvez également fournir une couche surfacique avec un minimum de 30 polygones d'agrégation qui superposent au moins 30 de vos points. Lorsque vous fournissez les zones d'agrégation, l'analyse est réalisée sur le nombre de points au sein de chaque zone. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 points à l'intérieur des polygones d'agrégation. | Seuls les points qui se trouvent à l'intérieur des polygones d'agrégation sont inclus dans l'analyse. Pour obtenir des résultats fiables, 30 points au moins doivent se trouver à l'intérieur des zones surfaciques que vous fournissez. | Malheureusement, si vous n'avez pas 30 points au moins, cette méthode ne convient pas à vos données. Sinon, vous devez dessiner ou fournir des zones d'analyse d'emprise qui superposent au moins 30 de vos points. Les zones d'emprise doivent refléter tous les emplacements où les points sont susceptibles de se produire. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 zones d'agrégation. | L'option que vous avez sélectionnée permet de superposer les zones d'agrégation par dessus vos points, puis de comptabiliser les points qui se trouvent au sein de chaque zone. Un minimum de 30 (30 zones) est nécessaire pour parvenir à des résultats fiables. | Des résultats fiables peuvent être obtenus si vous fournissez un minimum de 30 points se trouvant au sein d'un minimum de 30 zones d'agrégation. Si vous n'avez pas 30 zones d'agrégation, vous pouvez dessiner ou fournir des zones d'analyse d'emprise superposant au moins 30 de vos points. Ces zones d'emprise doivent refléter tous les emplacements où les points sont susceptibles de se produire. |
Les points chauds et froids ne peuvent pas être calculés si le nombre de points dans chaque zone surfacique est identique. Essayez différentes zones surfaciques ou différentes options d'analyse. | Lorsque l'outil Trouver des points chauds a comptabilisé le nombre de points au sein de chaque zone surfacique, il a trouvé que les nombres étaient identiques. Pour générer des résultats, cet outil requiert un degré minimal de variation dans les nombres obtenus. | Vous pouvez fournir d'autres zones d'agrégation afin que toutes les zones n'aient pas le même nombre de points exactement. Au lieu des zones d'agrégation, vous pouvez également dessiner ou fournir des zones d'analyse d'emprise. Vous pouvez spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
La variation est insuffisante dans les emplacements des points pour calculer les points chauds et froids. Les points coïncidents, par exemple, réduisent la variation spatiale. Vous pouvez essayer de fournir une zone d'emprise, des zones d'agrégation (30 au minimum) ou un champ d'analyse. | En fonction du nombre de points et de leur répartition, l'outil crée une grille pour superposer vos points. Après avoir comptabilisé le nombre de points qui se trouvent au sein de chaque carré du quadrillage et avoir supprimé les carrés dont le nombre de points est nul, il restait moins de 30 carrés. Cet outil requiert un minimum de 30 (30 carrés) pour parvenir à des résultats fiables. | Si vos points occupent très peu d'endroits uniques (s'il y a beaucoup de points coïncidents), il est recommandé de fournir des zones d'agrégation qui superposent vos points, ou de dessiner ou fournir des zones d'analyse d'emprise indiquant où les points peuvent ou non se produire. Vous pouvez également spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
La variation est insuffisante parmi les points au sein des zones surfaciques d'emprise. Vous pouvez essayer de fournir des limites plus vastes. | En fonction des emplacements des points et du nombre de points, l'outil crée une grille pour superposer vos points. Après avoir comptabilisé le nombre de points qui se trouvent au sein de chaque carré du quadrillage et avoir supprimé les carrés qui se trouvent à l'extérieur de vos zones d'analyse d'emprise, il restait moins de 30 carrés de quadrillage. Cet outil requiert un minimum de 30 (30 carrés) pour parvenir à des résultats fiables. | Si vos points se trouvent à différents emplacements à l'intérieur des zones d'analyse d'emprise, vous pouvez peut-être simplement créer ou fournir des limites plus vastes. Si vos points occupent très peu d'endroits uniques (s'il y a beaucoup de points coïncidents), il est recommandé de fournir des zones d'agrégation qui superposent vos points. Vous pouvez également spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
Toutes les valeurs de votre champ d'analyse sont probablement les mêmes. Les points chauds et froids ne peuvent pas être calculés si le champ en cours d'analyse ne présente aucune variation. | Il est probable que vous avez spécifié un champ d'analyse contenant la même valeur pour tous vos points ou entités surfaciques dans la couche d'analyse. La statistique utilisée par cet outil ne peut pas effectuer de résolution si les valeurs sont identiques. | Vous pouvez spécifier un champ d'analyse différent ou, pour les entités ponctuelles, des densités ponctuelles d'analyseau lieu de valeurs ponctuelles. |
Nous n'avons pas pu calculer les points chauds et froids pour les données fournies. Le cas échéant, essayez de spécifier un champ d'analyse. | Même si cela est peu probable, lorsque l'outil a créé une grille et comptabilisé le nombre de points au sein de chaque carré, les nombres pour tous les carrés étaient identiques. | La solution consiste alors à fournir vos propres zones d'agrégation, à dessiner ou fournir des zones d'analyse d'emprise ou à spécifier un champ d'analyse. |
La taille de cellule doit être inférieure au canal de distance. | Vous avez indiqué une valeur de canal de distance inférieure à la taille de chaque cellule de grille. | Vérifiez les unités spécifiées pour Canal de distance et Taille de cellule, utilisez la valeur par défaut calculée par l'outil ou utilisez une valeur supérieure à la taille d'une cellule de grille. |
Vous trouverez des informations complémentaires concernant les algorithmes employés par l'outil Trouver des points chauds dans Fonctionnement de l'analyse de points chauds optimisée.
Outils semblables
L'outil Trouver des points chauds permet de déterminer si le modèle spatial de vos données présente des agrégations statistiquement significatives. Voici d'autres outils susceptibles d'être utiles :
Outils d'analyse Map Viewer
Si vous êtes intéressé par la recherche de points aberrants dans le modèle spatial de vos données, utilisez l'outil Trouver des points aberrants.
Si vous souhaitez créer une carte de densité de vos entités ponctuelles ou linéaires, faites appel à l'outil Calculer la densité.
outils d’analyse de ArcGIS Pro
L'outil Rechercher les points chauds calcule les mêmes statistiques que les outils Analyse de points chauds (Getis-Ord Gi*) et Analyse de points chauds optimisée.
Rechercher les points chaudsL’outil est également disponible dans ArcGIS Pro. Pour que l’outil s’exécute à partir de ArcGIS Pro, le portail actif du projet doit exécuter ArcGIS Enterprise 10.5 ou version ultérieure. Vous devez également vous connecter au portail via un compte détenteur des privilèges permettant d’effectuer une analyse d’entités standard sur le portail.
Vous avez un commentaire à formuler concernant cette rubrique ?