Skip To Content

Trova Hot Spot

Trova hot spot Lo strumento Trova hot spot consente di determinare la presenza di cluster statisticamente rilevanti nel modello spaziale dei dati.

Diagramma del Workflow

Diagramma del flusso di lavoro Trova hot spot

Esempi

  • Il dipartimento di polizia di una città sta conducendo un'analisi per determinare se esiste una relazione tra crimini violenti e tassi di disoccupazione. Un programma di lavoro stagionale esteso verrà implementato per le scuole superiori in aree con elevata criminalità violenta ed elevata disoccupazione. Trova Hot Spot verrà utilizzato per trovare aree con hot spot criminalità e disoccupazione statisticamente significativi.

  • Uno stratega politico desidera identificare le aree con il supporto maggiore o minore per un particolare partito politico nell'ultima elezione. Queste informazioni potrebbero essere utili per definire le strategie delle campagne per elezioni future. Lo stratega sottrae la percentuale di voti dei Democratici da quella dei Repubblicani e utilizza lo strumento Trova hot spot per individuare gli hot spot e i cold spot nelle differenze. Gli hot spot (rossi) denotano forte supporto Repubblicano mentre i cold spot (blu) denotano forte supporto Democratico.

  • Un responsabile della conservazione sta studiando le malattie negli alberi per assegnare la priorità alle aree della foresta che devono essere trattate e ottenere ulteriori informazioni sulle aree che mostrano una forma di resistenza. Lo strumento Trova hot spot può essere utilizzato per trovare cluster di alberi malati (hot spot) e sani (cold spot).

Note sull'utilizzo

Le feature di input possono essere puntuali o areali.

Il parametro Trova cluster di valori alti e bassi è utilizzato per valutare la disposizione spaziale delle feature. Se le feature sono aree, occorre scegliere un campo. Il raggruppamento verrà determinato utilizzando i numeri nel campo scelto. Feature puntuali possono essere analizzate utilizzando un campo o l'opzione Point Counts. Se si utilizza Point Counts, lo strumento determinerà se i punti stessi sono raggruppati in cluster, anziché cluster di valori di campo alti e bassi.

Se è in corso l'analisi di punti con Point Counts, saranno disponibili due nuove opzioni. Il parametro Calcolare i punti all'interno consente di aggregare i punti all'interno di una Fishnet Grid, una Hexagon Grid o un layer areale da Contenuti, ad esempio contee o CAP. Il parametro Definisci dove sono possibili i punti viene utilizzato per creare una o più aree di interesse. Le tre opzioni per questo parametro sono None, ovvero vengono utilizzati tutti i punti, un'area definita da un layer areale dei Contenuti e aree create utilizzando lo strumento Disegna.

I dati possono essere normalizzati utilizzando il parametro Suddividi per. I dati di Esri Population utilizzano GeoEnrichment e richiedono l'utilizzo di crediti. Un'altra opzione è normalizzare utilizzando un campo da un layer di input. Alcuni valori che possono essere utilizzati per la normalizzazione includono il numero di unità abitative o l'area.

Le Opzioni possono essere utilizzate per impostare una Dimensione cella o una Banda di distanza specifica per l'analisi.

Il layer di output dispone di campi aggiuntivi contenenti informazioni come la rilevanza statistica di ogni feature, il valore P e il punteggio Z. Il layer di output contiene anche informazioni sull'analisi statistica nella sezione Descrizione dei relativi Dettagli elemento.

Come funziona Trova hot spot

È possibile individuare cluster anche in modelli spaziali casuali. Gli occhi e il cervello umano provano inoltre naturalmente a individuare modelli anche quando non esistono. Di conseguenza può risultare difficile sapere se i modelli presenti nei dati sono il risultato di processi spaziali reali o semplicemente il risultato del caso. È per questo motivo che ricercatori e analisti utilizzano metodi statistici come Trova Hot Spot (Getis-Ord Gi*) per quantificare modelli spaziali.

Lo strumento calcola la statistica Getis-Ord Gi* (che si pronuncia G-i-star) per ciascuna feature in un dataset. I punteggi Z e i valori P risultanti indicano dove le feature con valori alti e bassi sono raggruppate spazialmente in cluster. Lo strumento Trova Hot Spot calcola i predefiniti ottimali in base alle caratteristiche dei dati di input e applica automaticamente una correzione FDR (False Discovery Rate). Ogni feature viene analizzata all'interno del contesto di feature contigue. Una feature con un valore alto è interessante ma potrebbe non essere un hot spot statisticamente rilevante. Per essere un hot spot statisticamente rilevante, una feature deve avere un valore alto ed essere anche circondata da valori alti. La somma locale per una feature e i relativi vicini viene confrontata in modo proporzionale alla somma di tutte le feature; quando la somma locale è molto diversa dalla somma locale prevista e quando tale differenza è troppo grande per essere il risultato di una casualità, viene generato un punteggio Z statisticamente rilevante.

L'individuazione di cluster di rilevanza statistica nei dati consente di disporre di informazioni importantissime. Sapere dove e quando si verificano i cluster può offrire indizi importanti sui processi che portano alla creazione dei modelli visualizzati. Sapere, ad esempio, che il numero di furti in appartamento è particolarmente elevato in un determinato quartiere è essenziale per definire adeguate strategie di prevenzione, allocare risorse di polizia inadeguate, predisporre programmi di sorveglianza del quartiere, autorizzare investigazioni approfondite sui reati o identificare potenziali sospetti.

Analizzare le feature areali

Per le feature areali, ad esempio sezioni di spoglio, province, distretti elettorali, aree ospedaliere, particelle, confini di parchi e aree ricreative, spartiacque, classificazioni di coperture del suolo e zone climatiche, è disponibile una notevole quantità di dati. Quando il layer di analisi contiene feature di area, è necessario specificare un campo di analisi numerico che sarà impiegato per trovare cluster di valori alti e bassi. Il campo di analisi potrebbe rappresentare quanto segue:

  • Conteggi, ad esempio il numero di nuclei familiari
  • Percentuali, ad esempio la percentuale della popolazione che ha conseguito una laurea
  • Medie, ad esempio la media o la mediana del reddito familiare
  • Indici, ad esempio un indice indicante se la spesa delle famiglie in articoli sportivi è superiore o inferiore alla media nazionale

Con il campo specificato, lo strumento Trova hot spot creerà una mappa (il layer di risultati) indicante le aree con cluster di rilevanza statistica per valori alti (hot spot: rossi) e bassi (cold spot: blu).

Analizzare le feature puntuali

Le feature puntuali includono un'ampia varietà di dati. Alcuni esempi di feature rappresentate il più delle volte come punti includono reati, scuole, ospedali, eventi con chiamate di emergenza, incidenti stradali, pozzi, alberi e imbarcazioni. È possibile che a volte si sia interessati ad analizzare i valori di dati (un campo) associati a ogni feature puntuale. In altri casi, si è interessati solo a valutare il clustering dei punti stessi. La decisione se fornire o meno un campo dipende dalla domanda che ci si pone.

Trovare cluster con valori alti e bassi associati a feature puntuali

Analizzare i punti con un campo di analisi È opportuno specificare un campo di analisi per rispondere a domande come: dove i valori alti e bassi si raggruppano in cluster? Il campo selezionato può rappresentare alcuni dei seguenti:

  • Conteggi, ad esempio il numero di incidenti stradali che si verificano agli incroci
  • Percentuali, ad esempio il tasso di disoccupazione di una città, in cui la città viene rappresentata come feature puntuale
  • Medie, ad esempio la media dei voti assegnati alle verifiche di matematica in varie scuole
  • Indici, ad esempio l'indice di soddisfazione dei clienti nei confronti delle concessionarie di auto nella provincia

Trovare cluster di conteggi di punti alti e bassi

Analizzare i punti, nessun campo di analisi Per alcuni dati puntuali, solitamente quando ogni punto rappresenta un evento, un incidente o un'indicazione di presenza/assenza, non è disponibile alcun campo di analisi ovvio da utilizzare. In questi casi, si desidera solo identificare le aree in cui il clustering è insolitamente (con rilevanza statistica) concentrato o distribuito. Per questa analisi, le feature areali (una griglia creata automaticamente dallo strumento o un layer arelae specificato dall'utente) vengono inserite sui punti e viene calcolato il numero di punti che rientra in ogni area. Lo strumento trova quindi cluster con conteggi di punti alti e bassi per ogni feature areali.

Definisci dove sono possibili i punti

Punti, nessun campo di analisi, area di studio di confine Specificare un layer arele oppure disegnare aree che definiscono un'area di studio in cui si desidera che l'analisi venga eseguita in tutte le posizioni in cui potrebbero verificarsi le feature puntuali degli incidenti. Per questa opzione, lo strumento Trova hot spot sovrapporrà all'area di studio definita una griglia e conterà i punti che rientrano in ogni riquadro della griglia. Se non si specificano le aree in cui sono possibili i punti di incidenti utilizzando questa opzione, lo strumento Trova hot spot analizzerà solo i riquadri della griglia contenenti almeno un conteggio punti. Se invece si utilizza questa opzione per definire le aree in cui sono possibili i punti, l'analisi verrà eseguita per tutti i riquadri della griglia che rientrano nelle aree di confine definite.

Contare i punti all'interno delle proprie aree di aggregazione

Punti, nessun campo di analisi, aree di aggregazione In alcuni casi le feature areali come sezioni di spoglio, ronde di polizia o particelle risultano molto più significative ai fini dell'analisi rispetto alla griglia predefinita.

Scegliere di dividere per

Normalizzazione del dataset Vi sono due approcci comuni per identificare gli hot spot e i cold spot:

  • Per conteggio: quando si analizza un particolare set di dati, spesso si desidera trovare hot spot e cold spot del numero di feature in ogni area di aggregazione nell'area di studio. Ad esempio, è possibile che si desideri trovare hot spot in cui è avvenuto il più elevato numero di crimini e i cold spot in cui si è verificato il numero più basso di crimini per allocare adeguatamente le risorse.
  • Per intensità: anche analizzare e comprendere schemi che tengano conto delle distribuzioni sottostanti che influiscono su un fenomeno specifico può essere importante. Questo concetto è spesso menzionato come normalizzazione o processo per cui si divide un valore numerico di attributo per un altro valore, al fine di minimizzare le differenze tra i valori in base alle dimensioni delle aree o al numero di feature per ogni area. Ad esempio, nel caso dei crimini, è possibile che si voglia comprendere dove si trovano i cluster con numeri alti e bassi di crimini che tengano conto della densità di popolazione. In tal caso, è opportuno conteggiare i crimini in ogni area (sia che questa sia una griglia o un set di dati area diverso) e dividere il numero totale di crimini per la popolazione totale in quell'area. Così facendo si otterrebbe un tasso di criminalità o il numero di crimini pro capite. Trovare gli hot spot e i cold spot di crimini pro capite risponde a una domanda diversa che può anch'essa aiutare a prendere decisioni.

Entrambi i modi di analizzare i dati nell'area di studio sono validi; la scelta del metodo dipende dalla domanda che ci si è posti.

La scelta di un attributo adeguato in funzione del quale viene effettuata la divisione è molto importante. Occorre verificare che l'attributo Suddividi per sia un attributo che influenza effettivamente la distribuzione del fenomeno specifico che si sta analizzando.

Quando si sceglie Suddividi per Esri Population, vengono usati i dati sulla popolazione tratti da Esri Demographics Global Coverage. Assicurarsi di controllare la risoluzione dei dati disponibili per l'area di interesse per garantire che sia compatibile con le dimensioni delle aree in cui saranno aggiunti dati (aree di aggregazione fornite dall'utente o riquadri della griglia creati).

Interpretare i risultati

L'output dello strumento Trova hot spot è una mappa. Per i punti o le aree della mappa del layer dei risultati, un colore, rosso o blu, più scuro indicherà con maggior sicurezza che i cluster non sono il risultato di una casualità. I punti o le aree visualizzate in beige, invece, non fanno parte di cluster di rilevanza statistica, pertanto è molto probabile che il modello spaziale associato a queste feature sia il risultato di una casualità. Talvolta i risultati dell'analisi indicano la totale assenza di cluster di rilevanza statistica. Questa informazione è importante. Se il modello spaziale è casuale, non sono disponibili indicazioni sulle cause sottostanti. In questi casi, tutte le feature del layer dei risultati saranno di colore beige. Tuttavia, quando vengono trovati cluster di rilevanza statistica, le posizioni in cui si verifica il clustering sono importanti indicazioni su ciò che potrebbe causarlo. Ad esempio, l'individuazione di cluster spaziali di rilevanza statistica di casi di tumore associati a determinate tossine ambientali, può portare all'adozione di politiche e misure per proteggere la popolazione. Analogamente, se vengono trovati cold spot di obesità infantile associati a scuole che promuovono programmi sportivi doposcuola, è possibile fornire una giustificazione efficace per incoraggiare una diffusione più ampia di questi programmi.

Risoluzione dei problemi

Il metodo statistico utilizzato dallo strumento Trova hot spot è basato sulla teoria della probabilità e, pertanto, necessita di un numero minimo di feature per funzionare efficacemente. Questo metodo statistico richiede inoltre diversi valori di campo di analisi e conteggi. Se si stanno analizzando i reati per sezione di spoglio, ad esempio, e sorprendentemente risulta esattamente lo stesso numero di reati in ciascuna sezione di spoglio, lo strumento non è in grado di trovare una soluzione. Nella tabella che segue è riportata una spiegazione dei messaggi che possono essere visualizzati durante l'uso dello strumento Trova hot spot.

MessaggioProblemaSoluzione

Per le opzioni di analisi selezionate, sono necessari almeno 60 punti per calcolare hot e cold spot.

Nel layer di analisi dei punti, il numero di feature non è sufficiente per ottenere risultati affidabili.

La soluzione ovvia è aggiungere più punti al layer di analisi.

In alternativa, è possibile provare a definire le aree di analisi di confine, quindi aggiungere le informazioni relative alle posizioni in cui i punti avrebbero potuto essere presenti ma non lo sono stati. Per utilizzare questo metodo, sono necessari almeno 30 punti.

È inoltre possibile provare a fornire aree di aggregazione sovrapposte ai punti. Per questa analisi, è necessario disporre di almeno 30 aree di poligono e 30 punti all'interno di tali aree.

Se si dispone di almeno 30 punti, è possibile specificare un campo di analisi. Di conseguenza, la domanda "dove sono presenti molti o pochi punti?" diventa "dove si raggruppano in cluster i valori alti e bassi di un campo di analisi?".

Per le opzioni di analisi selezionate, sono necessari almeno 30 punti con dati validi nel campo di analisi per calcolare hot e cold spot.

Nel layer di analisi, il numero di punti o di punti associati a valori di campo di analisi non NULL non è sufficiente per ottenere risultati affidabili.

Sfortunatamente, se si dispone di meno di 30 punti, questo metodo di analisi non è appropriato per i dati a disposizione. Se si dispone di più di 30 punti e si visualizza questo messaggio, è possibile che il campo di analisi specificato contenga valori NULL. I punti con valori di campo di analisi NULL vengono ignorati. È inoltre possibile che si disponga di un filtro attivo che riduce il numero di punti disponibili per l'analisi.

Per le opzioni di analisi selezionate, sono necessari almeno 30 poligoni con dati validi nel campo di analisi per calcolare hot spot e cold spot.

Nel layer di analisi, il numero di aree di poligono o di feature areali associate a valori di campo di analisi non NULL non è sufficiente per ottenere risultati affidabili.

Sfortunatamente, se si dispone di meno di 30 aree di poligono, questo metodo di analisi non è appropriato per i dati a disposizione. Se si dispone di più di 30 aree e si visualizza questo messaggio, è possibile che il campo di analisi specificato contenga valori NULL. Le aree di poligono con valori di campo di analisi NULL vengono ignorate. È inoltre possibile che si disponga di un filtro attivo che riduce il numero di aree di poligono disponibili per l'analisi.

Per l'opzione di analisi selezionata, è necessario che almeno 30 punti siano inclusi nelle aree di poligono di confine.

Verranno analizzati solo i punti che si trovano all'interno delle aree di analisi di confine disegnate o fornite. Per ottenere risultati affidabili, è necessario che almeno 30 punti siano all'interno delle aree di analisi di confine.

Sfortunatamente, se non si dispone di almeno 30 punti, questo metodo non è appropriato per i dati a disposizione. Con un minimo di 30 feature, spesso la soluzione consiste nel fornire aree di analisi di confine differenti, eventualmente di dimensioni maggiori.

Un'altra opzione potrebbe essere fornire un layer di area con almeno 30 poligoni di aggregazione sovrapposti ad almeno 30 punti. Quando si forniscono aree di aggregazione, l'analisi viene eseguita sul conteggio di punti all'interno di ciascuna area.

Per l'opzione di analisi selezionata, è necessario che almeno 30 punti siano all'interno dei poligoni di aggregazione.

Solo i punti che si trovano all'interno dei poligoni di aggregazione vengono inclusi nell'analisi. Per ottenere risultati affidabili, è necessario che almeno 30 punti siano all'interno delle aree di poligono fornite.

Sfortunatamente, se non si dispone di almeno 30 punti, questo metodo non è appropriato per i dati a disposizione; altrimenti è necessario disegnare o fornire aree di analisi di confine sovrapposte di almeno 30 punti. Le aree di confine devono riflettere tutte le posizioni in cui i punti potrebbero eventualmente essere presenti.

Per l'opzione di analisi selezionata, sono necessarie almeno 30 aree di aggregazione.

L'opzione selezionata consente di sovrapporre le aree di aggregazione ai punti e di calcolare il numero di punti che si trovano all'interno di ciascuna area. Per ottenere risultati affidabili, è necessario effettuare almeno 30 conteggi (30 aree).

Fornendo almeno 30 punti all'interno di almeno 30 aree di aggregazione è possibile ottenere risultati affidabili. Se non si dispone di 30 aree di aggregazione, è possibile provare a disegnare o fornire aree di analisi di confine sovrapposte ad almeno 30 punti. Queste aree di confine devono riflettere tutte le posizioni in cui i punti potrebbero eventualmente essere presenti.

Quando il numero di punti in ogni area di poligono è identico, non è possibile calcolare hot e cold spot. Provare a utilizzare aree di poligono differenti oppure opzioni di analisi differenti.

Quando lo strumento Trova hot spot ha calcolato il numero di punti all'interno di ciascuna area di aggregazione, i conteggi sono risultati tutti identici. Per calcolare i risultati, lo strumento richiede almeno una variazione minima nei valori di conteggio ottenuti.

È possibile fornire aree di aggregazione alternative affinché non risulti esattamente lo stesso numero di punti in tutte le aree.

Anziché le aree di aggregazione, è inoltre possibile provare a disegnare o fornire aree di analisi di confine.

In alternativa, è possibile specificare un campo di analisi. Di conseguenza, la domanda "dove sono presenti molti o pochi punti?" diventa "dove si raggruppano in cluster i valori alti e bassi di un campo di analisi?".

Nelle posizioni dei punti, la variazione non è sufficiente per calcolare hot e cold spot. Punti coincidenti, ad esempio, riducono la variazione spaziale. È possibile provare a fornire un'area di confine, aree di aggregazione (almeno 30) o un campo di analisi.

In base al numero di punti e al tipo di distribuzione, lo strumento crea una griglia per sovrapporli. Una volta effettuato il conteggio del numero di punti all'interno di ciascun riquadro della griglia e una volta rimossi i riquadri con conteggi nulli, sono rimasti meno di 30 riquadri. Questo strumento richiede almeno 30 conteggi (30 riquadri) per fornire risultati affidabili.

Se i punti occupano pochissime posizioni univoche (se vi sono molti punti coincidenti), una buona soluzione consiste nel fornire aree di aggregazione sovrapposte ai punti oppure disegnare e fornire aree di analisi di confine, indicando dove è possibile o meno che i punti siano presenti.

Un'altra opzione è specificare un campo di analisi. Di conseguenza, la domanda "dove sono presenti molti o pochi punti?" diventa "dove si raggruppano in cluster i valori alti e bassi di un campo di analisi?".

Variazione insufficiente tra i punti all'interno delle aree di poligono di confine. È possibile provare a fornire confini di dimensioni maggiori.

In base alle posizioni dei punti e al numero di punti, lo strumento crea una griglia per sovrapporli. Una volta effettuato il conteggio del numero di punti all'interno di ciascun riquadro della griglia e una volta rimossi i riquadri esterni alle aree di analisi di confine, sono rimasti meno di 30 riquadri della griglia. Questo strumento richiede almeno 30 conteggi (30 riquadri) per fornire risultati affidabili.

Se i punti si trovano in diverse posizioni all'interno delle aree di analisi di confine, è possibile che sia sufficiente disegnare o fornire confini di dimensioni maggiori. Se i punti occupano pochissime posizioni univoche (se vi sono molti punti coincidenti), una buona soluzione consiste nel fornire aree di aggregazione sovrapposte ai punti.

Un'altra opzione è specificare un campo di analisi. Di conseguenza, la domanda "dove sono presenti molti o pochi punti?" diventa "dove si raggruppano in cluster i valori alti e bassi di un campo di analisi?".

È probabile che tutti i valori del campo di analisi siano identici. Quando non vi è alcuna variazione nel campo che si sta analizzando, non è possibile calcolare hot e cold spot.

Molto probabilmente è stato specificato un campo di analisi che presenta lo stesso valore per tutti i punti o feature areali presenti nel layer di analisi. A meno che non vi siano diversi valori con cui lavorare, il tipo di statistica utilizzato da questo strumento non è in grado di trovare una soluzione.

È possibile specificare un campo di analisi differente o, per feature puntuali, analizzare densità punto anziché valori puntuali.

Impossibile calcolare hot e cold spot per i dati forniti. Se appropriato, provare a specificare un campo di analisi.

Sebbene sia abbastanza improbabile, quando lo strumento ha creato una griglia e ha calcolato il numero di punti all'interno di ciascun riquadro, i conteggi di tutti i riquadri sono risultati identici.

Le soluzioni potrebbero essere: fornire proprie aree di aggregazione, disegnare o fornire aree di analisi di confine oppure specificare un campo di analisi.

Il valore di Dimensione cella deve essere minore di Banda di distanza.

È stato fornito un valore di Banda di distanza che è inferiore alla dimensione di ciascuna cella della griglia.

Controllare le unità specificate sia per Banda di distanza che per Dimensione cella, utilizzare il valore predefinito calcolato dallo strumento o un valore che sia maggiore della dimensione di una singola cella della griglia.

Per informazioni aggiuntive sugli algoritmi utilizzati dallo strumento Trova hot spot, consultare la sezione Come funziona Analisi hot spot ottimizzata.

Strumenti simili

Utilizzare Trova hot spot per determinare la presenza di cluster statisticamente rilevanti nel modello spaziale dei dati. Altri strumenti che possono essere utili sono i seguenti:

Strumenti di analisi di Map Viewer

Se si desidera trovare outlier nel modello spaziale dei dati, utilizzare lo strumento Trova outlier.

Se si desidera creare una mappa di densità delle feature puntuali o lineari, utilizzare lo strumento Calcolo densità.

Strumenti di analisi di ArcGIS Pro

Trova Hot Spot esegue la stessa statistica utilizzata negli strumenti Analisi Hot Spot (Getis-Ord Gi*) e Analisi Hot Spot ottimizzata.

Trova hot spot è disponibile anche in ArcGIS Pro. Per eseguire lo strumento da ArcGIS Pro, sul portale attivo del progetto deve essere in esecuzione ArcGIS Enterprise 10.5 o versione successiva. È necessario effettuare l'accesso al portale utilizzando un account che ha privilegi per eseguire le analisi delle feature standard nel portale.