Lo strumento Trova cluster punti identifica i cluster di feature punto dal disturbo circostante, in base alla relativa distribuzione spaziale.
Esempi
Di seguito vengono forniti alcuni esempi di utilizzo di questo strumento:
- Un'organizzazione che studia una particolare malattia trasmessa da parassiti vuole identificare dove, nella propria area di studio, iniziare il trattamento e lo sterminio di questi parassiti. L'analista dispone di un dataset punto che rappresenta le famiglie infestate e non infestate nell'area di studio. L'analista utilizza lo strumento Trova cluster punto per trovare il cluster più grande di famiglie infestate.
- Un'organizzazione di risposta alle catastrofi deve stabilire dove dispiegare le proprie risorse per il salvataggio e l'evacuazione in seguito a un disastro naturale. Un analista utilizza lo strumento Trova cluster punto per identificare i cluster di tweet geolocalizzati che menzionano l'evento. L'organizzazione utilizza le dimensioni e la posizione dei cluster per mappare l'area colpita e informare i propri interventi di rilievo.
Note sull'utilizzo
Lo strumento Trova cluster punto include le configurazioni per le feature di input, le impostazioni dei cluster e il layer dei risultati.
Feature di Input
Il gruppo Feature di input include il parametro Layer di input, che è il layer con le feature di punto che saranno raggruppate in cluster basati sulla loro distribuzione spaziale.
Un conteggio delle feature viene visualizzato sotto il nome del layer. Il conteggio include tutte le feature del layer, eccetto quelle che sono state rimosse con un filtro. Le impostazioni ambiente, ad esempio Estensione elaborazione non si riflettono nel conteggio di feature.
Nota:
Web Mercator non è una proiezione appropriata per l'analisi spaziale. Se il sistema di riferimento spaziale del layer di input è WGS 1984 Web Mercator (Sfera ausiliaria), i dati saranno convertiti in un sistema di coordinate geografico, al fine di utilizzare le distanze cordali nell'analisi.
Impostazioni cluster
Il gruppo Impostazioni cluster include i seguenti parametri:
- Metodo di clustering specifica il metodo che sarà usato per identificare i cluster.
- Distanza definita (DBSCAN)—Identifica i cluster ricercando entro una distanza di ricerca specifica. Questo metodo è appropriato quando tutti i cluster significativi presentino densità simili.
- Regolazione automatica (HDBSCAN)—Usa un range di distanze per separare i cluster di diverse densità da disturbo più scarso. Questo metodo è il più basato sui dati dei metodi di clustering, quindi non necessita di una distanza di ricerca.
- Multiscala (OPTICS)—Identifica cluster usando la distanza tra vicini e un grafico di raggiungibilità. Il metodo determina innanzitutto la distanza minima di raggiungibilità per tutti i punti. La distanza minima di raggiungibilità è la distanza da un punto al suo vicino più vicino che non è stato ancora visitato dalla ricerca. Una volta determinata la distanza minima di raggiungibilità per tutti i punti, lo strumento costruisce un grafico di raggiungibilità. Il grafico di raggiungibilità traccia l'ordine di raggiungibilità di ciascun punto e la relativa distanza di raggiungibilità rivelando la struttura di raggruppamento dei punti. Questo metodo quindi usa il valore Sensibilità cluster per identificare i cluster. Simile al metodo HDBSCAN, il metodo OPTICS può identificare cluster con densità variabili.
- Punti minimi per cluster è il numero minimo di punti utilizzato per considerare un raggruppamento di punti un cluster. In generale, minore è il valore, maggiore sarà il numero di cluster rilevati. Questo valore deve essere minore o uguale al numero di punti nel layer. Il valore minimo supportato è 2.
- Distanza di ricerca specifica la distanza massima intorno a ogni punto da considerare. Se il valore Metodo di clustering è Distanza definita (DBSCAN), il valore Distanza di ricerca è la distanza massima intorno a ogni feature di punto nel cluster per ricercare i punti che possono essere inclusi nel cluster. Se è possibile trovare il numero minimo di punti entro la distanza di ricerca di un determinato punto, quel punto è considerato un punto cardine. Se non è possibile trovare il numero minimo di punti entro la distanza di ricerca di un determinato punto, ma quel punto rientra nella distanza di ricerca di un punto cardine, il punto è considerato un punto di confine. I cluster saranno composti sia da punti cardine sia da punti di confine. Se il valore Metodo di clustering è Multiscala (OPTICS), il valore Distanza di ricerca è la distanza massima intorno a ogni punto per ricercare i punti che possono essere assegnati a una distanza di raggiungibilità. La distanza di raggiungibilità è la distanza da un punto al suo vicino più vicino che non è stato ancora visitato dalla ricerca. Ai punti all'interno della distanza centrale di un punto viene assegnata la distanza centrale come distanza di raggiungibilità. La distanza centrale di un punto è una misura della distanza necessaria per viaggiare da ciascun punto al numero minimo definito di caratteristiche.
- Unità distanza di ricerca è l'unità per il valore Distanza di ricerca.
- Il Campo tempo è il campo del layer di input che contiene un timestamp per ogni feature. Questo parametro è disponibile se il valode di Metodo di clustering è Distanza definita (DBSCAN) o Multiscala (ottica). Se è specificato un valore per Campo tempo, è necessario inoltre fornire un valore per Distanza di ricerca e Unità di distanza di ricerca.
- Intervallo tempo di ricerca è l'intervallo di tempo che verrà utilizzato per determinare le feature di un cluster spaziotemporale. L'intervallo del tempo di ricerca si estende prima e dopo il tempo di ogni feature; ad esempio, un intervallo di tempo di ricerca di 3 giorni attorno a una feature includerà tutte le feature partendo da 3 giorni prima e terminando a 3 giorni dopo il tempo della feature.
- Unità tempo di ricerca sono le unità per l'Intervallo tempo di ricerca.
- Sensibilità cluster è il modo in cui la forma (sia pendenza che altezza) dei picchi all'interno del grafico di raggiungibilità verrà utilizzata per separare i cluster. Il grafico di raggiungibilità traccia l'ordine di raggiungibilità dei punti e la loro distanza di raggiungibilità. Un valore di Sensibilità cluster molto alto (vicino a 100) tratterà anche i picchi più piccoli nel grafico di raggiungibilità come una separazione tra cluster. Un valore di Sensibilità cluster molto basso (vicino a 100) tratterà solo i picchi più ripidi e più alti nel grafico di raggiungibilità come una separazione tra i cluster. Se lasciato vuoto, lo strumento troverà un valore di sensibilità utilizzando la divergenza Kullback-Leibler.
Layer risultato
Il gruppo Layer risultato include i seguenti parametri:
- Il parametro Nome output determina il nome del layer creato e aggiunto alla mappa. Il nome deve essere unico. Se un layer con lo stesso nome esiste già nell'organizzazione, lo strumento non funzionerà e verrà chiesto di utilizzare un nome diverso.
- Salva nella cartella specifica il nome di una cartella in I miei contenuti in cui verrà salvato il risultato.
Ambienti
Le impostazioni degli ambienti di analisi sono parametri aggiuntivi che influiscono sui risultati dello strumento. È possibile accedere alle impostazioni dello strumento dal gruppo di parametri Impostazioni ambiente.
Questo strumento rispetta i seguenti ambienti di analisi:
- Sistema di coordinate di output
- Estensione di elaborazione
Nota:
L'estensione di elaborazione predefinita in Map Viewer è Estensione completa. Questa impostazione predefinita è diversa da Map Viewer Classic in cui Utilizza estensione mappa corrente è abilitato per impostazione predefinita.
Output
Lo strumento genera un layer punto. Se il valore del parametro Metodo di clustering è Autoregolazione (HDBSCAN) o Multiscala (OPTICS), lo strumento produrrà anche un grafico. Il layer di output di tutte le opzioni Metodo di clustering includerà i campi Cluster ID, Source ID e Color ID. Il campo Cluster ID identifica il cluster a cui appartiene ogni punto. I punti di disturbo avranno un valore di -1. Il valore di campo Source ID è un identificatore unico. Il valore di campo Color ID rappresenta il colore assegnato a un punto e il suo cluster. Se il layer di output include più di nove cluster, verranno assegnati più cluster a ciascun colore. Tuttavia, ai cluster vicini verranno assegnati colori diversi per tenerli visivamente distinti. Se il valore parametro Metodo di clustering è Regolazione automatica (HDBSCAN), il layer del punto di output conterrà i seguenti campi aggiuntivi:
- Probability è un valore tra 0 e 1 che indica la probabilità che un punto appartenga al cluster assegnato. I punti di disturbo avranno un valore pari a 0.
- Outlier è un valore tra 0 e 1 che indica se un punto può essere un outlier all'interno del proprio cluster. I punti di disturbo saranno considerati un unico cluster. Un valore elevato indica che è più probabile che il punto sia un outlier.
- Exemplar è un valore tra 0 e 1 che indica se un punto è più rappresentativo del relativo cluster.
- Stability è un valore che riflette la persistenza di ciascun cluster in un intervallo di scale. Un valore maggiore indica che il cluster persiste in un intervallo più ampio di scale di distanza.
Se il valore parametro Metodo di clustering è Multiscala (OPTICS), il layer di output includerà i seguenti campi aggiuntivi:
- Reachability order è il modo in cui le feature di input sono state ordinate per l'analisi
- Reachability distance è la distanza tra ogni punto e il suo vicino non visitato più prossimo.
Se il valore del parametro Metodo di clustering è Autoregolazione (HDBSCAN) o Multiscala (OPTICS), lo strumento produrrà un grafico. Multiscala (OPTICS) produce un diagramma di raggiungibilità che può essere utilizzato per valutare la densità di ciascun cluster. Autoregolazione (HDBSCAN) produce un grafico di distribuzione della probabilità di appartenenza, che mostra la distribuzione della probabilità che una feature appartenga al cluster assegnato. Per visualizzare il grafico, cliccare su Grafici sulla barra degli strumenti Contenuti.
Se è specificato un valore per Campo tempo, l'output includerà un grafico Intervallo temporale per cluster che mostra l'intervallo temporale per ciascun cluster spaziotemporale. Per visualizzare il grafico, cliccare su Grafici sulla barra degli strumenti Contenuti. Il layer di output includerà anche i seguenti campi che riepilogano l'intervallo del cluster a cui appartiene ciascun punto:
- Tempo di inizio è il tempo iniziale del cluster a cui appartiene la feature.
- Tempo di fine è il tempo finale a cui appartiene la feature.
- Tempo medio è il tempo medio del cluster a cui appartiene la feature.
- Esagerazione tempo
È possibile visualizzare ulteriori dettagli sull'analisi nella pagina dell'elemento del livello di output. Per accedere alla pagina dell'elemento del layer, fai clic su Analisi sulla barra degli strumenti Impostazioni. Fai clic su Cronologia e trova e fai clic sull'esecuzione con successo dello strumento. I dettagli dell'analisi si aprono nella scheda Risultati. Fare clic sul pulsante opzioni accanto al layer di output e fare clic su Visualizza dettagli.
Requisiti per la licenza
Questo strumento richiede le seguenti configurazioni e licenze:
- Tipo di utente Creator o GIS Professional
- Ruolo Publisher o Amministratore, o un ruolo personalizzato equivalente
Risorse
Usare le seguenti risorse per saperne di più:
- Clustering in base alla densità in ArcGIS Pro
- Trova cluster punti in ArcGIS REST API
- trova_cluster_punto in ArcGIS API for Python