Skip To Content

Trova cluster punti

Nota:

Questa funzionalità è attualmente supportata solo inMap Viewer Classic (precedentemente noto come Map Viewer).

Icona dello strumento Trova cluster di punti Lo strumento Trova cluster di punti trova cluster di caratteristiche puntuali nel rumore circostante in base alla loro distribuzione spaziale o spazio-temporale.

Diagramma del Workflow

Trova cluster punti

Analisi tramite GeoAnalytics Tools

L'analisi che usa GeoAnalytics Tools è in esecuzione usando l'elaborazione distribuita tramite più computer ArcGIS GeoAnalytics Server e punteggi. GeoAnalytics Tools e strumenti di analisi feature standard in ArcGIS Enterprise hanno diversi parametri e funzionalità. Per ulteriori informazioni sulle differenze, consultare Differenze tra gli strumenti di analisi delle feature.

Esempio

Un'organizzazione non governativa sta studiando una determinata malattia causata da parassiti e presenta un dataset puntuale che rappresenta unità abilitative in un'area di studio, alcune delle quali sono infestate e altre no. Usando lo strumento Trova cluster punti, un analista può stabilire i cluster di unità abitative infestate per facilitare l'individuazione di un'area a partire dalla quale avviare il trattamento e la disinfestazione dei parassiti.

Note sull'utilizzo

L'input per Trova cluster punti è un unico layer puntuale.

Il parametro Scegli metodo di clustering da utilizzare determina se verrà utilizzata una distanza definita o un algoritmo di clustering con regolazione automatica. La distanza definita (DBSCAN) trova cluster di punti nelle vicinanze in base a un intervallo di ricerca specificato. La regolazione automatica (HDBSCAN) trova cluster di punti similmente a DBSCAN, ma utilizza intervalli di ricerca variabili per cluster di varie densità in base alla probabilità (o stabilità) del cluster.

Se si sceglie DBSCAN, i cluster possono trovarsi solo nello spazio bidimensionale o sia nello spazio sia nel tempo. Se si seleziona Utilizza l'ora per trovare cluster e il layer di input ha l'ora abilitata ed è di tipo istante, DBSCAN scoprirà i cluster di punti spaziotemporali che si trovano molto vicini in base a una distanza di ricerca e a una durata di ricerca specifiche.

HDBSCAN attualmente supporta solo il clustering spaziale e non utilizzerà il tempo per scoprire cluster.

Tutti i risultati includeranno un campo chiamato CLUSTER_ID che indica a quale cluster appartiene ogni caratteristica, e un campo chiamato COLOR_ID che è un'etichetta usata per disegnare i risultati in modo che ogni cluster sia visivamente distinto dai suoi cluster vicini nella maggior parte dei casi. Per entrambi i campi, un valore di -1 indica che una feature è stata etichettata come disturbo.

Se si utilizza il metodo di clustering Distanza definita (DBSCAN) per scoprire i cluster spaziotemporali, i risultati includeranno anche i seguenti campi:

  • FEAT_TIME-Il tempo istantaneo originale di ogni caratteristica.
  • START_DATETIME-L'ora di inizio dell'estensione temporale del cluster a cui appartiene una caratteristica.
  • END_DATETIME-L'ora finale dell'estensione temporale del cluster a cui appartiene una caratteristica.

Il tempo del layer del risultato sarà impostato come un intervallo sui campi START_DATETIME e END_DATETIME, assicurando che nella maggior parte dei casi tutti i membri del cluster siano disegnati insieme quando si visualizzano i cluster spazio-temporali con un cursore temporale. Per le caratteristiche di rumore, START_DATETIME e END_DATETIME sarà uguale a FEAT_TIME.

Se si utilizza il metodo di clustering Regolazione automatica (HDBSCAN), i risultati includeranno anche i seguenti campi:

  • PROB-La probabilità che una caratteristica appartenga al suo cluster assegnato.
  • OUTLIER-La probabilità che una caratteristica sia un outlier all'interno del suo stesso cluster. Un valore più grande indica che la feature è più probabilmente un outlier.
  • EXEMPLAR-Indica quali caratteristiche sono più rappresentative di ogni cluster. Queste feature sono indicate da un valore di 1.
  • STABILITY-La persistenza di ogni cluster su una gamma di scale. Un punteggio più alto indica che un cluster persiste su un intervallo più ampio di scale di distanza.

Il parametro Numero minimo di punti da considerare cluster viene utilizzato diversamente a seconda del metodo di clustering scelto:

  • Densità definita (DBSCAN): specifica il numero di feature da trovare entro un certo intervallo di distanza di un punto perché quel punto inizi a formare un cluster. I risultati possono includere cluster con feature inferiori rispetto a questo valore. La distanza di intervallo di ricerca è definita usando il parametro Limita l'intervallo di ricerca a. Quando si utilizza il tempo per trovare cluster, è necessaria una durata di ricerca aggiuntiva e viene impostata utilizzando il parametro Limita la durata di ricerca a. Quando si ricercano membri del cluster, il numero minimo di feature specificato deve trovarsi nell'intervallo di ricerca e nella durata di ricerca specificati per formare un cluster. Nota: la distanza e la durata non sono collegate all'estensione temporale o al diametro dei cluster di punti scoperti.
  • Regolazione automatica (HDBSCAN): specifica il numero di feature da considerare intorno a ciascun punto (incluso il punto stesso) per la stima della densità. Questo numero rappresenta anche la dimensione cluster minima consentita quando si estraggono i cluster.

Quando si utilizza l’algoritmo HDBSCAN con un layer di input contenente più di 3 milioni di feature, lo strumento potrebbe non funzionare a meno che l’amministratore non aumenti il valore del parametro javaHeapSize sul Servizio GP GeoAnalyticsTools. Per 3 milioni di feature sono necessari circa 2 GB di spazio. La quantità di RAM specificata da javaHeapSize deve essere disponibile su ogni dispositivo GeoAnalytics Server oltre ai 16 GB solitamente richiesti da GeoAnalytics Server. Ad esempio, se si desidera creare un cluster di 9 milioni di feature con HDBSCAN, si dovrebbe impostare javaHeapSize a non meno di 6.144 MB o 6 GB. In questo caso, ogni dispositivo GeoAnalytics Server dovrebbe avere un totale di almeno 22 GB di RAM disponibile.

Per ulteriori informazioni, consultare la documentazione ArcGIS Pro su Come funziona il Clustering in base alla densità

Esempio ArcGIS API for Python

Lo strumento Trova cluster punti è disponibile tramite ArcGIS API for Python.

Questo esempio trova cluster di posizioni di punti vendita.


# Import the required ArcGIS API for Python modules
import arcgis
from arcgis.gis import GIS
from arcgis.geoanalytics import analyze_patterns

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password")
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_RetailLocation")

# Look through the big data file share for points of sale
pos = next(x for x in bdfs_search.layers if x.properties.name == "POS")

# Set the tool environment settings
arcgis.env.verbose = True

# Run the Find Point Clusters tool 
output = analyze_patterns.find_point_clusters(pos, 10, "Kilometers", "POS_Clusters")

# Visualize the tool results if you are running Python in a Jupyter Notebook
processed_map = portal.map('USA')
processed_map.add_layer(output)
processed_map

Strumenti simili

Usare Trova cluster punti per trovare cluster di feature puntuali nel disturbo circostante in base alla loro distribuzione spaziale. Altri strumenti che possono essere utili sono i seguenti:

Strumenti di analisi di Map Viewer Classic

Per capire se ci sono cluster statisticamente rilevanti nel modello spaziale dei dati, utilizzare lo strumento Trova hot spot.

Per creare una mappa di densità delle feature puntuali o lineari, utilizzare lo strumento Calcolo densità.

Per capire se ci sono outlier statisticamente rilevanti nel modello spaziale dei dati, utilizzare lo strumento Trova outlier.

Strumenti di analisi di ArcGIS Pro

Lo strumento di geoprocessing Clustering in base alla densità esegue la stessa funzione di Trova cluster punti.

Lo strumento Trova cluster di punti è disponibile in ArcGIS Pro.