Narzędzie Znajdź klastry punktów identyfikuje klastry obiektów punktowych wśród otaczającego szumu na podstawie ich rozkładu przestrzennego.
Przykłady
Przykłady użycia tego narzędzia:
- Instytucja badająca określoną chorobę przenoszoną przez szkodniki, chce ustalić, gdzie na obszarze badań rozpocząć leczenie i eksterminację tych szkodników. Analityk dysponuje zestawem danych punktowych reprezentującym zainfekowane i niezainfekowane gospodarstwa domowe na badanym obszarze. Za pomocą narzędzia Znajdź klastry punktów analityk znajduje największy klaster zainfekowanych gospodarstw domowych.
- Instytucja ds. reagowania na katastrofy musi ustalić, gdzie rozmieścić zasoby na potrzeby działań ratunkowych i ewakuacyjnych po klęsce żywiołowej. Za pomocą narzędzia Znajdź klastry punktów analityk identyfikuje klastry zlokalizowanych geograficznie tweetów, w których wspomniano o tym zdarzeniu. Instytucja wykorzystuje rozmiar i lokalizację klastrów do mapowania dotkniętego zdarzeniem obszaru i informowania o swoich działaniach humanitarnych.
Uwagi dotyczące korzystania
Narzędzie Znajdź klastry punktów obejmuje konfiguracje obiektów wejściowych, ustawień klastrów i warstwy wynikowej.
Obiekty wejściowe
Grupa Obiekty wejściowe zawiera parametr Warstwa wejściowa, czyli wskazuje warstwę z obiektami punktowymi, które zostaną pogrupowane w klastry na podstawie ich rozkładu przestrzennego.
Liczba obiektów jest wyświetlana poniżej nazwy warstwy. Liczba ta obejmuje wszystkie obiekty w warstwie z wyjątkiem tych, które zostały usunięte za pomocą filtra. Ustawienia środowiskowe, takie jak Zasięg przetwarzania, nie są odzwierciedlane w liczbie obiektów.
Notatka:
Web Mercator nie jest odpowiednim odwzorowaniem na potrzeby analizy przestrzennej. Jeśli układem odniesień przestrzennych warstwy wejściowej jest WGS 1984 Web Mercator (Auxiliary Sphere), dane zostaną przekonwertowane do układu współrzędnych geograficznych w celu wykorzystania odległości po cięciwie w analizie.
Ustawienia klastra
Grupa Ustawienia klastra zawiera następujące parametry:
- Metoda klastrowania określa metodę, która będzie używana do identyfikowania klastrów.
- Zdefiniowana odległość (DBSCAN) — identyfikuje klastry przez wyszukiwanie w określonej odległości wyszukiwania. Ta metoda jest odpowiednia, gdy wszystkie znaczące klastry mają podobne zagęszczenie.
- Automatyczne dostosowanie (HDBSCAN) — wykorzystuje zakres odległości do rozdzielenia klastrów o różnym zagęszczeniu od rzadszego szumu. Ta metoda jest w największym stopniu oparta na danych spośród metod klastrowania, więc nie wymaga odległości wyszukiwania.
- Wieloskalowe (OPTICS) — identyfikuje klastry przy użyciu odległości między sąsiadami i diagramu dostępności. Metoda ta najpierw określa minimalną odległość dostępności dla wszystkich punktów. Minimalna odległość dostępności to odległość od punktu do jego najbliższego sąsiada, który nie został jeszcze odwiedzony w trakcie wyszukiwania. Po określeniu minimalnej odległości dostępności dla wszystkich punktów narzędzie konstruuje diagram dostępności. Diagram dostępności przedstawia kolejność dostępności każdego punktu i jego odległość dostępności, ujawniając strukturę klastrowania punktów. Metoda ta wykorzystuje następnie wartość Czułość klastra do identyfikowania klastrów. Podobnie jak metoda HDBSCAN, metoda OPTICS może identyfikować klastry o różnym zagęszczeniu.
- Minimalna liczba punktów na klaster wskazuje minimalną liczbę punktów pozwalającą uznać zgrupowanie punktów za klaster. Ogólnie rzecz biorąc, im mniejsza wartość, tym więcej klastrów zostanie wykrytych. Ta wartość musi być mniejsza niż liczba punktów w warstwie albo jej równa. Minimalna obsługiwana wartość to 2.
- Odległość wyszukiwania wskazuje maksymalną odległość wokół każdego obiektu, która będzie uwzględniana. Jeśli wartością parametru Metoda klastrowania jest Zdefiniowana odległość (DBSCAN), wartość Odległość wyszukiwania to maksymalna odległość wokół każdego obiektu punktowego w klastrze do wyszukiwania punktów, które mogą zostać włączone do klastra. Jeśli minimalną liczbę punktów można znaleźć w odległości wyszukiwania określonego punktu, punkt ten jest uważany za punkt główny. Jeśli minimalnej liczby punktów nie można znaleźć w odległości wyszukiwania określonego punktu, ale punkt ten mieści się w odległości wyszukiwania punktu głównego, punkt ten jest uważany za punkt graniczny. Klastry składają się zarówno z punktów głównych, jak i z punktów granicznych. Jeśli wartością parametru Metoda klastrowania jest Wieloskalowe (OPTICS), Odległość wyszukiwania to maksymalna odległość wokół każdego punktu do wyszukiwania punktów, którym przypisywana jest odległość dostępności. Odległość dostępności to odległość od punktu do jego najbliższego sąsiada, który nie został jeszcze odwiedzony w trakcie wyszukiwania. Punktom znajdującym się w odległości podstawowej od punktu przypisywana jest odległość podstawowa jako ich odległość dostępności. Odległość podstawowa punktu jest miarą odległości, która jest wymagana do przebycia od każdego punktu do określonej minimalnej liczby obiektów.
- Jednostka odległości wyszukiwania wskazuje jednostki wartości parametru Odległość wyszukiwania.
- Pole czasu to pole z warstwy wejściowej, które zawiera znacznik czasu dla każdego obiektu. Ten parametr jest dostępny, jeśli wartością ustawienia Metoda klastrowania jest Zdefiniowana odległość (DBSCAN) lub Wieloskalowe (OPTICS). Jeśli wartość Pole czasu jest określona, trzeba podać również wartości Odległość wyszukiwania i Jednostka odległości wyszukiwania.
- Interwał czasu wyszukiwania to przedział czasu, który będzie używany do określenia, czy obiekty tworzą klaster czasoprzestrzenny. Interwał czasu wyszukiwania obejmuje czas przed i po dla każdego obiektu, na przykład interwał czasu wyszukiwania o długości 3 dni wokół obiektu będzie uwzględniać wszystkie obiekty, począwszy od 3 dni przed czasem obiektu, a kończąc 3 dni po czasie obiektu.
- Jednostka czasu wyszukiwania to jednostka wartości Interwał czasu wyszukiwania.
- Czułość klastra to sposób, w jaki kształt (zarówno spadek, jak i wysokość) szczytów na diagramie dostępności zostanie wykorzystany do oddzielenia klastrów. Diagram dostępności przedstawia kolejność dostępności punktów i ich odległości dostępności. Bardzo wysoka wartość parametru Czułość klastra (bliska 100) spowoduje, że nawet najmniejsze szczyty na diagramie dostępności będą traktowane jako separacja między klastrami. Bardzo niska wartość parametru Czułość klastra (bliska 0) spowoduje, że tylko najbardziej strome, najwyższe szczyty na diagramie dostępności będą traktowane jako separacja między klastrami. Jeśli wartość tego parametru pozostanie pusta, narzędzie znajdzie wartość czułości przy użyciu dywergencji Kullbacka-Leiblera.
Warstwa wynikowa
Grupa Warstwa wynikowa zawiera następujące parametry:
- Nazwa danych wynikowych określa nazwę warstwy, która zostanie utworzona i dodana do mapy. Nazwa musi być unikalna. Jeśli w instytucji istnieje już warstwa o tej samej nazwie, działanie narzędzia zakończy się niepowodzeniem i wyświetlona zostanie prośba o wybór innej nazwy.
- Opcja Zapisz w folderze określa nazwę folderu na stronie Moje zasoby, w którym zostaną zapisane dane wynikowe.
Środowiska
Ustawienia środowiskowe dotyczące analiz to dodatkowe parametry wpływające na wyniki działania narzędzia. Dostęp do ustawień środowiskowych narzędzia dotyczących analiz można uzyskać z poziomu grupy parametrów Ustawienia środowiskowe.
Narzędzie to obsługuje następujące środowiska analiz:
- Wynikowy układ współrzędnych
- Zasięg przetwarzania
Notatka:
Domyślny zasięg przetwarzania w przeglądarce map Map Viewer to Pełny zasięg. To ustawienie domyślne jest inne niż w przeglądarce map Map Viewer Classic, w której domyślnie włączona jest opcja Użyj zasięgu bieżącej mapy.
Dane wynikowe
Narzędzie generuje warstwę punktową. Jeśli wartość parametru Metoda klastrowania to Automatyczne dostosowanie (HDBSCAN) lub Wieloskalowe (OPTICS), narzędzie wygeneruje też diagram. Warstwa wynikowa wszystkich opcji parametru Metoda klastrowania będzie zawierać pola Cluster ID, Source ID i Color ID. Pole Cluster ID identyfikuje klaster, do którego należy każdy punkt. Punkty szumu będą miały wartość -1. Wartość pola Source ID jest unikalnym identyfikatorem. Wartość pola Color ID reprezentuje kolor przypisany do punktu i jego klastra. Jeśli warstwa wynikowa zawiera więcej niż dziewięć klastrów, do każdego koloru zostanie przypisanych wiele klastrów. Jednak sąsiednim klastrom zostaną przypisane różne kolory, aby zachować ich odrębność wizualną. Jeśli wartość parametru Metoda klastrowania to Automatyczne dostosowanie (HDBSCAN), wynikowa warstwa punktowa będzie zawierać następujące pola dodatkowe:
- Probability — wartość z zakresu od 0 do 1, która oznacza prawdopodobieństwo, że punkt należy do przypisanego mu klastra. Punkty szumu będą miały wartość 0.
- Outlier — wartość z zakresu od 0 do 1, która wskazuje, czy punkt może być elementem odstającym w jego własnym klastrze. Punkty szumu są traktowane jako pojedyncze klaster. Większa wartość wskazuje większe prawdopodobieństwo, że punkt jest elementem odstającym.
- Exemplar — wartość z zakresu od 0 do 1, która wskazuje, czy punkt jest najbardziej reprezentatywny dla jego klastra.
- Stability — wartość odzwierciedlająca trwałość danego klastra w zakresie skal. Większa wartość wskazuje, że klaster jest trwały w szerszym zakresie odległości.
Jeśli wartość parametru Metoda klastrowania to Wieloskalowe (OPTICS), warstwa wynikowa będzie zawierać następujące pola dodatkowe:
- Reachability order — sposób, w jaki obiekty wejściowe zostały uporządkowane na potrzeby analizy
- Reachability distance — odległość między każdym punktem a jego najbliższym nieodwiedzonym sąsiadem.
Jeśli wartość parametru Metoda klastrowania to Automatyczne dostosowanie (HDBSCAN) lub Wieloskalowe (OPTICS), narzędzie wygeneruje diagram. Ustawienie wartości Wieloskalowe (OPTICS) spowoduje wygenerowanie diagramu dostępności, który może być użyty do oceny zagęszczenia każdego klastra. Ustawienie wartości Automatyczne dostosowanie (HDBSCAN) spowoduje wygenerowanie diagramu rozkładu prawdopodobieństwa członkostwa, który wyświetla rozkład prawdopodobieństwa tego, że obiekt należy do przypisanego mu klastra. Aby wyświetlić diagram, kliknij opcję Diagramy na pasku narzędzi Zawartość.
Jeśli wartość Pole czasu jest określona, dane wynikowe będą zawierać diagram Przedział czasu na klaster z wyświetlonymi przedziałami czasu każdego klastra czasoprzestrzennego. Aby wyświetlić diagram, kliknij opcję Diagramy na pasku narzędzi Zawartość. Warstwa wynikowa będzie zawierać również następujące pola z podsumowaniem przedziału czasu klastra, do którego należy każdy punkt:
- Czas początkowy to czas początkowy klastra, do którego należy obiekt.
- Czas końcowy to czas końcowy klastra, do którego należy obiekt.
- Średni czas to średni czas klastra, do którego należy obiekt.
- Wyniesienie czasowe
Dodatkowe szczegóły dotyczące analizy można wyświetlić na stronie elementu warstwy wynikowej. Aby uzyskać dostęp do strony elementu warstwy, kliknij opcję Analiza na pasku narzędzi Ustawienia. Kliknij opcję Historia, a następnie znajdź i kliknij pomyślne uruchomienie narzędzia. Szczegóły analizy zostaną otwarte na karcie Wyniki. Kliknij przycisk opcji obok warstwy wynikowej, a następnie kliknij opcję Wyświetl szczegóły.
Wymagania dotyczące licencjonowania
To narzędzie wymaga następujących licencji i konfiguracji:
- Typ użytkownika Creator lub GIS Professional
- Rola Publikujący lub Administrator albo rola niestandardowa odpowiadająca tym rolom
Zasoby
Aby dowiedzieć się więcej, skorzystaj z następujących zasobów:
- Klastrowanie na podstawie zagęszczenia w ArcGIS Pro
- Znajdź klastry punktów w interfejsie ArcGIS REST API
- find_point_clusters w interfejsie ArcGIS API for Python