Narzędzie Opisz zestaw danych udostępnia przegląd dużych zbiorów danych. Domyślnie narzędzie to jako wynik udostępnia warstwę tabelaryczną zawierającą podsumowania wartości pól i przegląd ustawień geometrii i czasu dla warstwy wejściowej. Opcjonalnie narzędzie to jako wynik może udostępnić warstwę obiektową reprezentującą przykładowe obiekty wejściowe lub pojedynczą poligonową warstwę obiektową, która reprezentuje zasięg obiektów wejściowych. Istnieje możliwość wybrania jednej z nich lub obu, ale można też nie wybierać żadnej z nich.
Diagram procedury wykonywania zadań
Analiza z użyciem narzędzi GeoAnalytics Tools
Analiza z użyciem narzędzi GeoAnalytics Tools jest uruchamiana przy zastosowaniu przetwarzania rozproszonego na wielu komputerach i rdzeniach ArcGIS GeoAnalytics Server. Narzędzia GeoAnalytics Tools oraz narzędzia do standardowej analizy obiektowej w oprogramowaniu ArcGIS Enterprise mają różne parametry i możliwości. Więcej informacji o tych różnicach można znaleźć w sekcji Różnice między narzędziami analizy obiektowej.
Przykłady
- Sprawdź, czy poprawnie zarejestrowano czas i geometrię, używając udostępnionego pliku dużych zbiorów danych.
- Poznaj wartości atrybutów, korzystając ze statystyki sumarycznej pól.
- Wizualizuj duże zbiory danych, korzystając z przykładowej warstwy. Zamiast wyświetlać milion obiektów wyświetl obiekty przykładowe.
- Uruchom procedury wykonywania zadań z użyciem danych przykładowych przed skalowaniem do dłuższego i większego przetwarzania.
- Określ, gdzie znajduje się zestaw danych, obliczając zasięg geograficzny.
Uwagi dotyczące korzystania
Przejdź do tabelarycznej, punktowej, liniowej lub powierzchniowej warstwy obiektowej albo udostępnionego pliku dużych zbiorów danych, który chcesz opisać, używając opcji Wybierz zestaw danych do opisania.
Uzyskaj podzbiór danych, klikając przycisk Przykładowa warstwa i podając liczbę obiektów za pomocą wyświetlonego narzędzia wyboru wartości. Podzbiór wynikowy będzie zawsze miał takie same ustawienia schematu, geometrii i czasu jak obiekty wejściowe. Użyj tego podzbioru, aby zobaczyć, w jaki sposób duże zbiory danych są wyświetlane po dodaniu do mapy lub wizualizowane w tabeli atrybutów. Ponadto możesz uruchomić analizę na przykładowym zestawie danych, aby określić najlepsze dane wejściowe dla większej analizy na całym zestawie danych.
Uzyskaj obiekt granic, który opisuje zasięg wejściowego zestawu danych, wybierając opcję Warstwa zasięgu. Wynikiem zawsze będzie pojedynczy obiekt prostokątny reprezentujący geograficzny zasięg obiektów wejściowych. Użyj warstwy zasięgu, aby zrozumieć, gdzie dane są zlokalizowane, albo użyj jej jako danych wejściowych w dowolnym miejscu w procedurze wykonywania zadań. Na przykład użyj jej jako warstwy powierzchniowej, do której zostaną przycięte obiekty, używając narzędzia GeoAnalytics Przytnij warstwę.
Jeśli zaznaczono opcję Użyj bieżącego zasięgu mapy, analizowane będą tylko obiekty znajdujące się w bieżącym zasięgu mapy. Jeśli opcja ta nie została zaznaczona, przeanalizowane zostaną wszystkie obiekty wejściowe w warstwie wejściowej, nawet jeśli znajdują się one poza bieżącym zasięgiem mapy. Jeśli na przykład zostanie wybrana opcja skierowania danych wynikowych do przykładowej warstwy i opcja Użyj bieżącego zasięgu mapy nie jest zaznaczona, na potrzeby wyników przykładowych zostanie użyty cały zestaw danych. Jeśli zostanie wybrana opcja skierowania danych wynikowych do warstwy zasięgu przy zaznaczonej opcji Użyj bieżącego zasięgu mapy, zasięg mapy będzie reprezentowany przez granicę danych wynikowych.
Domyślnie narzędzie skieruje dane wynikowe do tabeli zawierającej statystykę sumaryczną dla każdego pola i kod JSON opisujący właściwości warstwy wejściowej. Aby uzyskać dostęp do ciągu znakowego JSON, kliknij przycisk Pokaż wynik , który jest wyświetlany po umieszczeniu wskaźnika myszy nad warstwą tabelaryczną statystyki sumarycznej w tabeli zawartości.
Ciąg znakowy JSON zawiera następujące informacje:
- datasetName — nazwa opisywanego zestawu danych.
- datasetSource — lokalizacja przechowywania wejściowego zestawu danych. Tą wartością może być ArcGIS Data Store — Relational, ArcGIS Data Store — Spatiotemporal lub Big Data File Share - <your_bdfs_name>.
- recordCount — łączna liczba rekordów w wejściowym zestawie danych.
- geometry — ustawienia geometrii warstwy wejściowej.
- geometryType — typ geometrii reprezentowanej przez obiekty wejściowe. Tą wartością może być Point, Line, Polygon lub Table.
- sref — odniesienie przestrzenne używane przez obiekty wejściowe. Na przykład tą wartością może być {"wkid": 26972}, gdzie 26972 to identyfikator odniesienia przestrzennego.
- countNonEmpty — liczba obiektów z poprawną geometrią.
- countEmpty — liczba obiektów bez poprawnej geometrii.
- spatialExtent — zasięg geograficzny obiektów reprezentowany przez minimalne i maksymalne wartości współrzędnych.
- time — ustawienia czasu warstwy wejściowej.
- timeType — typ czasu reprezentowany przez obiekty wejściowe. Tą wartością może być Instant, Interval lub None.
- countNonEmpty — liczba obiektów z poprawnym czasem.
- countEmpty — liczba obiektów bez poprawnego czasu.
- temporalExtent — zasięg czasowy obiektów reprezentowany przez minimalne i maksymalne wartości czasu.
Ograniczenia
Przykładowa warstwa nie reprezentuje prawdziwie losowego wyboru elementów geograficznych i nie należy jej używać do sprawdzenia geograficznego zasięgu lub dystrybucji danych. Jeśli na przykład zostanie podana wartość wynosząca 230 obiektów dla opcji Liczba obiektów do uwzględnienia, wynik może zawierać 230 obiektów wejściowych w dowolnej kolejności lub o dowolnej lokalizacji.
Sposób działania narzędzia Opisz zestaw danych
Obliczenia
Statystyka sumaryczna jest obliczana dla każdego pola w warstwie wejściowej. Pola będą miały różne dane wynikowe statystyki w zależności od typu pola. Poniższy przykład dotyczący głębokości gleby pokazuje sposób obliczania statystyki dla każdego typu pola:
Statystyka liczbowa | Obliczony wynik |
---|---|
Liczba | Liczba elementów:
|
Suma |
|
Minimum | Minimum z wartości:
|
Maksimum | Maksimum z wartości:
|
Średnia |
|
Zakres |
|
Wariancja |
|
Odchylenie standardowe |
|
Statystyka dat | Obliczony wynik |
---|---|
Liczba | Liczba elementów:
|
Minimum | Minimum z wartości:
|
Maksimum | Maksimum z wartości:
|
Zakres |
|
Notatka:
Wyniki zapisane w aplikacji ArcGIS Data Store są zawsze przechowywane w uniwersalnym czasie koordynowanym (UTC) i wyrażone w milisekundach, które upłynęły od początku epoki. Na przykład czas UTC o wartości 1538713350000 milisekund odpowiada godzinie 16:22:30 w piątek, 5 października 2018 roku w strefie czasowej GMT.
Statystyka znakowa | Obliczony wynik |
---|---|
Liczba | ["high", "high", "high", "low", null] = 4 |
Dowolne | = "low" |
Notatka:
Statystyka liczbowa (w przypadku pól znakowych i numerycznych) zlicza wartości niepuste. Liczba elementów [0, 1, 10, 5, null, 6] = 5. Liczba elementów [Primary, Primary, Secondary, null] = 3.
Przykład użycia interfejsu ArcGIS API for Python
Narzędzie Opisz zestaw danych jest dostępne za pośrednictwem interfejsu ArcGIS API for Python.
Ten przykład ilustruje opisywanie zestawu danych dotyczących śledzenia huraganów w udostępnionym pliku dużych zbiorów danych oraz generowanie podzbioru 200 obiektów huraganów i warstwy zasięgu.
# Import the required ArcGIS API for Python modules
import arcgis
from arcgis import geoanalytics as ga
from arcgis.gis import GIS
# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
print("Quitting, GeoAnalytics is not supported")
exit(1)
# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")
# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_NaturalDisasters")
# Look through the big data file share for Hurricanes
hurricanes = next(x for x in bdfs_search.layers if x.properties.name == "Hurricanes")
# Run the Describe Dataset tool
result = ga.summarize_data.describe_dataset(input_layer=hurricanes, sample_size=200,
extent_output=true, output_name="Hurricanes_describe")
# Visualize the sample and extent layers if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(result)
processed_map
Podobne narzędzia
Użyj narzędzia Opisz zestaw danych, gdy chcesz eksplorować dane z użyciem danych przykładowych, statystyk i sumowania. Do rozwiązywania podobnych, ale nieco innych problemów, mogą być przydatne inne narzędzia.
Narzędzia analizy Map Viewer
Agreguj zestaw danych w kosze lub obszary i uzyskaj wynikową statystykę sumaryczną, korzystając z narzędzia Agreguj punkty serwera ArcGIS GeoAnalytics Server.
Utwórz podzbiór danych w określonym obszarze, używając narzędzia Przytnij warstwę serwera ArcGIS GeoAnalytics Server.
Narzędzia analizy ArcGIS Desktop
Aby możliwe było uruchomienie tego narzędzia z poziomu aplikacji ArcGIS Pro, aktywny portal musi być w wersji Enterprise 10.7 lub nowszej. Należy zalogować się do portalu przy użyciu konta z uprawnieniami do wykonywania analizy obiektowej w ramach analizy geoprzestrzennej.