Skip To Content

Opisz zestaw danych

Opisz zestaw danychNarzędzie Opisz zestaw danych udostępnia przegląd dużych zbiorów danych. Domyślnie narzędzie to jako wynik udostępnia warstwę tabelaryczną zawierającą podsumowania wartości pól i przegląd ustawień geometrii i czasu dla warstwy wejściowej. Opcjonalnie narzędzie to jako wynik może udostępnić warstwę obiektową reprezentującą przykładowe obiekty wejściowe lub pojedynczą poligonową warstwę obiektową, która reprezentuje zasięg obiektów wejściowych. Istnieje możliwość wybrania jednej z nich lub obu, ale można też nie wybierać żadnej z nich.

Diagram procedury wykonywania zadań

Diagram procedury wykonywania zadań narzędzia Opisz zestaw danych

Analiza z użyciem narzędzi GeoAnalytics Tools

Analiza z użyciem narzędzi GeoAnalytics Tools jest uruchamiana przy zastosowaniu przetwarzania rozproszonego na wielu komputerach i rdzeniach ArcGIS GeoAnalytics Server. Narzędzia GeoAnalytics Tools oraz narzędzia do standardowej analizy obiektowej w oprogramowaniu ArcGIS Enterprise mają różne parametry i możliwości. Więcej informacji o tych różnicach można znaleźć w sekcji Różnice między narzędziami analizy obiektowej.

Przykłady

  • Sprawdź, czy poprawnie zarejestrowano czas i geometrię, używając udostępnionego pliku dużych zbiorów danych.
  • Poznaj wartości atrybutów, korzystając ze statystyki sumarycznej pól.
  • Wizualizuj duże zbiory danych, korzystając z przykładowej warstwy. Zamiast wyświetlać milion obiektów wyświetl obiekty przykładowe.
  • Uruchom procedury wykonywania zadań z użyciem danych przykładowych przed skalowaniem do dłuższego i większego przetwarzania.
  • Określ, gdzie znajduje się zestaw danych, obliczając zasięg geograficzny.

Uwagi dotyczące korzystania

Przejdź do tabelarycznej, punktowej, liniowej lub powierzchniowej warstwy obiektowej albo udostępnionego pliku dużych zbiorów danych, który chcesz opisać, używając opcji Wybierz zestaw danych do opisania.

Uzyskaj podzbiór danych, klikając przycisk Przykładowa warstwa i podając liczbę obiektów za pomocą wyświetlonego narzędzia wyboru wartości. Podzbiór wynikowy będzie zawsze miał takie same ustawienia schematu, geometrii i czasu jak obiekty wejściowe. Użyj tego podzbioru, aby zobaczyć, w jaki sposób duże zbiory danych są wyświetlane po dodaniu do mapy lub wizualizowane w tabeli atrybutów. Ponadto możesz uruchomić analizę na przykładowym zestawie danych, aby określić najlepsze dane wejściowe dla większej analizy na całym zestawie danych.

Uzyskaj obiekt granic, który opisuje zasięg wejściowego zestawu danych, wybierając opcję Warstwa zasięgu. Wynikiem zawsze będzie pojedynczy obiekt prostokątny reprezentujący geograficzny zasięg obiektów wejściowych. Użyj warstwy zasięgu, aby zrozumieć, gdzie dane są zlokalizowane, albo użyj jej jako danych wejściowych w dowolnym miejscu w procedurze wykonywania zadań. Na przykład użyj jej jako warstwy powierzchniowej, do której zostaną przycięte obiekty, używając narzędzia GeoAnalytics Przytnij warstwę.

Jeśli zaznaczono opcję Użyj bieżącego zasięgu mapy, analizowane będą tylko obiekty znajdujące się w bieżącym zasięgu mapy. Jeśli opcja ta nie została zaznaczona, przeanalizowane zostaną wszystkie obiekty wejściowe w warstwie wejściowej, nawet jeśli znajdują się one poza bieżącym zasięgiem mapy. Jeśli na przykład zostanie wybrana opcja skierowania danych wynikowych do przykładowej warstwy i opcja Użyj bieżącego zasięgu mapy nie jest zaznaczona, na potrzeby wyników przykładowych zostanie użyty cały zestaw danych. Jeśli zostanie wybrana opcja skierowania danych wynikowych do warstwy zasięgu przy zaznaczonej opcji Użyj bieżącego zasięgu mapy, zasięg mapy będzie reprezentowany przez granicę danych wynikowych.

Domyślnie narzędzie skieruje dane wynikowe do tabeli zawierającej statystykę sumaryczną dla każdego pola i kod JSON opisujący właściwości warstwy wejściowej. Aby uzyskać dostęp do ciągu znakowego JSON, kliknij przycisk Pokaż wynik Pokaż wynik, który jest wyświetlany po umieszczeniu wskaźnika myszy nad warstwą tabelaryczną statystyki sumarycznej w tabeli zawartości.

Ciąg znakowy JSON zawiera następujące informacje:

  • datasetName — nazwa opisywanego zestawu danych.
  • datasetSource — lokalizacja przechowywania wejściowego zestawu danych. Tą wartością może być ArcGIS Data Store — Relational, ArcGIS Data Store — Spatiotemporal lub Big Data File Share - <your_bdfs_name>.
  • recordCount — łączna liczba rekordów w wejściowym zestawie danych.
  • geometry — ustawienia geometrii warstwy wejściowej.
    • geometryType — typ geometrii reprezentowanej przez obiekty wejściowe. Tą wartością może być Point, Line, Polygon lub Table.
    • sref — odniesienie przestrzenne używane przez obiekty wejściowe. Na przykład tą wartością może być {"wkid": 26972}, gdzie 26972 to identyfikator odniesienia przestrzennego.
    • countNonEmpty — liczba obiektów z poprawną geometrią.
    • countEmpty — liczba obiektów bez poprawnej geometrii.
    • spatialExtent — zasięg geograficzny obiektów reprezentowany przez minimalne i maksymalne wartości współrzędnych.
  • time — ustawienia czasu warstwy wejściowej.
    • timeType — typ czasu reprezentowany przez obiekty wejściowe. Tą wartością może być Instant, Interval lub None.
    • countNonEmpty — liczba obiektów z poprawnym czasem.
    • countEmpty — liczba obiektów bez poprawnego czasu.
    • temporalExtent — zasięg czasowy obiektów reprezentowany przez minimalne i maksymalne wartości czasu.

Dowiedz się więcej o ustawieniach czasu i zestawach danych udostępnionych plików dużych zbiorów danych

Dowiedz się więcej o ustawieniach geometrii i zestawach danych udostępnionych plików dużych zbiorów danych

Ograniczenia

Przykładowa warstwa nie reprezentuje prawdziwie losowego wyboru elementów geograficznych i nie należy jej używać do sprawdzenia geograficznego zasięgu lub dystrybucji danych. Jeśli na przykład zostanie podana wartość wynosząca 230 obiektów dla opcji Liczba obiektów do uwzględnienia, wynik może zawierać 230 obiektów wejściowych w dowolnej kolejności lub o dowolnej lokalizacji.

Sposób działania narzędzia Opisz zestaw danych

Obliczenia

Statystyka sumaryczna jest obliczana dla każdego pola w warstwie wejściowej. Pola będą miały różne dane wynikowe statystyki w zależności od typu pola. Poniższy przykład dotyczący głębokości gleby pokazuje sposób obliczania statystyki dla każdego typu pola:

Przykładowe obiekty, które zostaną zsumowane z użyciem obliczanej statystyki
Te przykładowe obiekty wejściowe zostaną zsumowane i udostępnione jako dane wynikowe w postaci obliczanej statystyki.

Statystyka liczbowaObliczony wynik

Liczba

Liczba elementów:

[130, 8, 250, 0, null] = 4

Suma

130 + 8 + 250 + 0 + null = 388

Minimum

Minimum z wartości:

[130, 8, 250, 0, null] = 0

Maksimum

Maksimum z wartości:

[130, 8, 250, 0, null] = 250

Średnia

388/4 = 97

Zakres

250-0 = 250

Wariancja

= 13942.66667

Odchylenie standardowe

= 118.0791

Statystyka datObliczony wynik

Liczba

Liczba elementów:

[1538738400000, 1507202400000, 1475666400000, 1412508000000, null] = 4

Minimum

Minimum z wartości:

[1538738400000, 1507202400000, 1475666400000, 1412508000000, null] = 1412508000000

Maksimum

Maksimum z wartości:

[1538738400000, 1507202400000, 1475666400000, 1412508000000, null] = 1538738400000

Zakres

1538738400000-1412508000000 = 126230400000
Notatka:

Wyniki zapisane w aplikacji ArcGIS Data Store są zawsze przechowywane w uniwersalnym czasie koordynowanym (UTC) i wyrażone w milisekundach, które upłynęły od początku epoki. Na przykład czas UTC o wartości 1538713350000 milisekund odpowiada godzinie 16:22:30 w piątek, 5 października 2018 roku w strefie czasowej GMT.

Statystyka znakowaObliczony wynik

Liczba

["high", "high", "high", "low", null] = 4

Dowolne

= "low"

Notatka:

Statystyka liczbowa (w przypadku pól znakowych i numerycznych) zlicza wartości niepuste. Liczba elementów [0, 1, 10, 5, null, 6] = 5. Liczba elementów [Primary, Primary, Secondary, null] = 3.

Przykład użycia interfejsu ArcGIS API for Python

Narzędzie Opisz zestaw danych jest dostępne za pośrednictwem interfejsu ArcGIS API for Python.

Ten przykład ilustruje opisywanie zestawu danych dotyczących śledzenia huraganów w udostępnionym pliku dużych zbiorów danych oraz generowanie podzbioru 200 obiektów huraganów i warstwy zasięgu.


# Import the required ArcGIS API for Python modules
import arcgis
from arcgis import geoanalytics as ga
from arcgis.gis import GIS

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_NaturalDisasters")

# Look through the big data file share for Hurricanes
hurricanes = next(x for x in bdfs_search.layers if x.properties.name == "Hurricanes")

# Run the Describe Dataset tool
result = ga.summarize_data.describe_dataset(input_layer=hurricanes, sample_size=200, 
																																												extent_output=true, output_name="Hurricanes_describe")

# Visualize the sample and extent layers if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(result)
processed_map

Podobne narzędzia

Użyj narzędzia Opisz zestaw danych, gdy chcesz eksplorować dane z użyciem danych przykładowych, statystyk i sumowania. Do rozwiązywania podobnych, ale nieco innych problemów, mogą być przydatne inne narzędzia.

Narzędzia analizy Map Viewer

Agreguj zestaw danych w kosze lub obszary i uzyskaj wynikową statystykę sumaryczną, korzystając z narzędzia Agreguj punkty serwera ArcGIS GeoAnalytics Server.

Utwórz podzbiór danych w określonym obszarze, używając narzędzia Przytnij warstwę serwera ArcGIS GeoAnalytics Server.

Narzędzia analizy ArcGIS Desktop

Aby możliwe było uruchomienie tego narzędzia z poziomu aplikacji ArcGIS Pro, aktywny portal musi być w wersji Enterprise 10.7 lub nowszej. Należy zalogować się do portalu przy użyciu konta z uprawnieniami do wykonywania analizy obiektowej w ramach analizy geoprzestrzennej.