Skip To Content

Décrire le jeu de données

Remarque :

Cette fonction n’est pas encore prise en charge dans Map Viewer Classic (anciennement Map Viewer). Elle sera disponible dans une version future de la nouvelle version deMap Viewer Map Viewer.

Décrire le jeu de donnéesL’outil Décrire le jeu de données offre une vue d’ensemble des données Big Data. Par défaut, l’outil génère une couche tabulaire contenant des synthèses de vos valeurs de champ et une vue d’ensemble de vos paramètres de géométrie et de temps pour la couche en entrée. L’outil peut éventuellement générer une couche d’entités représentant un échantillon de vos entités en entrée, ou une seule couche d’entités surfaciques qui représente l’étendue de vos entités en entrée. Vous pouvez choisir de générer l’une d’elles, les deux ou aucune.

Diagramme de workflow

Diagramme de processus Décrire le jeu de données

Analyse avec les GeoAnalytics Tools

Vous pouvez exécuter des analyses avec GeoAnalytics Tools via un traitement distribué sur plusieurs cœurs et machines ArcGIS GeoAnalytics Server. GeoAnalytics Tools et les outils d’analyse d’entités standard de ArcGIS Enterprise proposent différents paramètres et fonctionnalités. Pour en savoir plus sur ces différences, reportez-vous à la rubrique Différences entre les outils d’analyse d’entités.

Exemples

Vous trouverez ci-dessous des exemples d’utilisation de l’outil.

  • Vérifiez que vous avez correctement inscrit l’heure et la géométrie auprès de votre partage de fichiers Big Data.
  • Interprétez les valeurs attributaires avec les résumés statistiques de champ.
  • Visualisez vos données Big Data avec un exemple de couche. Au lieu de dessiner un million d’entités, dessinez un échantillon.
  • Exécutez des processus à l’aide d’un échantillon de données avant une mise à l’échelle en vue d’un traitement plus long et plus volumineux.
  • Déterminez l’emplacement d’une étendue en calculant l’étendue géographique.

Remarques sur l'utilisation

Accédez à la couche d’entités tabulaires, ponctuelles, linéaires ou surfaciques ou au jeu de données de partage de fichiers Big Data que vous souhaitez décrire à l’aide de l’option Choose dataset to describe (Choisir le jeu de données à décrire).

Générez un sous-jeu de vos données en cliquant sur le bouton Sample layer (Exemple de couche) et en spécifiant le nombre d’entités dans le sélecteur de valeurs qui s’affiche. Le sous-jeu en sortie a toujours les mêmes paramètres de structure, de géométrie et de temps que les entités en entrée. Utilisez le sous-jeu pour comprendre le mode d’affichage des données Big Data lors de leur ajout à une carte ou de leur visualisation dans une table attributaire. En outre, vous pouvez exécuter l’analyse sur l’exemple de jeu de données pour déterminer les meilleures entrées en vue d’une analyse à plus grand échelle sur la totalité de votre jeu de données.

Générez une entité limite qui décrit l’étendue de votre jeu de données en entrée en sélectionnant Extent layer (Couche de l’étendue). La sortie est toujours une entité rectangulaire unique qui représente l’étendue géographique des entités en entrée. Utilisez la couche de l’étendue pour comprendre l’emplacement de vos données ou utilisez-la comme entrée ailleurs dans votre processus. Par exemple, utilisez-la comme couche surfacique dans laquelle découper des entités à l’aide de l’outil GeoAnalytics Découper la couche.

Si l’option Use current map extent (Utiliser l’étendue courante de la carte) est cochée, seules les entités situées au sein de l’étendue courante de la carte seront analysées. Si l’option n’est pas sélectionnée, toutes les entités en entrée qui se trouvent dans la couche en entrée sont analysées, même si elles se trouvent en dehors de l’étendue actuelle de la carte. Par exemple, si vous avez choisi de générer un exemple de couche et que l’option Use current map extent (Utiliser l’étendue courante de la carte) n’est pas cochée, la totalité du jeu de données sera utilisée pour l’exemple de résultats. Si vous avez choisi de générer une couche de l’étendue avec l’option Use current map extent (Utiliser l’étendue courante de la carte) cochée, la limite en sortie représentera l’étendue de la carte.

Par défaut, l’outil générera une table contenant des résumés statistiques pour chaque champ et une sortie JSON décrivant les propriétés de la couche en entrée. Pour accéder à la chaîne JSON, cliquez sur le bouton Show Result (Afficher le résultat) Show Result (Afficher le résultat) qui s’affiche lorsque vous survolez la couche tabulaire des résumés statistiques dans la table des matières.

La chaîne JSON inclut les informations suivantes :

  • datasetName - Nom du jeu de données décrit.
  • datasetSource - Emplacements de stockage du jeu de données en entrée. Les valeurs possibles sont ArcGIS Data Store — Relational, ArcGIS Data Store — Spatiotemporal ou Big Data File Share - <your_bdfs_name>.
  • recordCount - Nombre total d’enregistrements contenus dans le jeu de données en entrée.
  • geometry - Paramètres de géométrie de la couche en entrée.
    • geometryType - Type de géométrie que représentent les entités en entrée. Les valeurs possibles sont Point, Line, Polygon ou Table.
    • sref - Référence spatiale utilisée par les entités en entrée. Par exemple, cette valeur pourrait être {"wkid": 26972}26972 est l’ID de référence spatiale.
    • countNonEmpty - Nombre d’entités avec une géométrie valide.
    • countEmpty - Nombre d’entités sans géométrie valide.
    • spatialExtent - Étendue géographique des entités, représentée par les valeurs de coordonnées minimale et maximale.
  • time - Paramètres d’heure de la couche en entrée.
    • timeType - Type d’heure représenté par les entités en entrée. Les valeurs possibles sont Instant, Interval ou None.
    • countNonEmpty - Nombre d’entités avec un temps valide.
    • countEmpty - Nombre d’entités sans temps valide.
    • temporalExtent - Étendue temporelle des entités, représentée par les valeurs de temps minimale et maximale.

En savoir plus sur les paramètres de temps et les jeux de données du partage de fichiers Big Data

En savoir plus sur les paramètres de géométrie et les jeux de données du partage de fichiers Big Data

Limitations

L’exemple de couche ne représente pas une sélection géographique véritablement aléatoire et ne doit pas être utilisée pour comprendre l’étendue géographique ou la distribution de vos données. Par exemple, si vous spécifiez 230 entités pour le champ Number of features to include (Nombre d’entités à inclure), le résultat peut contenir 230 entités en entrée dans n’importe quel ordre ou emplacement.

Fonctionnement de l’outil Décrire le jeu de données

Calculs

Les résumés statistiques sont calculés pour chaque champ dans la couche en entrée. Les champs contiendront des sorties statistiques différentes selon le type de champ. L’exemple de profondeur de sol suivant souligne comment les statistiques sont calculées pour chaque type de champ :

Exemple d’entités à synthétiser avec des statistiques calculées
Cet exemple d’entités en entrée sera synthétisé et généré sous la forme des statistiques calculées ci-dessous.

Statistique numériqueRésultat calculé

Effectif

Total de :

[130, 8, 250, 0, null] = 4

Somme

130 + 8 + 250 + 0 + null = 388

Minimal

Minimum de :

[130, 8, 250, 0, null] = 0

Maximum

Maximum de :

[130, 8, 250, 0, null] = 250

Moyenne

388/4 = 97

Plage

250-0 = 250

Variance

= 13 942,66667

Écart type

= 118,0791

Statistique de dateRésultat calculé

Effectif

Total de :

[1 538 738 400 000, 1 507 202 400 000, 1 475 666 400 000, 1 412 508 000 000, null] = 4

Minimal

Minimum de :

[1 538 738 400 000, 1 507 202 400 000, 1 475 666 400 000, 1 412 508 000 000, null] = 1 412 508 000 000

Maximum

Maximum de :

[1 538 738 400 000, 1 507 202 400 000, 1 475 666 400 000, 1 412 508 000 000, null] = 1 538 738 400 000

Plage

1 538 738 400 000-1 412 508 000 000 = 126 230 400 000
Remarque :

Les résultats stockés dans ArcGIS Data Store le sont toujours en millisecondes au format UTC (Temps universel coordonné). Par exemple, l’heure UTC de 1 538 713 350 000 millisecondes équivaut au vendredi 5 octobre 2018 16:22:30 dans le fuseau horaire GMT.

Statistique de chaîneRésultat calculé

Effectif

["high", "high", "high", "low", null] = 4

Tout

= "low"

Remarque :

La statistique de total (pour les chaînes et les champs numériques) comptabilise le nombre de valeurs non nulles. Le total de [0, 1, 10, 5, null, 6] = 5. Le total de [Primary, Primary, Secondary, null] = 3.

Exemple de ArcGIS API for Python

L’outil Décrire le jeu de données est disponible dans ArcGIS API for Python.

Cet exemple décrit un jeu de données de suivi d’un ouragan dans un partage de fichiers Big Data et génère un sous-ensemble de 200 entités d’ouragans et une couche d’entités.


# Import the required ArcGIS API for Python modules
import arcgis
from arcgis import geoanalytics as ga
from arcgis.gis import GIS

# Connect to your ArcGIS Enterprise portal and confirm that GeoAnalytics is supported
portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False)
if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")
    exit(1)   

# Find the big data file share dataset you'll use for analysis
search_result = portal.content.search("", "Big Data File Share")

# Look through the search results for a big data file share with the matching name
bdfs_search = next(x for x in search_result if x.title == "bigDataFileShares_NaturalDisasters")

# Look through the big data file share for Hurricanes
hurricanes = next(x for x in bdfs_search.layers if x.properties.name == "Hurricanes")

# Run the Describe Dataset tool
result = ga.summarize_data.describe_dataset(input_layer=hurricanes, sample_size=200, 
																																												extent_output=true, output_name="Hurricanes_describe")

# Visualize the sample and extent layers if you are running Python in a Jupyter Notebook
processed_map = portal.map()
processed_map.add_layer(result)
processed_map

Outils semblables

Utilisez l’outil Décrire le jeu de données pour explorer vos données à l’aide d’exemples, de statistiques et de récapitulatif. D'autres outils peuvent vous aider à résoudre des problèmes légèrement différents.

Outils d'analyse Map Viewer Classic

Agrégez votre jeu de données en groupes ou surfaces et générez des résumés statistiques à l’aide de l’outil Agréger des points ArcGIS GeoAnalytics Server.

Créez un sous-jeu de vos données dans une surface spécifique à l’aide de l’outil Découper la couche de ArcGIS GeoAnalytics Server.

Outils d'analyse ArcGIS Pro

Pour exécuter l’outil à partir de ArcGIS Pro, votre portail actif doit être Enterprise version 10.7 ou ultérieure. Vous devez vous connecter via un compte détenteur des privilèges permettant d’effectuer une analyse d’entités GeoAnalytics.