Ce didacticiel vous aide à configurer des données pour créer un partage de fichiers Big Data. Un partage de fichiers Big Data est un élément créé sur votre portail qui fait référence à des données d’entité (points, polylignes et polygones) stockées dans un emplacement disponible sur votre instance de GeoAnalytics Server. L'élément de partage de fichiers Big Data sur votre portail vous permet de parcourir les données inscrites et d'exécuter les Outils GeoAnalytics sur vos jeux de données. Après avoir créé un partage de fichiers Big Data, vous exploiterez les données à l'aide de l'outil Agréger des points. Dans ce didacticiel, vous allez télécharger un jeu de données des adresses de départ et d'arrivée des courses de taxis et utiliser Outils GeoAnalytics pour déterminer les adresses où les taxis déposent le plus souvent les clients.
Conditions préalables
Vérifiez que l’administrateur d’ArcGIS Enterprise a configuré GeoAnalytics Server. Vous devez demander à l’administrateur de vous communiquer l’URL d’ArcGIS Server Manager pour pouvoir accéder à GeoAnalytics Server. Pour en savoir plus sur la configuration de ArcGIS GeoAnalytics Server.
Préparer les données
Pour télécharger et préparer les données utilisées dans cet exemple, procédez comme suit :
- Créez un dossier appelé BigDataExample dans un emplacement disponible sur votre instance de GeoAnalytics Server. Dans le dossier BigDataExample, créez un dossier appelé NYCTaxi.
- Accédez à http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml et téléchargez les données concernant les taxis jaunes comprises entre janvier et février 2014 dans le dossier BigDataExample > NYCTaxi.
Créer un partage de fichiers Big Data
Lorsque vous aurez enregistré les données dans un emplacement accessible à toutes les machines de GeoAnalytics Server, , inscrivez-le auprès de votre instance de GeoAnalytics Server en tant que partage de fichiers Big Data via GeoAnalytics Server Manager. Un partage de fichiers Big Data génère également un service de catalogue Big Data que vous pouvez utiliser dans les outils de GeoAnalytics Server. Pour créer le partage de fichiers Big Data, procédez comme suit :
- Connectez-vous à GeoAnalytics Server Manager. L'URL est au format suivant : https://gisserver.domain.com:6443/arcgis/manager. Si vous ne connaissez pas cette URL, demandez-la à votre administrateur.
- Cliquez sur Site > Stockage des données, puis sélectionnez Inscrire le partage de fichiers Big Data.
- Acceptez la valeur par défaut du type File Share (Partage de fichiers), spécifiez un nom unique et le chemin de votre dossier BigDataExample (par exemple, \\sharedLocation\BigDataExample pour Windows ou /sharedLocation/BigDataExample pour Linux), puis cliquez sur Create (Créer). Vous créez ainsi un stockage des données de partage de fichiers Big Data. Il s'agit d'un élément du partage de fichiers Big Data sur votre portail, dont le service de catalogue Big Data sous-jacent est disponible via une URL au format https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer, où FileShareName correspond au nom attribué au stockage des données lors de son inscription. Dans cet exemple, le partage de fichiers Big Data comporte un jeu de données, NYCTaxi, nommé d’après le dossier de votre partage de fichiers Big Data.
Mettre à jour un partage de fichiers Big Data
Ce jeu de données comporte plusieurs champs de date et d'heure. Vous allez inspecter le jeu de données du manifeste pour vous assurer que vous utilisez les champs appropriés. Pour mettre à jour et afficher les jeux de données du manifeste, cliquez sur l'icône du crayon près du partage de fichiers Big Data dans le gestionnaire de serveur. Une fois le manifeste généré, les paramètres geometry et time utilisent les adresses de départ. Les champs des adresses où les clients sont pris en charge ont été sélectionnés lors du processus de génération du manifeste. Dans ce didacticiel, vous allez analyser les adresses où les clients sont déposés.
Remarque :
Lorsque le manifeste est généré, une estimation est appliquée pour trouver les champs servant à représenter la géométrie et l'heure.
Dans ce didacticiel, vous allez modifier le manifeste pour utiliser l'heure et les adresses de dépose. Cela signifie que l'analyse va agréger les adresses d'arrivée au lieu des adresses de départ. Les deux jeux de géométrie (départ ou arrivée) peuvent servir à l'analyse. Le jeu adapté dépend de ce que vous tentez de résoudre. Vous procéderez à ces modifications dans l'éditeur du jeu de données du partage de fichiers Big Data.
Remarque :
Vous pouvez également procéder en téléchargeant le manifeste, en le modifiant et en le chargeant de nouveau une fois modifié. Pour en savoir plus sur la mise à jour du manifeste, reportez-vous à la rubrique Présentation d'un manifeste de partage de fichiers Big Data.
- Cliquez sur le bouton correspondant au crayon près du partage de fichiers Big Data pour mettre à jour le manifeste du partage de fichiers Big Data une fois généré.
- Sous Dataset (Jeu de données), sélectionnez le jeu de données NYCTaxi.
- La section Geometry (Géométrie) indique que les champs actuellement utilisés pour représenter les valeurs X et Y sont pickup_longitude et pickup_latitude. Modifiez la valeur définie pour Field used to represent X value (Champ utilisé pour représenter la valeur X) de pickup_longitude en dropoff_longitude. Modifiez la valeur définie pour Field used to represent Y value (Champ utilisé pour représenter la valeur Y) de pickup_latitude en dropoff_latitude.
- La section Time (Temps) indique que le champ actuellement sélectionné pour représenter les valeurs temporelles est pickup_datetime au format aaaa-MM-jj HH:mm:ss. Remplacez la valeur pickup_datetime du champ temporel par dropoff_datetime.
- Cliquez sur le bouton Save (Enregistrer) pour enregistrer les modifications apportées au partage de fichiers Big Data.
Exécuter l'analyse sur les données concernant les taxis via Portal for ArcGIS
Une fois les données inscrites auprès de votre instance GeoAnalytics Server et l’élément de partage de fichiers Big Data créé sur votre portail, vous pouvez accéder à un outil GeoAnalytics Server et l’exécuter sur l’élément.
Remarque :
Les données inscrites auprès de votre instance de GeoAnalytics Server ne sont pas transférées sur votre serveur, mais uniquement inscrites auprès de GeoAnalytics Server, avec un manifeste pour en définir la structure.
- Connectez-vous au portail. L'URL est au format https://webadaptorhost.domain.com/arcgis/home, où arcgis est le nom de l'adaptateur Web inscrit auprès de votre portail. Accédez à Content (Contenu). Dans votre table Content (Contenu), vous voyez l’élément du partage de fichiers Big Data que vous venez de créer.
- Cliquez sur Map (Carte) pour ouvrir Map Viewer (Visionneuse de carte).
- Cliquez sur le bouton Analyse. Si des analyses raster et d'entités sont disponibles, cliquez sur Analyse des entités, puis sur Outils GeoAnalytics > Synthétiser les données > Agréger des points.
- Saisissez New-York dans la barre de recherche et appuyez sur Search (Rechercher). La carte applique un zoom sur l’étendue de la ville de New-York.
- Exécutez l’outil Aggregate Points (Agréger des points) pour agréger les points dans des polygones ou des groupes de taille spécifique et ainsi mieux comprendre les données. En l'absence de jeu de données surfaciques dans lequel agréger les points, vous utiliserez des groupes dans l'espace et le temps. Pour ajouter le jeu de données concernant les taxis à New York sous la forme d’une couche destinée à l’agrégation, sélectionnez Choose Analysis Layer (Choisir une couche d’analyse) comme premier paramètre de l’outil. Dans la boîte de dialogue qui apparaît, sélectionnez Content (Contenu) et accédez au jeu de données concernant les taxis à New York. Choisissez la couche et cliquez sur Ajouter une couche.
- Procédez à l'agrégation dans des groupes carrés d'un kilomètre.
- Puisque les données sont temporelles, vous pouvez appliquer la discrétisation temporelle. En les téléchargeant, vous remarquerez que les données s'étalent sur deux mois. Dans ce didacticiel, examinez la première semaine de chaque mois. Pour ce faire, définissez Time step interval (Intervalle temporel) sur 1 week (1 semaine), How often to repeat the time step (Fréquence de répétition de l’intervalle) sur 1 month (1 mois) et time to align time steps to (Heure sur laquelle aligner les intervalles temporels) sur January 1st 2017, at 12:00 AM (1er janvier à 12 h 00). Bien que les données de test soient pour 2014, Aggregate Points (Agréger des points) permet d’aligner l’analyse à la fois dans le passé et l’avenir.
- Sélectionnez des statistiques qui présentent un intérêt, à savoir la Moyenne de total_amount ou la Variance de la Distance de trajet.
- Définissez la référence spatiale sur une projection locale de New York. Cliquez sur le bouton représentant un engrenage pour accéder aux paramètres d’analyse. Sélectionnez As specified (Comme spécifié) pour Processing coordinate system (Système de coordonnées de traitement) et sélectionnez le globe pour rechercher UTM Zone 18N en cliquant sur Spatial References (Références spatiales) > PCS > UTM WGS 1984 UTM Zone 18 N. Sélectionnez OK, puis APPLY. Faites un zoom avant sur la région de New York City, vérifiez que la case Use current map extent (Utiliser l’étendue courante de la carte) est cochée et exécutez l’analyse. L'analyse est exécutée sur les machines de votre instance de GeoAnalytics Server. Une fois l'analyse terminée, les résultats sont ajoutés à votre carte. Les résultats apparaîtront sous la forme de polygones carrés représentant le nombre d’adresses d’arrivée pour les taxis dans chaque polygone, ainsi que des statistiques supplémentaires que vous avez calculées. Vos résultats comportent entre 3 500 et 4 000 entités. Les résultats varient en fonction de l’étendue de la carte affichée à l’écran et de votre fuseau horaire.
Vous avez un commentaire à formuler concernant cette rubrique ?