En surveillant activement votre organisation ArcGIS Enterprise, vous pouvez stabiliser la disponibilité du système, identifier les problèmes de performances ou les pannes des services et ajuster de manière proactive les ressources allouées entre les machines concernées pour l’exécution des applications sous-jacentes. Les solutions de surveillance peuvent effectuer des contrôles actifs des extrémités couramment utilisées et avertir les contacts appropriés lorsque la réponse ne se situe pas dans la tolérance attendue. Vous pouvez en outre les utiliser pour collecter des informations historiques qui peuvent corroborer les journaux système et logiciels lors d’une analyse de cause première ou d’enquêtes postmortem.
ArcGIS Monitor vous permet de surveiller votre organisation ArcGIS Enterprise, mais vous pouvez également faire appel à des outils tiers pour obtenir des résultats similaires. Les informations ci-dessous constituent un point de départ pour l’intégration des solutions de surveillance avec ArcGIS Enterprise.
Surveiller les métriques
En règle générale, il existe deux perspectives de surveillance des applications d’entreprise : l’utilisation des ressources et l’expérience utilisateur.
L’utilisation des ressources est un concept familier pour les personnes qui travaillent dans l’administration des systèmes : elle implique les caractéristiques des ensembles de machines et de l’infrastructure de support qui exécutent les logiciels de l’entreprise. Ces métriques sont généralement proportionnelles au volume des utilisateurs qui accèdent à la plateforme, mais certains processus peuvent entraîner des pics d’utilisation significatifs.
La surveillance de l’expérience utilisateur reflète quant à elle généralement la manière dont le client se connecte et interagit avec les applications frontales et est familière aux analystes métier et aux administrateurs SIG. Ces métriques sont utiles pour déterminer les temps de réponse de base des différentes demandes et permettent ensuite d’établir les seuils auxquels les équipes d’administration doivent être alertées. Certains aspects de l’expérience utilisateur doivent également tenir compte d’éléments extérieurs aux temps de réponse, comme l’expiration des certificats SSL.
Les sous-sections ci-dessous décrivent la surveillance d’un système sous l’angle de l’utilisation des ressources.
Utilisation des ressources
Lorsque vous surveillez des machines dans un déploiement ArcGIS Enterprise sous l’angle de l’utilisation des ressources, les métriques à suivre sont les suivantes :
- Processeur : lorsque le processeur d’une machine concernée connaît un pic ou atteint 100 % de ses capacités, les demandes de calcul sont retardées, ce qui est susceptible d’entraîner un retard dans le renvoi des informations. Cela s’applique à tout traitement en cours d’exécution en cas de pic d’activité.
- Mémoire physique : lorsque la mémoire physique approche les 100 % d’utilisation, les traitements en cours d’exécution sont susceptibles de connaître des incidents lorsqu’ils tentent d’utiliser de l’espace mémoire supplémentaire. Cela peut être atténué par la présence de mémoire virtuelle.
- Mémoire virtuelle : la mémoire virtuelle offre une zone tampon entre la mémoire physique d’une machine et le stockage sous-jacent. Elle utilise une partie du stockage sous-jacent pour échanger des données en dehors de la mémoire physique tout en les gardant accessibles de manière plus immédiate que si elles étaient chargées directement à partir du disque. Les incidents dus à une insuffisance de mémoire virtuelle sont courants sur les systèmes Linux ; il est néanmoins important de surveiller également l’utilisation de l’échange.
- Mémoire allouée : la capacité de mémoire allouée au système est la somme de la mémoire physique d’une machine et de la taille de la mémoire virtuelle à un point donné dans le temps. Puisque la mémoire virtuelle peut augmenter, la limite de mémoire allouée peut évoluer dans le temps. Une machine qui approche les 100 % d’utilisation de la mémoire allouée indique que les mémoires physique et virtuelle sont épuisées et que des ressources supplémentaires sont nécessaires.
- Espace disponible de l’espace disque : une insuffisance d’espace disque sur le système, l’application ou les volumes de données d’un système peut avoir des conséquences significatives sur l’exécution du système d’exploitation et des applications qui dépendent de ces volumes. Il convient de surveiller l’espace disponible pour vérifier que les systèmes ne manquent pas d’espace disque et pour identifier les augmentations significatives d’utilisation de l’espace, ce qui pourrait indiquer des événements de publication anormaux.
Lorsque vous surveillez votre système, gardez à l’esprit que les goulets d’étranglement du réseau, bien qu’ils tendent à se raréfier dans les environnements de réseau d’entreprise, peuvent affecter les temps de réponse optimaux des composants ArcGIS Enterprise. Cela est particulièrement vrai dans un environnement qui compte plusieurs machines et dans lequel de nombreuses demandes internes sont échangées entre tous les composants ArcGIS Enterprise et d’autres sources de données et services de fichier inscrits.
Dans la mesure du possible, établissez la liste des traitements du processeur et de la mémoire afin d’identifier le traitement qui connaît un pic pendant une durée donnée. Si vous utilisez ce niveau de granularité de la surveillance, la partie ligne de commande du traitement permet, par exemple, de distinguer les composants ArcGIS Enterprise internes les uns des autres ou de l’analyse anti-virus en temps réel.
Il convient de surveiller non seulement les machines sur lesquelles les composants ArcGIS Enterprise sont installées, mais aussi les serveurs de fichiers et les instances de base de données dont peut dépendre le fonctionnement du déploiement. Les applications ArcGIS Enterprise démarrent généralement à leurs plus bas niveaux de consommation des ressources. Au fur et à mesure que les utilisateurs accèdent aux applications et les utilisent, leur consommation des ressources évolue proportionnellement à l’utilisation des ressources.
Collecter les métriques liées aux ressources
Bien qu’ils ne soient pas inclus dans la plupart des distributions Linux de base, de nombreux paquetages logiciels vous permettent d’interroger et de collecter des métriques sur l’utilisation des ressources des machines. Collectez au minimum les métriques d’utilisation des ressources mentionnées dans la section précédente pour toutes les machines du déploiement en les ajoutant sous forme de compteurs dans le logiciel choisi. En cas de dégradations ou de pannes du service, vous pouvez augmenter la fréquence d’interrogation pour obtenir plus de détails sur les traitements et les événements qui précèdent ces conditions.
Analyser les métriques liées aux ressources
Une fois que vous avez sélectionné un outil de collecte et capturé les données d’utilisation des ressources sur vos machines, vous pouvez analyser les métriques liées aux ressources. Tenez compte des points suivants lors de l’analyse des métriques liées aux ressources :
- La durée de vie du problème : le fait de savoir si un incident se produit de manière isolée ou sur le long terme vous aide à déterminer la meilleure façon de procéder dans la plupart des situations. Un pic d’utilisation des ressources de courte durée est généralement accompagné d’une demande immédiate de services spécifiques, comme l’ajout d’une application ou d’un tableau de bord récemment publié ou l’ajout d’un service au portail. Une croissance à long terme vers l’utilisation actuelle peut indiquer la popularité croissante de la plateforme, ainsi que des services et applications associés. Les pics de courte durée sont susceptibles de se reproduire ou de ne pas se reproduire ; il est donc essentiel de connaître leur contexte afin de savoir si des ressources supplémentaires sont nécessaires à la stabilité du déploiement sur le long terme.
- Les traitements qui consomment la majorité des ressources du système : dans un environnement Portal for ArcGIS et ArcGIS Data Store, l’utilisation doit évoluer de manière linéaire selon le nombre d’utilisateurs de la plateforme et utiliser les services hébergés de manière proportionnelle. Avec ArcGIS Server, la mise à l’échelle des services dédiés et de l’utilisation des services hébergés sont les deux principaux facteurs de l’utilisation des ressources. Il est possible d’optimiser les services dédiés dans un site ArcGIS Server afin de réduire l’utilisation globale des ressources, mais cette approche peut ne pas être adéquate si la demande atteint son pic au fil du temps.
- La distribution des rôles : la distribution des rôles entre les différentes machines d’un déploiement ArcGIS Enterprise permet un ajustement plus précis de l’utilisation des ressources par chaque composant, ainsi qu’une granularité accrue de l’identification de la survenue des incidents. L’augmentation des ressources uniquement pour les machines du Data Store relationnel ou du serveur d’hébergement peut s’avérer plus stratégique qu’une augmentation des ressources dans le cas d’un déploiement d’entreprise ne comprenant qu’une seule machine. Vous pouvez ajuster l’architecture du site actuel via des opérations de jointure de site pour passer d’une seule machine à une architecture distribuée dans un déploiement établi.
Résoudre les problèmes
Maintenant que vous pouvez identifier, suivre et analyser les métriques des machines, vous pouvez résoudre les problèmes liés aux réponses système inattendues. Cela peut consister à augmenter les ressources du processeur, à affecter ou installer davantage de RAM, ou à augmenter l’espace disque. Avant d’agir, prenez connaissance des pratiques conseillées en matière de résolution des problèmes d’utilisation des ressources.
Utilisation du processeur
Avant d’augmenter les ressources de processeur allouées des machines devant faire face à une utilisation intense du processeur, vous devez savoir s’il s’agit d’un composant ArcGIS Enterprise ou d’un autre logiciel du système qui génère des pics d’utilisation. Les logiciels de sécurité dont la fonction d’analyse en temps réel est activée peuvent accroître l’utilisation du processeur lors du fonctionnement normal d’un serveur Web et d’une base de données. Si tel est le cas, signalez le comportement observé à votre équipe de cybersécurité. Dans le cas de machines virtuelles, la mise à disposition de l’hôte sous-jacent peut s’avérer excessive, ce qui peut entraîner un goulet d’étranglement des performances, indétectable par les machines virtuelles.
Utilisation de la mémoire physique
Lorsque l’utilisation de la mémoire physique approche les 100 %, il se peut que vous deviez attribuer ou installer davantage de RAM sur les machines. Comme décrit ci-dessus, des charges de travail distinctes sur des machines dédiées permettent d’allouer les ressources avec davantage de granularité et de réduire les conflits actuels de ressources, mais vous pouvez également augmenter la mémoire sur les machines existantes. Lorsque l’utilisation de la mémoire physique approche les 100 %, il se peut que la mémoire virtuelle disponible soit également épuisée.
Utilisation de la mémoire virtuelle et de la mémoire allouée
L’utilisation de la mémoire virtuelle et de la mémoire allouée suivent généralement le même comportement lorsqu’elle atteint les 100 %. La mémoire virtuelle autorise les traitements à utiliser davantage de mémoire que celle qui est disponible sur un système et évolue généralement automatiquement vers une valeur de seuil, sauf si elle a été définie de manière statique par l’administrateur système en charge des machines mises à disposition. Vous pouvez augmenter la mémoire virtuelle en modifiant les paramètres système si l’espace disque permet l’extension du fichier d’échange.
Espace disponible du volume de disque
L’insuffisance de l’espace disque est l’une des causes d’incident les plus imprévisibles dans un déploiement ArcGIS Enterprise. Les fichiers peuvent être vidés ou tronqués en cas d’échec des tentatives de mise à jour, ce qui est susceptible d’empêcher le démarrage des logiciels. Recherchez tout d’abord les fichiers volumineux qui peuvent être déplacés vers un Data Store inscrit ou un autre emplacement. Si vous ne pouvez pas supprimer de fichiers inutiles, vous devez augmenter l’espace disque. Vous pouvez également migrer les répertoires système vers un stockage distinct, comme le répertoire de contenu pour un site Portal for ArcGIS ou le répertoire de cache pour ArcGIS Server.
Remarque :
Pour afficher les 25 fichiers les plus volumineux par taille (en octets) dans le répertoire spécifié, <répertoire>, exécutez la commande suivante :
sudo find <directory> -type f -printf '%s %p\n' | sort -nr | head -25
Son exécution sur le volume racine peut prendre beaucoup de temps. Il est donc recommandé d’indiquer un répertoire enfant dans la commande.
Vous avez un commentaire à formuler concernant cette rubrique ?