Skip To Content

Монитор ArcGIS Enterprise

Активно наблюдая за своей организацией ArcGIS Enterprise, вы можете стабилизировать время безотказной работы системы, выявлять проблемы с производительностью сервиса или сбои, а также заблаговременно настраивать ресурсы, выделенные на участвующих компьютерах, для запуска основных приложений. Решения для мониторинга могут обеспечивать активные проверки часто используемых конечных точек и предупреждать соответствующие контакты, когда ответы выходят за пределы ожидаемых допусков. Кроме того, вы можете использовать их для сбора исторической информации, которая может быть использована для подтверждения системных и программных журналов во время анализа первопричин или исследования аварийных ситуаций.

Хотя вы можете использовать ArcGIS Monitor для наблюдения за своей организацией ArcGIS Enterprise, существуют также сторонние инструменты, позволяющие добиться аналогичных результатов. Приведенная ниже информация является отправной точкой для интеграции решений мониторинга с ArcGIS Enterprise.

Мониторинг показателей

В общем, есть две точки зрения, с которых можно отслеживать многопользовательские приложения: использование ресурсов и взаимодействие с пользователем.

Использование ресурсов знакомо тем, кто занимается системным администрированием, поскольку оно включает в себя характеристики набора машин и вспомогательной инфраструктуры, на которых работает многопользовательское программное обеспечение. Эти показатели обычно масштабируются пропорционально количеству пользователей, обращающихся к платформе, но некоторые рабочие процессы также могут вызывать значительные всплески использования.

В качестве альтернативы мониторинг взаимодействия с пользователем обычно отражает то, как клиент подключается и взаимодействует с интерфейсными приложениями, и более знаком бизнес-аналитикам и администраторам ГИС. Эти метрики полезны для определения базового времени ответа на различные запросы, которые затем можно использовать для установления пороговых значений, при которых административные группы должны быть предупреждены. Существуют также аспекты взаимодействия с пользователем, которые требуют рассмотрения помимо времени отклика, например срок действия сертификата SSL.

В подразделах ниже описывается мониторинг системы с точки зрения использования ресурсов.

Использование ресурсов

При наблюдении за машинами в развертывании ArcGIS Enterprise с точки зрения использования ресурсов необходимо отслеживать следующие показатели:

  • Процессор - Когда мощность процессора участвующего компьютера резко возрастает или достигает 100 процентов, вычислительные запросы остаются невыполненными, что может привести к задержке возврата информации. Это относится к любому запущенному процессу, когда наблюдается всплеск активности.
  • Физическая память - Когда физическая память приближается к 100-процентному использованию, запущенные процессы могут аварийно завершать работу, поскольку они пытаются увеличить объем памяти. Это смягчается наличием виртуальной памяти.
  • Виртуальная память - Виртуальная память обеспечивает буфер между физической памятью машины и базовым хранилищем. Она использует часть базового хранилища для обмена данными из физической памяти, сохраняя при этом более легкий доступ, чем загрузка непосредственно с диска. Побочные эффекты из-за исчерпания виртуальной памяти менее распространены в системах Linux; однако важно также отслеживать использование подкачки.
  • Выделенная память - Объем выделенной системой памяти представляет собой сумму физической памяти машины и объема виртуальной памяти в данный момент времени. Поскольку виртуальная память может увеличиваться, лимит выделенной памяти может меняться со временем. Если машина приближается к 100-процентному использованию выделенной памяти, это означает, что и физическая, и виртуальная память исчерпаны и требуются дополнительные ресурсы.
  • Доступное пространство на диске - Нехватка дискового пространства для системы, приложений или объемов данных в системе может иметь серьезные последствия как для работающей операционной системы, так и для любых приложений, зависящих от этих объемов. Отслеживайте доступное пространство, чтобы гарантировать, что система не исчерпает дисковое пространство, а также определите, когда наблюдается значительное увеличение используемого пространства, что может свидетельствовать об аномальных событиях публикации.

При мониторинге системы помните, что узкие места сети, хотя и становятся реже в сетевых средах многопользовательского уровня, могут повлиять на оптимальное время отклика компонентов ArcGIS Enterprise. Это становится более вероятным в многомашинной среде, где происходит обмен несколькими внутренними запросами между всеми компонентами ArcGIS Enterprise и другими зарегистрированными источниками данных и файловыми сервисами.

Если возможно, разделите процессор и память на список каждого процесса, чтобы определить, какой процесс вызывает пики в течение заданного времени. При использовании этого уровня детализации в мониторинге часть процесса командной строки может использоваться, например, для того, чтобы отличить внутренние компоненты ArcGIS Enterprise друг от друга или от антивирусного сканирования в реальном времени.

Контролируйте не только машины, на которых установлены компоненты ArcGIS Enterprise, но также любые файловые серверы и экземпляры баз данных, от которых может зависеть правильное функционирование развертывания. Приложения ArcGIS Enterprise обычно запускаются при самом низком уровне потребления ресурсов. По мере доступа к приложениям и их использования потребление ими ресурсов масштабируется пропорционально использованию ресурсов.

Сбор показателей ресурсов

Хотя они и не входят в состав большинства базовых дистрибутивов Linux по умолчанию, существует ряд программных пакетов, позволяющих запрашивать и собирать показатели машинных ресурсов. Соберите показатели использования ресурсов, упомянутые в предыдущем разделе, как минимум для всех компьютеров в развертывании, добавив их в качестве счетчиков для выбранного программного обеспечения. Во время ухудшения качества обслуживания или сбоев вы можете увеличить частоту опроса, чтобы получить дополнительные сведения о процессах и событиях, которые предшествуют условиям сбоя.

Анализ показателей ресурсов

После того, как вы выбрали инструмент для сбора данных и собрали данные об использовании ресурсов для своих компьютеров, вы можете анализировать показатели ресурсов. При анализе показателей ресурсов учитывайте следующее:

  • Время существования проблемы - Понимание того, было ли это событие единичным событием или имело место в долгосрочной перспективе, поможет вам определить наилучший путь вперед в большинстве ситуаций. Кратковременный всплеск использования ресурсов, как правило, возникает при немедленном спросе на определенные услуги, такие как добавление недавно выпущенной операционной панели или веб-приложения или добавление отдела на портал. Долгосрочный рост к текущему уровню использования может указывать на растущую популярность платформы и связанных с ней услуг или приложений. Краткосрочные всплески могут повторяться или не повторяться, поэтому контекст, связанный с этими событиями, важен для определения того, нужны ли дополнительные ресурсы для повышения долгосрочной стабильности развертывания.
  • Процессы, потребляющие большую часть системных ресурсов - С точки зрения и перспективы Portal for ArcGIS и ArcGIS Data Store, использование должно масштабироваться почти линейно с количеством пользователей на платформе и использованием размещенных сервисов соответственно. При рассмотрении ArcGIS Server, масштабирование выделенных сервисов и использование размещенных сервисов являются двумя основными факторами использования ресурсов. Выделенные сервисы могут быть настроены на сайте ArcGIS Server для снижения общего использования ресурсов, но этого может быть недостаточно, когда спрос достигает своего пика с течением времени.
  • Распределение ролей - Распределение ролей по нескольким компьютерам в развертывании ArcGIS Enterprise позволяет более тщательно настраивать ресурсы для каждого компонента, а также повышает степень детализации понимания при возникновении проблем. Увеличение ресурсов только для реляционного хранилища данных или хост-компьютеров серверов может быть более стратегически важным, чем увеличение ресурсов для многопользовательского развертывания с одним компьютером. Вы можете внести коррективы в текущую архитектуру сайта с помощью операций присоединения к сайту, чтобы перейти с одной машины на распределенную архитектуру в установленном развертывании.

Решение проблем

Теперь, когда вы можете идентифицировать, отслеживать и анализировать показатели машинных ресурсов, вы можете реагировать на непредвиденные реакции системы. Это может означать увеличение выделенных ресурсов процессора, выделение или установку дополнительной оперативной памяти или увеличение дискового пространства. Прежде чем предпринимать какие-либо действия, вы должны ознакомиться с передовыми методами решения проблем с использованием ресурсов.

Использование процессора

Прежде чем увеличивать назначенные ресурсы процессора для машин с высокой загрузкой процессора, определите, является ли это компонентом ArcGIS Enterprise или другим программным обеспечением в системе, вызывающим всплески загрузки. Программное обеспечение безопасности с включенным сканированием в реальном времени может повысить загрузку процессора во время обычных операций веб-сервера и базы данных. Если это так, предупредите свою группу кибербезопасности о наблюдаемом поведении. Для виртуальных машин базовый хост может быть выделен избыточно, что может привести к узким местам производительности, которые не обнаруживаются виртуальными машинами.

Использование физической памяти

Когда использование физической памяти приближается к 100 процентам, машинам может потребоваться больше выделенной или установленной оперативной памяти. Как описано выше, разделение рабочих нагрузок на выделенных компьютерах может обеспечить более детальное распределение ресурсов и уменьшить текущую конкуренцию за ресурсы, но вы также можете увеличить объем памяти на существующих компьютерах. Когда использование физической памяти приближается к 100 процентам, доступная виртуальная память также может быть исчерпана.

Использование виртуальной и выделенной памяти

Использование виртуальной и выделенной памяти обычно демонстрирует одни и те же закономерности при достижении 100-процентного использования. Виртуальная память позволяет процессам использовать больше памяти, чем доступно в системе, и обычно автоматически масштабируется до порогового значения, если только системный администратор, ответственный за подготовленные машины, не установил ее статически. Вы можете увеличить виртуальную память, изменив системные настройки, если на диске достаточно места для расширения файла подкачки.

Доступное пространство на диске

Исчерпание дискового пространства — один из самых непредсказуемых методов отказа, который может произойти в развертывании ArcGIS Enterprise. Файлы могут быть пустыми или усеченными, когда попытки обновления не завершены, что может помешать правильному запуску программного обеспечения. Сначала, найдите большие файлы, которые можно переместить в зарегистрированное хранилище данных или другое место. Если вы не можете удалить ненужные файлы, вы должны увеличить место на диске. Вы также можете перенести системные директории в отдельное хранилище, например директорию ресурсов для сайта Portal for ArcGIS или директорию кэша для ArcGIS Server.

Примечание:

Чтобы просмотреть первые 25 файлов по размеру (в байтах) для указанной директории <directory>, выполните следующую команду:

sudo find <directory> -type f -printf '%s %p\n' | sort -nr | head -25

Запуск на корневом томе может занять много времени, поэтому рекомендуется указать в команде дочернюю директорию.