Организациям часто требуется определенный уровень работоспособности системы для развертываний ArcGIS Enterprise, например, доступность в течение 99 процентов времени или выше. Для таких организаций реализация стратегии обеспечения высокой доступности имеет решающее значение. Эта стратегия должна включать как элементы инфраструктуры, так и работу сотрудников; один из элементов не может гарантировать отказоустойчивость. Для получения дополнительной информации по вопросам обеспечения отказоустойчивости, а также о шаблонах проектирования и рекомендациях обратитесь к разделу Центр архитектуры.
Компонент инфраструктуры стратегии высокой доступности включает сохранение как минимум двух активных копий развертывания и реализацию механизмов отработки отказа для автоматического переключения с основного на резервный режим как можно быстрее после выхода компьютера из строя. Резервное развертывание постоянно получает те же обновления ресурсов и настроек, что и основное; это отличает высокодоступные системы от реплицированных систем, которые полагаются на регулярное резервное копирование, чтобы минимизировать потерю данных при сбое. Все критически важные для миссии или бизнеса элементы развертывания должны учитываться при реализации высокой доступности.
Человеческий компонент стратегии высокой доступности состоит из организационных практик, которые гарантируют, что отработка отказа всегда будет успешной и эффективной. Например, обслуживание машины или обновления системы никогда не должны применяться как к основному, так и к резервному развертыванию в системе с высокой доступностью, и системный администратор всегда должен быть готов принять на себя ответственность в случае сбоя.
В темах этого раздела объясняется, как настроить и поддерживать отказоустойчивое развертывание ArcGIS Enterprise.
Когда следует применять отказоустойчивость
Развертывание отказоустойчивого ArcGIS Enterprise является сложным и требует времени, усилий и затрат на настройку и обслуживание. Важно определить, требуется ли высокая доступность для вашей организации. Организации, рассматривающие высокую доступность, должны задавать такие вопросы, как:
- Есть ли у вашей организации обязательное соглашение об уровне обслуживания?
- Какой процент времени безотказной работы требуется по соглашению об уровне обслуживания?
- Сколько минут или часов простоя разрешено в год?
- Как применяется соглашение об уровне обслуживания?
- Есть ли у вашей организации договорный мандат на высокую доступность?
- Каковы условия этого мандата?
- Будет ли такое развертывание ArcGIS Enterprise участвовать в критически важных операциях?
- Обладает ли ваша организация надлежащими лицензиями Esri для развертывания отказоустойчивости?
- Может ли ваша организация предоставить оборудование, необходимое для поддержки высокодоступного развертывания?
- Есть ли у вас аппаратные ресурсы для дублирования каждого компонента вашего развертывания?
- Можете ли вы настроить и поддерживать балансировщик нагрузки сторонних компаний, способный выполнять отработку отказа?
Важные концепции в высокой доступности
В следующих разделах определяются и описываются ключевые термины, использующиеся в отказоустойчивых системах.
Балансировщик нагрузки
Балансировщики нагрузки действуют как обратный прокси-сервер и распределяют трафик между внутренними серверами. Для повышения производительности и надежности программного обеспечения в развертывании отказоустойчивого ArcGIS Enterprise требуется по крайней мере один сторонний балансировщик нагрузки. Они обрабатывают трафик клиентов на сайтах вашего портала и сервера, а также внутренний трафик между компонентами программного обеспечения.
Несмотря на то, что ArcGIS Web Adaptor считается балансировщиком нагрузки, он не может служить единственным балансировщиком нагрузки в развертывании отказоустойчивости. Вы можете настроить экземпляры ArcGIS Web Adaptor для каждого сайта ArcGIS Server для дополнительного уровня безопасности и анонимности или для настройки аутентификации на веб-уровне. В этих случаях сторонний балансировщик нагрузки отправляет трафик через Web Adaptor, а не напрямую на компьютеры ArcGIS Server.
Балансировщики нагрузки должны иметь возможность отправлять проверки работоспособности HTTP на конечные точки проверки состояния сервера или проверки состояния портала. Балансировщик нагрузки создает и управляет URL-адресами, используемыми для развертывания, которые описаны в следующем разделе.
URL, используемые в интеграции
В развертывании отказоустойчивого ArcGIS Enterprise используются несколько разных URL-адресов.
URL сервисов
Это - URL, который используется внешними пользователями и клиентскими приложениями для доступа к сайтам ArcGIS Server. Это - URL-адрес балансировщика нагрузки, который обрабатывает трафик ArcGIS Server и передает запросы либо на Web Adaptor сайта, либо непосредственно на машины ArcGIS Server.
Административный URL
Этот URL-адрес используется администраторами и внутри портала для доступа к сайту ArcGIS Server при выполнении административных операций. Он должен быть направлен на балансировщик нагрузки; если административный URL-адрес указывает на один компьютер на сайте ArcGIS Server и этот компьютер отключен, интеграция работать не будет. В зависимости от архитектуры вашей системы, это может быть тот же URL-адрес, что и URL-адрес сервисов или второго балансировщика нагрузки.
URL-адрес частного портала
Это внутренний URL, используемый сайтами вашего сервера для связи с порталом. Он также должен быть направлен на балансировщик нагрузки и должен быть определен до интеграции. Если вы интегрируете сайты ArcGIS Server до настройки privatePortalURL, выполните шаги 8 и 9 из раздела Настройка существующего развертывания для обеспечения отказоустойчивости, чтобы обновить URL-адрес в развертывании. Подобно административному URL-адресу, он может совпадать с общедоступным URL-адресом портала или может быть вторым балансировщиком нагрузки.
Мониторинг
Каждый компонент ArcGIS Enterprise обеспечивает возможность обработки сбоев на уровне компьютера в рамках развертывания. В компоненте высокой доступности, когда один компьютер отключается, другой компьютер продолжает работать практически без сбоев. Однако развертывание теперь имеет единую точку отказа и находится под угрозой. Важно, чтобы развертывание и отдельные компьютеры отслеживались для быстрого обнаружения сбоев и уведомления администраторов, если один или несколько компьютеров отключаются. Это может быть достигнуто с помощью ArcGIS Monitor или стороннего программного обеспечения для мониторинга.
Люди и практики
Чтобы создать и поддерживать высокодоступное развертывание, вашей организации необходимо обеспечить высокую доступность людей и практик. Если у вас есть только один администратор, и этот администратор недоступен во время сбоя, это не является отказоустойчивой средой.
Не менее важны ваши организационные практики. Если вы используете виртуальные компьютеры, не помещайте все компоненты одного уровня программного обеспечения в один хост. Например, два виртуальных компьютера, на которых запущен отказоустойчивый портал, не должны находиться на одном хосте виртуального компьютера, поскольку этот хост является единственной точкой отказа.
Убедитесь, что на каждом уровне программного обеспечения всегда работает хотя бы один компонент для обеспечения отказоустойчивости. Если вам нужно остановить или перезапустить компонент, убедитесь, что другой компьютер, на котором работает тот же компонент, доступен и работает правильно.
Не планируйте одновременное резервное копирование или обслуживание для всех машин в отказоустойчивом компоненте. Если исправление или резервное копирование приводят к отказу всех компьютеров, у вас не остается компьютеров, которые могли бы взять на себя обеспечение высокой доступности. Для получения дополнительной информации см. Применение исправлений и обновлений для компонентов высокой доступности.
Хранение файлов конфигурации и данных
Одной из проблем, с которыми сталкиваются клиенты при развертывании ArcGIS Enterprise на местах, является приобретение и обслуживание устройства хранения отказоустойчивых данных. Поскольку и ArcGIS Server, и Portal for ArcGIS требуют общего хранилища для настройки отказоустойчивости, это общее хранилище может быть единственной точкой отказа. В локальном развертывании используйте устройство NAS или RAID, чтобы обеспечить отказоустойчивое хранилище данных и файлов конфигурации для ArcGIS Server и Portal for ArcGIS.
Облачные развертывания предлагают возможность хранения данных и файлов конфигурации в среде высокой отказоустойчивости: бакетах Amazon Simple Storage Service (S3) на Amazon Web Services (AWS) или BLOB контейнерах на Microsoft Azure. Эти места хранения и доступность управляются облачным провайдером. Посмотрите документацию для каждого соответствующего поставщика облачных услуг для получения дополнительной информации.
Совместное размещение компонентов
Размещайте все компоненты и хранилища в отказоустойчивом развертывании ArcGIS Enterprise в одном дата-центре или облачном регионе для обеспечения связи с минимальной задержкой между всеми компонентами. Не разделяйте первичный и вторичный компьютеры отказоустойчивого развертывания по различным дата-центрам.
На случай потери одного центра обработки данных, вы можете создать вторичное развертывание на отдельном центре обработки данных. Для получения подробной информации см. раздел Восстановление после сбоя и репликация.