ArcGIS Enterprise 기관을 적극적으로 모니터링하여 시스템 가동 시간을 안정화하고 서비스 성능 문제 또는 작동 중단을 식별하며, 참여 머신 전체에 할당된 리소스를 사전에 조정하여 기본 응용프로그램을 실행할 수 있습니다. 모니터링 솔루션은 일반적으로 사용되는 엔드포인트에 대한 활성 검사를 제공하고 응답이 예상 허용오차를 벗어날 경우 적절한 연락처에 알림을 제공할 수 있습니다. 또한 이를 사용하여 근본 원인 분석 또는 사후 조사 중에 시스템 및 소프트웨어 로그를 확인하는 데 사용할 수 있는 기록 정보를 수집할 수 있습니다.
ArcGIS Monitor를 사용하여 ArcGIS Enterprise 기관을 모니터링할 수 있지만 유사한 결과를 얻을 수 있는 서드 파티 도구도 있습니다. 아래 정보는 모니터링 솔루션을 ArcGIS Enterprise와 통합하는 방법에 대한 시작점입니다.
지표 모니터링
일반적으로 엔터프라이즈 응용프로그램을 모니터링할 수 있는 두 가지 관점으로 리소스 활용 및 UX가 있습니다.
리소스 활용은 시스템 관리에 익숙한 개념으로, 엔터프라이즈 소프트웨어를 실행하는 지원 인프라 및 머신 컬렉션의 특성을 포함합니다. 이러한 지표는 일반적으로 플랫폼에 접근하는 사용자 수에 비례하여 확장되지만 일부 워크플로는 활용률이 크게 증가할 수도 있습니다.
또는 UX 모니터링은 일반적으로 클라이언트가 프런트 엔드 응용프로그램과 연결하고 상호작용하는 방법을 반영하며 비즈니스 분석가 및 GIS 관리자에게 더 친숙합니다. 이러한 지표는 다양한 요청에 대한 기준 응답 시간을 결정하는 데 유용하며 이를 사용하여 관리 팀에 알림을 제공해야 하는 임계값을 설정할 수 있습니다. SSL 인증서 만료와 같이 응답 시간 외에 검토해야 하는 UX 측면도 있습니다.
아래의 하위 섹션에서는 리소스 활용 관점에서 시스템을 모니터링하는 방법을 설명합니다.
리소스 활용
리소스 활용 관점에서 ArcGIS Enterprise 배포의 머신을 모니터링할 때 추적할 지표에는 다음이 포함됩니다.
- 프로세서 - 참여 머신의 프로세서가 급증하거나 용량이 100%에 도달하면 컴퓨팅 요청이 백로그되어 정보 반환이 지연될 수 있습니다. 이는 활동 시 버스트가 발생할 때 실행 중인 모든 프로세스에 적용됩니다.
- 실제 메모리 - 실제 메모리 활용률이 100%에 가까워지면 실행 중인 프로세스가 추가 메모리 공간으로 확장하려고 할 때 충돌이 발생할 수 있습니다. 이는 가상 메모리가 있으면 완화됩니다.
- 가상 메모리 - 가상 메모리는 머신의 실제 메모리와 기본 저장소 간에 버퍼를 제공합니다. 디스크에서 직접 불러오는 것보다 더 쉽게 접근할 수 있도록 유지하면서 기본 저장소의 일부를 사용하여 실제 메모리에서 데이터를 교환합니다. 가상 메모리 소진으로 인한 부작용은 Linux 시스템에 덜 일반적이지만 스왑 사용량도 모니터링하는 것이 중요합니다.
- 커밋된 메모리 - 시스템 커밋 메모리 용량은 머신의 실제 메모리와 특정 시점의 가상 메모리 크기를 합한 값입니다. 가상 메모리가 증가할 수 있으므로 커밋된 메모리 제한은 시간이 지남에 따라 변경될 수 있습니다. 머신의 커밋된 메모리 활용률이 100%에 가까워지면 실제 메모리와 가상 메모리가 모두 소진되어 더 많은 리소스가 필요함을 나타냅니다.
- 디스크 볼륨 사용 가능 공간 - 시스템, 응용프로그램 또는 시스템의 데이터 볼륨에 대한 디스크 공간이 부족하면 실행 중인 운영 체제 및 해당 볼륨에 종속된 응용프로그램 모두에 심각한 결과를 초래할 수 있습니다. 사용 가능한 공간을 모니터링하여 시스템에 디스크 공간이 부족하지 않은지 확인하고 비정상적인 발행 이벤트를 나타낼 수 있는 사용 공간이 크게 증가하는 시점을 확인합니다.
시스템을 모니터링할 때 네트워크 병목 현상이 엔터프라이즈급 네트워크 환경에서는 점점 드물긴 하지만 ArcGIS Enterprise 컴포넌트에 대한 최적의 응답 시간에 영향을 미칠 수 있다는 점에 유의합니다. 이는 모든 ArcGIS Enterprise 컴포넌트 및 등록된 기타 데이터 원본과 파일 서비스 간에 여러 내부 요청이 교환되는 다중 머신 환경에서 점점 더 가능해집니다.
가능한 경우 프로세서 및 메모리를 프로세스별 목록으로 나누어 지정된 시간 동안 급증하는 프로세스를 확인합니다. 모니터링에서 이러한 수준의 세분성을 사용할 경우 프로세스의 명령줄 부분을 통해 ArcGIS Enterprise 내부 컴포넌트를 서로 구별하거나 해당 컴포넌트를 예를 들어, 실시간 바이러스 백신 검사와 구별할 수 있습니다.
ArcGIS Enterprise 컴포넌트가 설치된 머신뿐만 아니라 배포가 올바르게 작동하기 위해 의존할 수 있는 모든 파일 서버 및 데이터베이스 인스턴스도 모니터링합니다. ArcGIS Enterprise 응용프로그램은 일반적으로 가장 낮은 리소스 사용 수준에서 시작됩니다. 응용프로그램에 접근하고 사용함에 따라 해당 리소스 사용은 리소스 활용률에 비례하여 확장됩니다.
리소스 지표 수집
기본 설정에 따라 대부분의 기본 Linux 배포에 포함되어 있지는 않지만 머신 리소스 지표의 질문 및 수집을 허용하는 여러 소프트웨어 패키지가 있습니다. 선택한 소프트웨어에 대한 카운터로 추가하여 배포의 모든 머신에 대해 최소한 이전 섹션에서 언급한 리소스 활용률 지표를 수집합니다. 서비스 성능이 저하되거나 중단되는 동안 폴링 빈도를 늘려 중단 조건에 이전에 발생하는 프로세스 및 이벤트에 대한 추가 통찰력을 확보할 수 있습니다.
리소스 지표 분석
수집 도구를 선택하고 해당 머신에 대한 리소스 활용률 데이터를 취득하면 리소스 지표를 분석할 수 있습니다. 리소스 지표를 분석할 때는 다음 사항을 검토합니다.
- 수명 문제 - 분리된 이벤트가 발생했는지 아니면 장기 이벤트가 발생했는지 파악하면 대부분의 상황에서 최적의 경로를 결정할 수 있습니다. 리소스 활용도의 단기적인 급증은 새로 출시된 대시보드 또는 웹 앱을 추가하거나 포털에 부서를 추가하는 등 특정 서비스에 대한 즉각적인 수요로 발생하는 경향이 있습니다. 현재 활용도에 대한 장기적인 증가는 플랫폼 및 관련 서비스 또는 응용프로그램의 선호도가 증가하고 있음을 나타낼 수 있습니다. 단기적인 급증은 다시 발생할 수도 있고 발생하지 않을 수도 있으므로 이러한 이벤트를 둘러싼 컨텍스트는 배포의 장기적 안정성을 높이기 위해 추가 리소스가 필요한지 여부를 결정하는 데 중요합니다.
- 시스템 리소스의 대부분을 사용하는 프로세스 - Portal for ArcGIS 및 ArcGIS Data Store 관점에서 활용도는 각각 플랫폼의 사용자 수 및 호스팅 서비스 사용에 따라 거의 선형적으로 확장되어야 합니다. ArcGIS Server를 고려할 때 전용 서비스 확장 및 호스팅 서비스 사용은 리소스 활용의 두 가지 주요 요인입니다. 전용 서비스는 ArcGIS Server 사이트에서 조정되어 전체 리소스 활용도를 줄일 수 있지만 시간이 지남에 따라 수요가 최고조에 도달할 때는 적절하지 않을 수 있습니다.
- 역할 분산 - ArcGIS Enterprise 배포 시 여러 머신에 역할을 분산하면 각 컴포넌트에 대해 리소스를 보다 신중하게 조정할 수 있고 문제가 발생한 경우 더 세부적으로 파악할 수 있습니다. 관계형 데이터 저장소 또는 호스팅 서버 머신에 대해서만 리소스를 늘리는 것이 단일 머신 기반 엔터프라이즈 배포를 위해 리소스를 늘리는 것보다 더 전략적일 수 있습니다. 사이트 결합 작업을 통해 현재 사이트 아키텍처를 조정하여 단일 머신에서 구축된 배포의 분산 아키텍처로 이동할 수 있습니다.
문제 해결
이제 시스템 리소스 지표를 식별, 추적, 분석할 수 있으므로 예기치 않은 시스템 응답을 처리할 수 있습니다. 즉, 할당된 프로세서 리소스를 늘리거나, 더 많은 RAM을 할당 또는 설치하거나, 디스크 공간을 늘릴 수 있습니다. 작업을 수행하기 전에 리소스 활용 문제를 해결하기 위한 모범 사례를 이해해야 합니다.
프로세서 활용
프로세서 활용률이 높은 머신에 할당된 프로세서 리소스를 늘리기 전에 활용률 급증의 원인이 시스템의 ArcGIS Enterprise 컴포넌트인지 또는 기타 소프트웨어인지 확인합니다. 실시간 스캐닝이 활성화된 보안 소프트웨어는 정상적인 웹 서버 및 데이터베이스 작업 중에 프로세서 활용률을 높일 수 있습니다. 이러한 경우 관측된 동작을 기반으로 사이버 보안 팀에 알립니다. 가상 머신의 경우 기본 호스트가 과도하게 프로비저닝되어 가상 머신에서 감지할 수 없는 성능 병목 현상이 발생할 수 있습니다.
실제 메모리 활용
실제 메모리 활용률이 100%에 가까워지면 머신에 더 많은 RAM을 할당하거나 설치해야 할 수 있습니다. 위에서 설명한 대로 전용 머신에서 워크로드를 분리하면 리소스를 보다 세부적으로 할당하고 현재 리소스 경합을 줄일 수 있지만 기존 머신의 메모리도 늘릴 수 있습니다. 실제 메모리 활용률이 100%에 가까워지면 사용 가능한 가상 메모리도 소진될 수 있습니다.
가상 및 커밋된 메모리 활용률
가상 및 커밋된 메모리 활용률은 일반적으로 활용률이 100%에 도달할 때 동일한 패턴을 나타냅니다. 가상 메모리를 사용하면 프로세스가 시스템에서 사용할 수 있는 메모리보다 더 많은 메모리를 사용할 수 있으며 일반적으로 프로비전된 머신을 담당하는 시스템 관리자가 정적으로 설정하지 않는 한 임계값으로 자동으로 확장됩니다. 페이지 파일을 확장하기에 충분한 디스크 공간이 있는 경우 시스템 설정을 수정하여 가상 메모리를 늘릴 수 있습니다.
사용 가능한 디스크 볼륨 공간
디스크 공간 소진은 ArcGIS Enterprise 배포 시 발생할 수 있는 가장 예측할 수 없는 오류 메소드 중 하나입니다. 업데이트 시도가 완료되지 않으면 파일이 비워지거나 잘릴 수 있으며, 이로 인해 소프트웨어가 제대로 시작되지 않을 수 있습니다. 먼저, 등록된 데이터 저장소 또는 기타 위치로 이동할 수 있는 대용량 파일을 검색합니다. 불필요한 파일을 제거할 수 없는 경우에는 디스크 공간을 늘려야 합니다. 시스템 디렉터리를 Portal for ArcGIS 사이트의 콘텐츠 디렉터리 또는 ArcGIS Server의 캐시 디렉터리와 같은 별도의 저장소로 마이그레이션할 수도 있습니다.
비고:
지정된 디렉터리 <directory>에 대해 크기(바이트)별로 상위 25개 파일을 확인하려면 해당 명령을 실행합니다.
sudo find <directory> -type f -printf '%s %p\n' | sort -nr | head -25
루트 볼륨에서 실행하면 시간이 오래 걸릴 수 있으므로 명령에 하위 디렉터리를 지정하는 것을 권장합니다.