Monitoring > System Monitoring > 콘솔 사용 가이드

콘솔 사용 가이드에서는 System Monitoring을 사용하는 데 필요한 기본적인 내용을 설명합니다. - 서버 대시보드 - 사용자 그룹 - 알림 그룹

서버 대시보드

Monitoring > System Monitoring > 서버 대시보드에서는 모니터링 대상 인스턴스 목록과 기본 지표 차트를 확인할 수 있습니다. 만약 모니터링할 수 있는 서버가 없을 때는 서버 목록이 비어 있습니다. 이때는 Compute > Instance에서 사용 중인 인스턴스가 정상적으로 동작하고 있는지, 또는 모니터링 대상 인스턴스에 System Monitoring Agent가 설치돼 정상적으로 동작하고 있는지 확인해야 합니다. Agent 설치 방법은 Agent 설치 방법 절을 참고해 주시기 바랍니다.

모니터링 대상 서버 인스턴스에 Agent가 정상적으로 설치돼 System Monitoring에서 지표 데이터가 수집되고 있다면 왼쪽의 서버 목록에 해당 인스턴스가 표시됩니다. 인스턴스를 선택하면 오른쪽 차트에서 수집된 지표 데이터를 확인할 수 있습니다.

서버 목록

서버 목록에서 원하는 서버를 선택해 각 서버의 지표를 확인할 수 있습니다. 서버 목록에는 서버의 호스트명, IP 그리고 모니터링 상태를 나타내는 상태 표시등이 나타납니다. 상태 표시등의 색깔은 현재 모니터링 상태에 따라 달라집니다.

  • 녹색: 정상
  • 노란색: 인스턴스 정보를 알 수 없으나, 모니터링은 진행되고 있는 상태
  • 붉은색: 가동 중인 인스턴스임에도 모니터링이 중단된 상태
  • 진한 회색: 작동이 중단된 인스턴스
  • 연한 회색: 삭제된 인스턴스

인스턴스와 Agent의 상탯값은 상태 표시등에 마우스 포인터를 올리면 나타나는 툴팁에서 확인할 수 있습니다.

Compute > Instance에서 삭제된 서버 인스턴스는 기본적으로 서버 대시보드의 서버 목록에는 나타나지 않습니다. 하지만 지표 데이터는 삭제하지 않고 보관합니다. 삭제된 인스턴스의 지표를 확인하려면 삭제된 서버도 보기를 선택합니다.

기본 레이아웃

처음 Monitoring > System Monitoring > 서버 대시보드에 나타나는 차트 배열은 기본 레이아웃입니다. 별도 설정 없이 이용할 수 있는 기본 레이아웃입니다. CPU Used, Memory Used(excepted cache/buffer), Disk, Network(In/Out bps) 차트를 보여줍니다. '기본 레이아웃'은 System Monitoring에서 기본적으로 제공하는 레이아웃이므로 사용자가 직접 차트를 구성할 수는 없습니다.

레이아웃 생성

새로운 지표를 추가하거나, 차트를 원하는 대로 배치하려면 새로운 레이아웃이 필요합니다. 레이아웃을 만들려면 서버 대시보드 상단의 레이아웃 만들기 버튼을 클릭합니다. 레이아웃은 프로젝트당 최대 5개까지 만들 수 있습니다.

레이아웃 만들기 창에서 이름을 입력한 후 생성 버튼을 클릭하면 새로운 레이아웃이 생성됩니다. 등록된 차트가 없기 때문에 빈 화면이 나타납니다. 새로운 차트를 추가하려면 화면 안내에 따라 차트 추가 버튼을 클릭합니다.

차트 생성

차트 추가 버튼을 클릭하면 선택 가능한 지표의 목록이 나타납니다.

오른쪽에는 현재 System Monitoring에서 제공하는 지표 목록이 나타나며, 이 중 하나를 선택하면 왼쪽에 차트 미리 보기가 표시됩니다. 추가 버튼을 클릭하면 선택한 차트가 레이아웃 하단에 추가됩니다.

직접 생성한 레이아웃은 사용자가 원하는 대로 차트의 위치와 크기를 조절할 수 있습니다. 사용자가 추가한 차트에는 아래와 같은 추가 기능이 제공됩니다.

  • 오른쪽 상단 아이콘 클릭: 레이아웃에서 차트를 삭제합니다.
  • 오른쪽 하단 아이콘 드래그: 차트의 크기를 조절할 수 있습니다.
  • 차트 제목 드래그: 차트의 위치를 변경할 수 있습니다.

생성한 레이아웃은 상단의 레이아웃 드롭다운 메뉴에서 선택할 수 있습니다.

레이아웃 수정/삭제

레이아웃 관리 버튼을 클릭하면 특정 레이아웃의 이름을 변경하거나 필요 없는 레이아웃을 삭제할 수 있습니다.

날짜 선택

수집된 지표 데이터는 최대 5년까지 보관됩니다. 오른쪽 상단의 달력 버튼을 클릭하여 조회할 범위를 설정합니다.

날짜 검색 창에서는 조회 기간으로 지정할 시작 일시(From)끝 일시(To)를 선택합니다. 시작 일시와 끝 일시를 선택하는 방식은 두 가지입니다. 첫 번째는 직접 일시를 선택하는 방식입니다. 시작 일시, 끝 일시를 클릭하면 별도의 일시 선택 창이 나타납니다. 일시 선택 창에서 직접 일시를 지정할 수 있습니다.

두 번째 방법은 단축 버튼을 사용하는 방식입니다. 각 일시 버튼 아래에는 현재, 1시간, 1일 등의 별도 버튼이 있습니다. 원하는 버튼을 클릭해 기간 범위를 지정할 수 있습니다. 단축 버튼을 클릭하면 아래에 어떤 날짜 범위의 데이터를 가져올지 안내가 나타납니다.(예시: 7일 이전부터 현재까지의 데이터를 검색합니다.)

날짜 선택 창과는 별개로 또 다른 날짜 범위 선택 방법은 차트에서 직접 조회 기간을 선택하는 것입니다. 차트 내에서 보려는 시기를 가로로 드래그하면 영역이 선택되어 해당 영역 기간 내의 데이터를 확인할 수 있습니다. 차트 내에서 특이한 모습을 보인 구간을 선택해 집중적으로 살펴볼 수 있습니다.

사용자 그룹

Monitoring > System Monitoring > 사용자 그룹에서는 System Monitoring에서 모니터링하는 대상 중 특정 이벤트가 발생했을 때 알림을 받을 대상을 지정할 수 있습니다. 프로젝트를 멤버 중 알림을 받을 멤버를 선택할 수 있으며, 알림을 받을 사용자를 여러 그룹으로 묶어서 관리할 수 있습니다.

사용자 그룹이 없으면 처음 사용자 그룹을 조회할 때 빈 화면이 나타납니다. System Monitoring에서 알림을 받으려면 화면에서 안내하는 대로 사용자 그룹을 추가해야 합니다.

사용자 그룹 생성

사용자 그룹을 만들려면 Monitoring > System Monitoring > 사용자 그룹에서 그룹 만들기 버튼을 클릭합니다.

그룹 만들기 창에서 이름을 입력한 후 생성 버튼을 클릭하면 사용자 그룹이 생성됩니다. 그리고 자동으로 다음 단계로 넘어가 프로젝트 멤버를 사용자 그룹에 추가할 수 있습니다.

사용자 그룹 편집 창 하단에는 현재 프로젝트에 속한 사용자 목록이 표시됩니다. 사용자 목록의 각 항목 오른쪽에 있는 추가 버튼을 클릭하여 해당 사용자 그룹에 추가할 수 있습니다. 추후 연동할 알림 그룹에서 사용자 그룹에 속한 사용자에게 알림을 보내도록 설정할 수 있습니다.

사용자 그룹을 만든 후 Monitoring > System Monitoring > 사용자 그룹에서 사용자 그룹 목록을 조회할 수 있습니다.

사용자 그룹 수정

이미 생성된 사용자 그룹을 수정하려면 사용자 목록 그룹에서 편집 버튼을 클릭합니다. 편집 버튼을 클릭하면 사용자 그룹 편집 창이 나타납니다. 생성 단계와 동일한 방법으로 사용자 그룹의 멤버를 수정할 수 있습니다.

사용자 그룹 이름을 수정하려면 사용자 그룹 이름 오른쪽의 연필 아이콘을 클릭하면 됩니다.

알림 그룹

알림 그룹은 Monitoring > System Monitoring > 알림 그룹에서 관리할 수 있습니다. 알림 그룹의 역할 두 가지는 다음과 같습니다. - 각 시스템 지표에 임계치를 설정할 수 있습니다. System Monitoring에서는 시스템 지표에 임계치를 설정한 것을 감시 설정이라고 합니다. 선택한 시스템 지표가 임계치에 도달하면 지정한 사용자 그룹에 알림이 통보됩니다. - 생성한 감시 설정을 모니터링 대상 서버와 연동하고 통보 대상이 될 사용자 그룹을 연동할 수 있습니다. 실질적으로 알림 그룹은 서버 대시보드와 사용자 그룹을 연결하는 역할이라 할 수 있습니다.

알림 그룹이 없으면 처음 알림 그룹을 조회할 때 빈 화면이 나타납니다. 시스템 지표에 임계치를 설정하고 원하는 사용자 그룹으로 알림을 보내려면 화면에서 안내하는 대로 알림 그룹을 추가해야 합니다.

알림 그룹 생성

그룹 만들기 버튼을 클릭해 신규 알림 그룹을 생성할 수 있습니다.

그룹 만들기 창에서 그룹 이름을 입력하고 생성 버튼을 클릭하면 알림 그룹이 추가됩니다.

감시 설정 등록/수정/삭제

감시 설정을 등록하려면 알림 그룹 항목의 버튼 중 왼쪽의 감시 설정 추가 버튼을 클릭합니다. 감시 설정이 등록되지 않았다면 아무 내용도 표시되지 않습니다. 신규 감시 설정을 추가하려면 감시 설정 추가 버튼을 클릭합니다. 새로운 감시 설정 입력란이 추가되며, 감시 설정이 저장되지는 않습니다. 원하는 시스템 지표에 임계치를 지정하고 저장 버튼을 클릭하면 최종적으로 감시 설정이 저장됩니다. 취소 버튼을 클릭하면 입력란은 제거됩니다.

저장된 감시 설정은 오른쪽의 연필 아이콘을 클릭해 다시 수정할 수 있으며, 휴지통 아이콘을 클릭하면 삭제할 수 있습니다.

현재 감시 설정 가능한 시스템 지표의 항목은 다음과 같습니다.

항목 단위 비교 방식 추가 요굿값
리부트 리부트 - -
CPU: Used % 이상/이하 -
CPU: Idle % 이상/이하 -
CPU: User % 이상/이하 -
CPU: System % 이상/이하 -
CPU: nice % 이상/이하 -
CPU: irq % 이상/이하 -
CPU: softirq % 이상/이하 -
CPU: io wait % 이상/이하 -
Load Average: 1 Min - 이상/이하 -
Load Average: 5 Min - 이상/이하 -
Load Average: 15 Min - 이상/이하 -
Memory: Used % 이상/이하 -
Memory: Used MB 이상/이하 -
Memory: Free MB 이상/이하 -
Memory: Buffers MB 이상/이하 -
Memory: Cached MB 이상/이하 -
Memory: pgpgin KB/s 이상/이하 -
Memory: pgpgout KB/s 이상/이하 -
Swap: Used % 이상/이하 -
Swap: Total MB 이상/이하 -
Swap: Used MB 이상/이하 -
Disk: Read Counts 이상/이하 -
Disk: Write Counts 이상/이하 -
Disk: Read Bytes 이상/이하 -
Disk: Write Bytes 이상/이하 -
File System: Used MB 이상/이하 파티션명
File System: Avail MB 이상/이하 파티션명
File System: Used % 이상/이하 파티션명
File System: i-node Used % 이상/이하 파티션명
File System: Mount - 포함/불포함 -
Network: Recv Bytes/s 이상/이하 인터페이스명
Network: Send Bytes/s 이상/이하 인터페이스명
Network: Recv Packets pps 이상/이하 인터페이스명
Network: Send Packets pps 이상/이하 인터페이스명
Network: Recv Error Counts 이상/이하 인터페이스명
Network: Send Error Counts 이상/이하 인터페이스명
Network: Collision Counts 이상/이하 인터페이스명
User: User Count - 이상/이하 인터페이스명
Process: Total Count - 이상/이하 -
Process: Down - - -
Process: Count - 이상/이하 프로세스명
Process: CPU % 이상/이하 프로세스명
Process: Memory % 이상/이하 프로세스명
Process: Memory KB 이상/이하 프로세스명
Process: Thread Count - 이상/이하 프로세스명
Process: Restart - - 프로세스명
File: Content TEXT 포함/불포함 File Path
File: Size KB 이상/이하 File Path
File: Modification - - File Path
File: Non-Modification - - File Path
File: Non-Exist - - File Path

각 감시 항목은 고유한 값 단위를 가지고 있고 항목에 따라서 임계치 외에 추가로 값을 요구할 수도 있습니다.

감시 설정 지속 시간

감시 설정의 지속 시간은 중요한 요소입니다. 지속 시간은 감시 대상이 지정한 임계치에 도달한 후 그 상태가 지속되는 시간을 조건으로 지정할 때 사용합니다. 예를 들어, CPU 사용률의 임계치가 90% 이상이고 지속 시간이 5분이라면, 해당 알림 그룹과 연동된 서버의 CPU 사용률이 90% 이상인 상태가 5분 이상 지속되었을 때 사용자 그룹에 정의된 사용자들에게 알림을 보냅니다. 만약 CPU 사용률이 90% 이상이 되어도, 5분 이내에 90% 미만으로 떨어지면 알림이 발생하지 않습니다.

감시 대상 및 통보 대상 설정

앞에서 정의한 감시 설정을 적용할 모니터링 대상 서버와 감시 조건이 충족되면 알림을 받을 사용자 그룹을 연결할 수 있습니다. 감시 설정 버튼 오른쪽의 서버 및 사용자 그룹 연동 버튼을 클릭합니다.

상단에서는 해당 알림 그룹에 정의된 감시 설정을 반영할 서버를 지정합니다. 하단에서는 감시 조건 충족 시 알림을 받을 사용자 그룹을 지정합니다. 선택을 해제하려면 서버 또는 사용자 그룹 이름 오른쪽의 X 버튼을 클릭하거나 드롭다운 메뉴에서 재선택해 선택을 해제할 수 있습니다.

이후 Monitoring > System Monitoring > 알림 그룹에서 설정한 알림 그룹 목록을 조회할 수 있습니다.

월간 지표 보고서

월간 지표 보고서는 Monitoring > System Monitoring > 월간 지표 보고서에서 이용할 수 있습니다.

GENERAL 보고서 타입

  • 서버 대시보드 기준 월간 지표 보고서를 생성합니다.
  • CPU평균, CPU최대, 메모리평균, 메모리최대, 네트워크 송신, 네트워크 수신, 파일시스템 사용률 중 하나 이상의 지표를 선택할 수 있습니다.
  • 주기는 5분, 30분, 2시간, 1일 중 하나를 선택할 수 있으며, 선택한 주기에 따라 선택할 수 있는 의 값이 달라집니다(최대 6개월 전 까지 선택 가능).
  • 다운로드 요청을 클릭하여 보고서 생성을 요청합니다. 생성된 목록은 보고서 생성 요청 현황에서 확인할 수 있습니다.
  • 보고서 생성은 비동기적으로 진행되므로 생성이 완료될 때까지는 다운로드할 수 없습니다.

PROMQL 보고서 타입

  • OpenMetrics 대시보드 기준 월간 지표 보고서를 생성합니다.
  • 지표는 PROMQL 쿼리를 사용합니다. 이는 OpenMetrics 대시보드의 차트에서 사용하는 것과 동일하며, 자세한 예시는https://prometheus.io/docs/prometheus/latest/querying/basics/에서 확인할 수 있습니다.
  • 주기는 5분, 30분, 2시간, 1일 중 하나를 선택할 수 있으며, 선택한 주기에 따라 선택할 수 있는 의 값이 달라집니다(최대 6개월 전 까지 선택 가능).
  • 다운로드 요청을 클릭하여 보고서 생성을 요청합니다. 생성된 목록은 보고서 생성 요청 현황에서 확인할 수 있습니다.
  • 보고서 생성은 비동기적으로 진행되므로 생성이 완료될 때까지는 다운로드할 수 없습니다.

Agent 설치 방법

Linux와 Windows에 Agent를 설치하는 방법은 다음과 같습니다.

Linux

  1. root 권한이 있어야 합니다.
  2. 아래 경로에서 인스턴스 내 설치 스크립트가 있는지 확인합니다.

    • 경로: /opt/toast-sysmon-install.sh
  3. 확인 결과 파일이 없다면 아래 링크에서 다운로드합니다.

    • https://static.toastoven.net/toastcloud/sdk_download/monitoring/toast-sysmon-install.sh
  4. 서버에서 설치 스크립트를 실행합니다. 설치가 완료되면 자동으로 모니터링이 시작됩니다.

Windows

  1. 관리자(Administrator) 권한이 있어야 합니다.
  2. 아래 경로에서 인스턴스 내 설치 스크립트가 있는지 확인합니다.

    • 겅로: C:\Program Files(x86)\NHN\toast-sysmon-install.ps1
  3. 확인 결과 파일이 없다면 아래 링크에서 다운로드합니다.

    • https://static.toastoven.net/toastcloud/sdk_download/monitoring/toast-sysmon-install.ps1
  4. 서버에서 toast-sysmon-install.ps1파일을 마우스 오른쪽 버튼으로 클릭한 뒤 PowerShell 스크립트로 실행을 선택하면 설치 과정이 처음부터 이루어지며 Windows 서비스로 등록됩니다.

    • WindowsAgent
  5. 설치가 완료되면 자동으로 모니터링이 시작됩니다.

Windows Agent 동작 확인

  1. Windows 작업 관리자에서 Agent의 동작 여부를 확인합니다.
  2. Windows 작업 관리자의 세부 정보 탭에서 toastmon.exe의 동작 여부를 확인합니다.
  3. WindowsAgent

Windows Agent 재설치

  • Windows Agent를 재설치하려면 이미 설치되어 있는 Agent를 삭제한 뒤 재설치해야 합니다.

Windows Agent 삭제

  1. C:\Program Files (x86)\NHN\TOAST에 Agent 관련 파일이 위치합니다.
  2. Agent 삭제를 위해 C:\Program Files (x86)\NHN\TOAST의 uninst.exe를 실행합니다.
    • WindowsAgent
TOP