칵테일클라우드
  • Cocktail Cloud란?
  • 개요
    • 쿠버네티스와 칵테일 클라우드
    • 개념 이해
      • 플랫폼
      • 워크스페이스
      • 클러스터
      • 서비스 맵
      • 이미지/빌드
      • 카탈로그
      • 보안
      • 모니터링
  • 시작하기
    • 클러스터 등록
    • 워크스페이스 만들기
  • 어플리케이션
    • 어플리케이션 배포
    • 서비스 노출
    • 설정 정보 관리
    • 볼륨과 영구 볼륨 사용
    • CI/CD 파이프라인 구성
    • 서비스 메시 구성
    • 애플리케이션 모니터링
    • 카탈로그
  • 플랫폼 관리
    • 멀티 클러스터 구성
    • 클러스터 관리
    • 워크스페이스 관리
    • 보안
    • 통합 모니터링
    • 플랫폼 설정
  • 칵테일 클라우드 브랜드 페이지
  • 칵테일 클라우드 앱스
Powered by GitBook
On this page
  • 어떤 유형의 자원을 모니터링 할 수 있나요?
  • 모니터링 정보는 어디에서 확인 할 수 있나요?
  • 클러스터 상태는 어떻게 확인하기
  • 인그레스 상태 확인 하기
  • ETCD 상태 확인 하기
  • 노드 상태 확인 하기
  • 네임스페이스 상태 확인 하기
  • 알림/이벤트 이력 확인 하기

Was this helpful?

Export as PDF
  1. 플랫폼 관리

통합 모니터링

Previous보안Next플랫폼 설정

Last updated 4 years ago

Was this helpful?

어떤 유형의 자원을 모니터링 할 수 있나요?

칵테일 클라우드는 멀티클러스터 환경에서 발생하는 자원과 상태에 대한 200여개의 매트릭값을 활용하여 100여개의 모니터링 패널을 제공합니다.

각각의 패널은 클러스터, 인그레스, ETCD, 노드, 네임스페이스 뷰 배치하여 제공합니다. 또한, 알람/이벤트 페이지를 추가로 제공하며, 발생한 알람/이벤트에 대하여 시간순으로 확인하고 사용자 플랫폼 현황의 가시화를 극대화 합니다.

모니터링 정보는 어디에서 확인 할 수 있나요?

칵테일 클라드 모니터링 정보는 ←대시보드 메뉴에서 확인 할 수 있습니다. 하위 메뉴로는 클러스터, 인그레스, ETCD, 노드, 네임스페이스, 알림/이벤트 가능을 제공합니다.

클러스터 상태는 어떻게 확인하기

클러스터 단위로 최신의 상태 정보를 제공합니다. 클러스터 뷰에서 대표적으로 제공되는 상태 정보는 아래와 같습니다.

  • 현재 연결 수 총계

  • CPU 사용량

  • 디스크 사용량

  • 디스크 I/Os

  • 메모리 사용량

  • 리스타트 된 Pod 추적

  • 초당 평균 요청 시간

  • 실행 중인 Pod 추이

  • Top 5 CPU 집중 사용 Pod

  • Top 5 메모리 집중 사용 Pod

인그레스 상태 확인 하기

인그레스는 클러스터 외부에서 클러스터 내부 서비스로 HTTP와 HTTPS 경로를 노출합니다. 인그레스는 외부에서 서비스로 접속이 가능한 URL, 로드 밸런스 트래픽, SSL / TLS 종료 그리고 이름 기반의 가상 호스팅을 제공하도록 구성할 수 있습니다. 인그레스는 서비스에서 네트워크 영역에 중요한 역할을 담당하고 있어 다각도의 모니터링이 필수입니다.

통합대시보드의 인그레스 뷰에서 제공되는 상태 정보는 아래와 같습니다.

  • 인그레스 컨트롤러 요청

  • 인그레스 컨트롤러 연결

  • 인그레스 컨트롤러 요청 성공률

  • 최근 인그레스 설정 리로드 성공 및 실패

  • 인그레스 컨트롤러 요청 추이

  • 인그레스 컨트롤러 성공율 추이

  • 네트워크 I/O 추이

  • 평균 메모리 사용량 추이

  • 평균 CPU 사용량 추이

ETCD 상태 확인 하기

통합대시보드의 ETCD 뷰에서 제공하는 상태 정보는 아래와 같습니다.

  • ETCD 리더 존재 여부

  • 최근 리더 변경 횟수

  • 최근 리더 변경 제안 실패 횟수

  • gRPC 성공율

  • DB 사용량

  • 동기화 시간

  • 클라이언트 트래픽 In/Out

노드 상태 확인 하기

통합대시보드의 노드 뷰에서 제공하는 상태 정보는 아래와 같습니다.

  • 클러스터 CPU 사용 빈도

  • 클러스터 메모리 사용량

  • 클러스터 디스크 사용량

  • 클러스터 네트워크 사용량

  • 클러스터 업타임

네임스페이스 상태 확인 하기

통합대시보드의 네임스페이스 뷰에서 제공하는 상태 정보는 아래와 같습니다.

  • 네임스페이스 서비스레벨 목표(SLO)율 추이

  • 네임스페이스 잔존 실패 허용 시간(Error budget)

  • 네임스페이스 총 Pod 수

  • 네임스페이스 생성 시간

  • 네임스페이스 사용 메모리 총량

  • 네임스페이스 안에 실행 중인 Pod 수

알림/이벤트 이력 확인 하기

통합대시보드에서 모니터링하는 매트릭정보는 사용자 설정에 따라 대시보드, SMS, E-Mail 채널을 통해 전달되며 클러스터, 네임스페이스, 주요 자원 그룹 으로 필터링하여 조회할 수 있는 기능을 제공합니다.

대시보드에서는 발생한 이벤트를 한 시간단위로 조회하여 확인 할 수 있으며, 매 분 단위로 누적된 이벤트를 상세한 이벤트 설명을 포함하여 제공하므로, 이벤트 내용만으로 원인을 신속히 확인 할 수 있습니다.

각 이벤트는 심각도에 따라 5단계로 구분하여 표시되며, 사용자 설정에 따라 SMS 또는 E-Mail(혹은 양쪽 모두) 을 통해 실시간으로 알림을 전송합니다. 최근 발생한 이벤트와 알림은 필터 기능을 이용하여 조회 할 수 있으며, 사용자 설정에 따라 최대 1년까지 보관 가능합니다.

[화면] 통합 모니터링 대시보드 메인
[화면] 클러스터 모니터링
[화면] 인그레스 모니터링
[화면] ETCD 모니터링
[화면] 노드 모니터링
[화면] 네임스페이스 모니터링
[화면] 알람 및 이벤트