대시보드
Kubernetes 클러스터의 전체 현황을 실시간으로 한눈에 파악하는 화면입니다.

개요
대시보드는 모니터링 중인 Kubernetes 클러스터의 리소스 사용 상태, 워크로드(Workload) 상태, Pod 현황, 이 벤트 등을 실시간으로 보여주는 메인 화면입니다. 클러스터에 이상이 없는지 빠르게 확인하거나, 문제 발생 시 어느 영역에서 시작되었는지 파악하는 데 활용합니다.
좌측 사이드바에서 대시보드 메뉴를 클릭하면 진입할 수 있습니다. 대시보드는 실시간 전용 화면으로, 상단의 시간 선택기는 비활성화됩니다.
화면 구성
대시보드는 다음과 같은 영역으로 구성됩니다.
| 영역 | 설명 |
|---|---|
| 상단 헤더 | 실시간 모드 표시, 카테고리 필터, 네임스페이스 필터, 전체 화면 버튼 |
| 클러스터 리소스 게이지 | 클러스터 전체 CPU, 메모리, 디스크, Pod 사용 현황 |
| 클러스터 상태 카드 | 서버(노드), Pod, 워크로드, 인시던트, 배포의 현황 요약 |
| 네임스페이스 리소스 배분 | 네임스페이스별 리소스 사용 비중 트리맵 |
| Pod 맵 | 전체 Pod의 상태를 타일로 시각화 |
| 리소스 상위 소비자 | CPU, 메모리를 가장 많이 사용하는 워크로드 목록 |
| 노드 히트맵 | 서버(노드)별 리소스 사용률 히트맵 |
| 클러스터 이벤트 | 최근 발생한 Kubernetes 이벤트 목록 |
| 리소스 추세 | 시간대별 클러스터 리소스 사용량 추이 차트 |
주요 기능
실시간 모드
대시보드는 실시간 전용 화면입니다. 글로벌 헤더 우측의 시간 선택기가 ((•)) 실시간 모드로 표시되며, 시간 범위 선택이 비활성화됩니다. 서버와 WebSocket으로 연결되어 클러스터 데이터가 자동으로 갱신됩니다.
다른 화면(애플리케이션, SRE 보고서 등)으로 이동하면 시간 선택기가 시계 아이콘으로 바뀌며 조회 기간을 직접 선택할 수 있습니다. 대시보드로 돌아오면 다시 실시간 모드로 전환됩니다.
카테고리 및 네임스페이스 필터
대시보드 상단 헤더에서 카테고리와 네임스페이스를 선택하여 특정 범위의 리소스만 표시할 수 있습니다.
- 카테고리 필터: 드롭다운에서 카테고리를 선택하면, 해당 카테고리에 속하는 애플리케이션의 데이터만 대시보드에 표시됩니다. 클러스터 상태 카드, 네임스페이스 리소스 배분, Pod 맵, 리소스 상위 소비자 등 모든 영역이 선택한 카테고리 기준으로 갱신됩니다. X 버튼을 클릭하면 필터가 해제됩니다.
- 네임스페이스 필터: 특정 네임스페이스를 선택하면, 해당 네임스페이스의 데이터만 표시됩니다. 기본값은 전체 네임스페이스입니다.
참고: 네임스페이스(Namespace)는 Kubernetes에서 리소스를 논리적으로 구분하는 단위입니다.
클러스터 리소스 게이지
클러스터 전체의 리소스 사용 현황을 원형 게이지로 보여줍니다. 다음 네 가지 항목이 표시됩니다.
| 게이지 | 설명 |
|---|---|
| CPU | CPU 사용률(%). 현재 사용량 / 전체 용량 |
| Memory | 메모리 사용률(%). 현재 사용량 / 전체 용량 |
| Disk | 디스크 사용률(%). 현재 사용량 / 전체 용량 |
| Pods | Pod 사용 비율(%). 현재 Pod 수 / 최대 허용 Pod 수 |
각 게이지는 사용률에 따라 색상이 달라집니다.
| 색상 | 기준 | 의미 |
|---|---|---|
| 초록색 | 75% 미만 | 정상 |
| 노란색 | 75% 이상 90% 미만 | 주의 |
| 빨간색 | 90% 이상 | 위험 |
게이지 아래에는 현재 사용량과 전체 용량이 수치로 표시됩니다(예: 2.5 / 8.0 cores, 12.3 / 32.0 GB).
게이지 상세 툴팁
게이지 위에 마우스를 올리면 상세 툴팁이 나타나며, 다음 정보를 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| Usage | 현재 사용량과 게이지 바 |
| Capacity | 전체 용량 |
| Available | 잔여 가용량 |
| Request | 요청량 (CPU, 메모리만 해당) |
| Limit | 제한량 (CPU, 메모리만 해당) |
클러스터 상태 카드
클러스터의 핵심 현황을 5개의 카드로 요약합니다. 각 카드를 클릭하면 관련 상세 화면으로 바로 이동할 수 있습니다.
| 카드 | 주요 수치 | 하위 항목 | 클릭 시 이동 |
|---|---|---|---|
| Nodes | Ready 수 / 전체 수 | Ready, NotReady | 서버 목록 |
| Pods | 전체 Pod 수 | Running, Pending, Failed | 토폴로지 맵 |
| Workloads | Available 수 / 전체 수 | Healthy, Unhealthy | 애플리케이션 목록 |
| Incidents | 활성 인시던트 수 | Unresolved | 인시던트 목록 |
| Deploys | 최근 1시간 배포 수 | In Progress, Stuck | 배포 목록 |
카드 테두리 색상은 상태에 따라 달라집니다.
- 기본 테두리: 문제가 없는 정상 상태
- 빨간색 테두리: NotReady 서버 또는 Failed/CrashLoop Pod가 있는 경우
- 노란색 테두리: Unhealthy 워크로드, 활성 인시던트, 또는 지연된 배포가 있는 경우
- 파란색 테두 리: 진행 중인 배포가 있는 경우
네임스페이스 리소스 배분
각 네임스페이스가 클러스터 자원을 얼마나 사용하고 있는지 트리맵으로 시각화합니다. 타일의 크기가 클수록 해당 네임스페이스의 자원 점유 비중이 높습니다.
메트릭 전환
패널 상단의 드롭다운에서 표시할 메트릭을 선택할 수 있습니다.
| 메트릭 | 타일 크기 기준 | 타일 내 표시 값 |
|---|---|---|
| SLO Status | 전체 SLO 수 | SLO 위반율 (Warning+Critical / 전체) |
| CPU Usage | CPU 사용량 | 사용량 / Request 비율 |
| Memory Usage | 메모리 사용량 | 사용량 / Request 비율 |
| Pod Count | Pod 수 | 네임스페이스별 Pod 수 |
타일 색상
CPU, Memory 메트릭 기준일 때 타일 색상은 Request 대비 사용률을 나타냅니다.
| 색상 | 기준 | 의미 |
|---|---|---|
| 초록색 | 75% 미만 | 정상 |
| 노란색 | 75% 이상 90% 미만 | 주의 |
| 빨간색 | 90% 이상 | 과다 사용 |
| 회색 | Request 미설정 | 사용률 표시 불가 (절대 사용량만 표시) |
SLO 메트릭 기준일 때는 SLO 위반율에 따라 초록(OK)/노란(Warning)/빨간(Critical)색으로 표시됩니다.
SLO 상태 표시점
타일 우측 상단에 작은 점이 표시될 수 있습니다. 이 점은 해당 네임스페이스 내 SLO 상태를 나타냅니다.
- 노란 점: SLO 경고 상태가 존재합니다.
- 빨간 점 (깜빡임): SLO 심각 상태가 존재합니다.
상세 툴팁
타일 위에 마우스를 올리면 상세 툴팁이 표시됩니다.
- 네임스페이스 이름과 사용률 뱃지
- Share: 전체 대비 해당 네임스페이스의 비중(%)
- 선택한 메트릭 값 (예: CPU 사용량, Pod 수)
- CPU 사용 현황: 현재 사용량과 게이지 바, Request/Limit 값
- 메모리 사용 현황: 현재 사용량과 게이지 바, Request/Limit 값
- Pod 수: 해당 네임스페이스의 Pod 수
- SLO 현황: SLO가 설정된 경우 OK/Warning/Critical 개수와 준수율