분산추적
프로젝트 전체의 추적(Trace) 데이터를 탐색하고, 서비스 간 요청 흐름을 분석하는 화면입니다.

개요
분산추적 화면은 마이크로서비스 환경에서 요청이 여러 서비스를 거치는 전체 경로를 시각화합니다. 추적(Trace)은 분산 시스템에서 하나의 요청이 여러 서비스를 거치는 경로를 기록한 데이터입니다.
히트맵(Heatmap)으로 추적 데이터의 분포를 한눈에 파악하고, 응답 시간이 느린 요청이나 오류가 발생한 요청을 빠르게 식별할 수 있습니다. 선택한 영역을 드릴다운하여 개별 추적의 스팬(Span) 상세까지 확인할 수 있습니다.
좌측 사이드바에서 분산추적 메뉴를 클릭하면 진입할 수 있습니다.
스팬 폭포수 차트

추적 목록에서 추적 ID나 이름을 클릭하면, 해당 추적의 스팬 폭포수 차트(Span Waterfall Chart)가 다이얼로그로 열립니다. 스팬 폭포수 차트는 요청이 각 서비스를 거치는 순서와 소요 시간을 시각화하며, 분산추적의 핵심 분석 도구입니다.
다이얼로그 상단에 추적의 요약 정보(시작 시간, 응답 시간, 상태)가 표시되고, 차트는 좌측의 서비스 & 작업 영역과 우측의 시간축 영역으로 구성됩니다.
- 가로 막대의 시작 위치는 스팬이 시작된 시점, 길이는 해당 스팬의 소요 시간을 나타냅니다.
- 각 스팬의 서비스 이름은 고유한 색상으로 구분됩니다.
- 자식 스팬은 들여쓰기로 계층 구조를 표현합니다. 상위 스팬의 이름을 클릭하면 하위 스팬을 접거나 펼칠 수 있습니다.
- 오류가 발생한 스팬에는 오류 아이콘이 표시됩니다.
- 하위 추적 보기 / 전체 추적 보기를 전환하여, 특정 서비스의 하위 스팬만 보거나 전체 추적을 볼 수 있습니다.
스팬에 마우스를 올리면 서비스명, 오퍼레이션명, 응답 시간, 상태, 자식 스팬 수, 유형(HTTP, gRPC, Kafka 등) 정보가 툴팁으로 표시됩니다.
스팬 상세 정보
스팬의 가로 막대 또는 정보 버튼을 클릭하면 해당 스팬의 상세 정보 다이얼로그가 표시됩니다.
| 항목 | 설명 |
|---|---|
| 이름 | 스팬의 오퍼레이션 이름 |
| 서 비스 | 스팬이 속한 서비스 이름 |
| 시작 시간 | 스팬 시작 시각 |
| 응답시간 | 스팬 소요 시간 (밀리초) |
| 상태 | 정상(OK) 또는 오류(Error) 및 메시지 |
| 스팬 ID | 스팬의 고유 식별자 (복사 가능) |
| 상세 | 프로토콜별 상세 정보 (SQL 쿼리, HTTP 요청 등). 구문 강조가 적용되며 복사할 수 있습니다. |
| 속성 | 스팬에 첨부된 속성 목록 (HTTP URL, DB 쿼리 등). 각 값을 개별 복사할 수 있습니다. |
| 이벤트 | 스팬 실행 중 발생한 이벤트 (예: 예외 스택 정보). 이벤트 발생 시점이 스팬 시작 이후 경과 시간으로 표시됩니다. |
스팬 유형은 배지로 표시됩니다. 지원하는 유형은 다음과 같습니다.
| 유형 | 설명 |
|---|---|
| HTTP | HTTP 요청/응답 |
| gRPC | gRPC 호출 |
| Kafka | Kafka 메시지 처리 |
| Redis | Redis 명령 |
| Mongo | MongoDB 쿼리 |
| PG | PostgreSQL 쿼리 |
| MySQL | MySQL 쿼리 |
| CH | ClickHouse 쿼리 |
| ZK | ZooKeeper 작업 |
| MC | Memcached 작업 |
화면 구성
| 영역 | 설명 |
|---|---|
| 상단 헤더 | OpenTelemetry 통합 버튼 |
| 히트맵 | X축(시간) x Y축(응답 시간) 분포 차트. 드래그로 범위 선택 가능 |
| 탭 | 개요 / 추적 / 오류 원인 / 응답 시간 탐색기 / 속성 비교 |
| 필터 패널 | 서비스명, 스팬명, 추적 ID 등의 필터 조건 설정 |
| 차트 선택 표시 | 히트맵에서 선택된 시간·응답 시간 범위 표시 |
| 기준선 표시 | 속성 비교, 응답 시간 탐색기 탭에서 선택 영역 외의 비교 기준 표시 |
| 옵션 | 보조 요청 제외 설정 |
| 콘텐츠 영역 | 탭별 분석 결과 표시 |
주요 기능
히트맵 읽는 법
히트맵(Heatmap)은 시간과 응답 시간의 분포를 색상 밀도로 시각화합니다. 가로축(X축)은 시간, 세로축(Y축)은 추적의 응답 시간을 나타냅니다. 각 셀의 색상은 해당 시간대·응답 시간 범위에 속하는 요청의 밀도를 표현합니다.
- 색상이 진할수록 해당 시간대에 해당 응답 시간 범위의 요청이 많이 발생했음을 의미합니다.
- 색상이 위쪽에 집중되어 있으면, 응답 시간이 긴 요청이 많다는 뜻입니다.
- 특정 시간대에 붉은 점이 나타나면, 그 시점에 오류가 발생했음을 나타냅니다.
- 정상적인 상태에서는 대부분의 점이 **아래쪽(낮은 응답 시간)**에 집중됩니다.
히트맵 좌측 상단에 색상 범례가 표시됩니다. 범례의 왼쪽(밝은색)은 요청이 적은 영역, 오른쪽( 진한색)은 요청이 많은 영역을 나타냅니다.
SLO 응답 시간 목표가 설정된 경우, 히트맵에 목표 임계값 라인이 표시됩니다. 이 라인 위의 요청은 SLO 목표를 초과한 요청입니다.
히트맵 우측의 확대 버튼을 클릭하면 전체 화면 모드에서 히트맵을 더 넓게 확인할 수 있습니다.
히트맵 영역 선택
히트맵에서 마우스로 드래그하여 특정 시간·응답 시간 범위를 선택할 수 있습니다. 선택하면 해당 범위의 추적 데이터만 탭에 표시됩니다.
- 히트맵에서 조사하려는 영역을 마우스로 클릭한 채로 드래그합니다.
- 선택된 범위가 차트 선택 행에 시간 범위와 응답 시간 범위 태그로 표시됩니다.
- 오류 영역을 선택한 경우 오류 태그도 함께 표시됩니다.
- 탭의 콘텐츠가 선택한 범위 기준으로 자동 갱신됩니다.
- 선택을 취소하려면 차트 선택 행의 선택 해제 버튼을 클릭합니다.
팁: 응답 시간이 급증한 영역(히트맵 위쪽의 점 클러스터)을 선택한 뒤 추적 탭이나 오류 원인 탭을 확인하면 문제의 원인을 빠르게 파악할 수 있습니다.