InfoGrab DocsInfoGrab Docs

Stage 그룹을 위한 Observability

GitLab.com SaaS 플랫폼에서 Stage 그룹별 Observability 대시보드, 에러 예산, Kibana 분석 및 OpenTelemetry 계측 방법을 설명합니다.

Observability는 시스템에 가시성을 부여하여 각 컴포넌트의 상태를 컨텍스트와 함께 파악하고, 성능 튜닝 및 디버깅을 지원하는 것입니다. SaaS 플랫폼을 대규모로 운영하려면 풍부하고 세밀한 Observability 플랫폼이 필요합니다. Stage 그룹 에 정보를 제공하기 위해, 우리는 기능 카테고리별로 메트릭을 집계한 뒤 그룹에 맞춤화된 대시보드 에 이 정보를 표시합니다. 그룹이 구축한 기능에 대한 메트릭만 해당 그룹의 대시보드에서 볼 수 있습니다. 필터링된 뷰를 통해 그룹은 집계 데이터를 볼 때 놓칠 수 있는 버그와 성능 저하를 발견할 수 있습니다. 대시보드에 대한 보다 구체적인 정보는 다음을 참조하세요: 대시보드 : 대시보드를 찾는 위치와 사용 방법에 대한 일반 개요. Stage 그룹 대시보드 : Stage 그룹 대시보드 사용 및 커스터마이즈 방법. 에러 예산 상세 : 시간 경과에 따른 에러 예산 탐색 방법. 에러 예산 # 에러 예산은 GitLab.com을 모니터링하는 데 사용하는 동일한 서비스 수준 지표 (SLI, Service Level Indicators)를 기반으로 계산됩니다. Stage 그룹의 28일 가용성 수치는 GitLab.com에 대해 계산하는 월별 가용성과 비교할 수 있지만, 그룹의 기능으로 범위가 한정됩니다. 에러 예산 사용 방식에 대한 자세한 내용은 Engineering Error Budgets 핸드북 페이지를 참조하세요. 기본적으로 두 대시보드의 첫 번째 패널 행에는 Stage 그룹의 에러 예산 이 표시됩니다. 이 행은 그룹이 소유한 기능이 전체 가용성에 어떻게 기여하는지 보여줍니다. 공식 예산은 28일에 걸쳐 집계됩니다. Stage 그룹 대시보드 에서 확인할 수 있습니다. 에러 예산 상세 대시보드 를 사용하면 범위를 커스터마이즈할 수 있습니다. 정보는 두 가지 형식으로 표시됩니다: 가용성: 이 수치는 GitLab.com 전체 가용성 목표인 99.95% 가동 시간과 비교할 수 있습니다. 예산 소비: 그룹이 소유한 기능이 지난 28일 동안 적절히 수행되지 않은 시간. 예산은 컴포넌트별 지표를 기반으로 계산됩니다. 각 컴포넌트는 두 가지 지표를 가질 수 있습니다: Apdex : 적절히 수행된 작업의 비율. "적절히 수행"의 임계값은 메트릭 카탈로그 에 저장되어 있으며 해당 서비스에 따라 다릅니다. API , Git , 그리고 Web 서비스의 Puma(Rails) 컴포넌트의 경우, rails_request SLI 를 선택하지 않으면 그 임계값은 5초 입니다. 이 목표는 이 프로젝트 에서 설정 가능하도록 했습니다. 요청 Apdex를 커스터마이즈하려면 Rails 요청 SLIs 를 참조하세요. 이 새로운 Apdex 측정은 옵트인 하기 전까지는 에러 예산에 포함되지 않습니다. Sidekiq job 실행의 경우, 임계값은 job 긴급도 에 따라 다릅니다. 현재 긴급도가 높은 job은 10초 , 그 외 job은 5분 입니다. 일부 Stage 그룹에는 더 많은 서비스가 있을 수 있습니다. 해당 임계값도 메트릭 카탈로그에