자체 호스팅 클러스터의 주요 메트릭

Teleport를 자체 호스팅하는 경우 모니터링해야 할 중요한 메트릭을 설명합니다.

이 가이드는 Auth 서비스와 Proxy 서비스가 보고하는 메트릭을 중심으로 자체 호스팅 Teleport 클러스터 모니터링을 시작하는 데 사용해야 할 메트릭을 설명합니다. Teleport Enterprise (Cloud)를 사용하는 경우 Teleport 팀이 이러한 메트릭을 모니터링하고 대응합니다. 사용 가능한 모든 메트릭의 참조는 Teleport 메트릭 참조 를 참조하세요. 이 가이드는 Teleport Auth 서비스와 Proxy 서비스를 실행하는 모든 인스턴스의 컴퓨팅 리소스(예: CPU, 메모리, 디스크, 대역폭, 열린 파일 디스크립터)를 이미 모니터링하고 있다고 가정합니다. 메트릭 활성화 # Teleport's diagnostic HTTP endpoints are disabled by default. You can enable them via: Ensure you can connect to the diagnostic endpoint Verify that Teleport is now serving the diagnostics endpoint: ```code $ curl http://127.0.0.1:3000/healthz ``` 이렇게 하면 http://127.0.0.1:3000/metrics 엔드포인트가 활성화되어 Teleport가 추적하는 메트릭을 제공합니다. Prometheus 수집기와 호환됩니다. Grafana 대시보드 Grafana 대시보드 템플릿은 examples/grafana/teleport-dashboard.json 에서 찾을 수 있습니다. 백엔드 작업 # Auth 서비스에 정상적인 클러스터 상태 백엔드가 없으면 Teleport 클러스터는 작동할 수 없습니다. Auth 서비스가 백엔드에서 읽고 쓰는 능력을 추적해야 합니다. Auth 서비스는 여러 가능한 백엔드 에 연결할 수 있습니다. Teleport 백엔드 메트릭 외에도, 이러한 메트릭이 문제가 있는 값을 보여줄 경우 백엔드 인프라의 메트릭과 연관 지을 수 있도록 선택한 백엔드에 대한 모니터링도 설정해야 합니다. 백엔드 작업 처리량 및 가용성 # 각 백엔드 작업에서 Auth 서비스는 메트릭을 증가시킵니다. 백엔드 작업 메트릭의 형식은 다음과 같습니다: teleport_backend_[_failed]_total 작업이 오류를 초래하면 Auth 서비스는 메트릭 이름에 _failed 세그먼트를 추가합니다. 예를 들어, 레코드 생성에 성공하면 teleport_backend_write_requests_total 메트릭이 증가합니다. 생성 작업이 실패하면 Auth 서비스는 대신 teleport_backend_write_requests_failed_total 을 증가시킵니다. 다음 백엔드 작업 메트릭을 사용할 수 있습니다: 작업 증가되는 메트릭 이름 항목 생성 write_requests 항목 수정, 없으면 생성 write_requests 항목 업데이트 write_requests 버전이 일치하면 항목을 조건부 업데이트 write_requests 항목 범위 나열 batch_read_