InfoGrab Docs

클러스터 모니터링 및 문제 진단

Teleport 배포를 모니터링하고 문제를 진단하는 방법을 안내합니다.

Teleport는 정상 상태를 확인하고 트래픽을 처리할 준비가 되었는지 검증하기 위한 헬스 체크 메커니즘을 제공합니다. 메트릭, 추적, 프로파일링은 클러스터 성능과 응답성을 추적하는 심층 데이터를 제공합니다. 헬스 모니터링 활성화 # Teleport 인스턴스의 상태를 모니터링하는 방법입니다. Teleport's diagnostic HTTP endpoints are disabled by default. You can enable them via: Ensure you can connect to the diagnostic endpoint Verify that Teleport is now serving the diagnostics endpoint: ```code $ curl http://127.0.0.1:3000/healthz ``` 이제 여러 엔드포인트에서 모니터링 정보를 수집할 수 있습니다. Kubernetes 프로브 등에서 Teleport 프로세스의 상태를 모니터링하는 데 사용할 수 있습니다. /healthz # http://127.0.0.1:3000/healthz 엔드포인트는 프로세스가 실행 중이면 {"status":"ok"} 본문과 HTTP 200 OK 상태 코드로 응답합니다. 이는 Teleport 프로세스가 아직 실행 중인지 확인하는 데 적합한 간단한 체크입니다. /readyz # http://127.0.0.1:3000/readyz 엔드포인트는 /healthz 와 유사하지만, 응답에 프로세스의 상태 정보가 포함됩니다. 응답 본문은 다음 형식의 JSON 객체입니다: { "status": "a status message here"} /readyz 와 하트비트 # Teleport 구성 요소가 하트비트 절차를 실행하지 못하면 저하 상태에 진입합니다. 하트비트가 성공적으로 완료되면 Teleport는 이 상태에서 회복을 시작합니다. 첫 번째 성공적인 하트비트는 Teleport를 회복 상태로 전환합니다. 두 번째 연속 성공적인 하트비트는 Teleport를 OK 상태로 전환합니다. Teleport 하트비트는 정상 상태일 때 약 60초마다 실행되며, 실패한 하트비트는 약 5초마다 재시도됩니다. 이는 하트비트 타이밍에 따라 연결이 복구된 후 /readyz 가 다시 정상 상태를 보고하기까지 60-70초가 걸릴 수 있음을 의미합니다. 상태 코드 # 응답의 상태 코드는 다음 중 하나일 수 있습니다: HTTP 200 OK: Teleport가 정상적으로 작동 중입니다 HTTP 503 Service Unavailable: Teleport에 연결 오류가 발생하여 저하 상태로 실행 중입니다. Teleport 하트비트가 실패할 때 발생합니다. HTTP 400 Bad Request: Teleport가 초기 시작 단계에 진입 중이거나 저하 상태에서 회복을 시작했습니다. 동일한 상태 정보는 /metrics 엔드포인트 아래의 process_state 메트릭을 통해서도 확인할 수 있습니다. 메트릭 # Teleport는 모든 구성 요소에 대한 메트릭을 노출하여 클러스터 상태에