InfoGrab Docs

GitLab Duo 데이터 사용

요약

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다.

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. 각 AI 네이티브 기능은 독립적으로 작동하며 다른 기능이 작동하는 데 필요하지 않습니다.

GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. 이러한 LLM은 Anthropic Claude, Fireworks AI 호스팅 Codestral, Google Vertex AI 모델, 및 OpenAI 모델입니다.

점진적 향상#

GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다. 이러한 기능은 우아하게 실패하도록 설계되었으며 기본 기능의 핵심 기능을 방해하지 않아야 합니다. 각 기능은 관련 기능 지원 정책에서 정의한 예상 기능에 따라 달라진다는 점을 참고하세요.

안정성 및 성능#

GitLab Duo AI 네이티브 기능은 다양한 기능 지원 수준에 있습니다. 이러한 기능의 특성상 높은 사용 수요로 인해 성능 저하 또는 예상치 못한 기능 다운타임이 발생할 수 있습니다. 우리는 이러한 기능이 우아하게 저하되도록 구축했으며 남용이나 오용을 완화할 수 있는 제어 장치를 갖추고 있습니다. GitLab은 재량에 따라 일부 또는 모든 고객에 대해 베타 및 실험적 기능을 언제든지 비활성화할 수 있습니다.

데이터 개인 정보 보호#

GitLab Duo AI 네이티브 기능은 생성형 AI 모델로 구동됩니다. 개인 데이터 처리는 당사의 개인 정보 보호 정책에 따라 이루어집니다. 이러한 기능을 제공하기 위해 사용하는 하위 처리자 목록은 하위 처리자 페이지에서 확인할 수도 있습니다.

데이터 보존#

모델 하위 처리자#

다음은 GitLab AI 모델 하위 처리자의 현재 보존 기간을 반영합니다:

GitLab Duo 요청의 경우, GitLab은 Anthropic, AWS, Fireworks AI 및 Google과 함께 제로 데이터 보존 정책을 가지고 있습니다.

이러한 공급업체는 출력이 제공된 직후 모델 입력 및 출력 데이터를 폐기하며 남용 모니터링을 위해 입력 및 출력 데이터를 저장하지 않습니다. 이 정책의 예외는 Code Suggestions 및 GitLab Duo 에이전트 채팅에 대해 Fireworks AI 및 Vertex AI 프롬프트 캐싱이 활성화된 경우입니다.

OpenAI 모델의 경우 프롬프트 캐싱을 끌 수 없습니다. GPT-5.5 및 GPT-5.5 Pro를 포함한 일부 OpenAI 모델은 제한된 공급업체 측 데이터 보존의 적용을 받습니다. 이러한 제한된 공급업체 측 데이터 보존이 적용되는 모델은 GitLab Duo 지원 모델 문서에 표시됩니다.

모든 GitLab AI 모델 하위 처리자는 모델 입력 및 출력을 사용하여 모델을 훈련하는 것이 금지되며, 고객 콘텐츠를 자체 목적에 사용하는 것을 금지하는 GitLab과의 데이터 보호 계약을 체결하고 있습니다. 단, 독립적인 법적 의무를 이행하기 위한 경우는 제외됩니다.

GitLab#

GitLab Duo Chat 및 GitLab Duo 에이전트 플랫폼은 각각 채팅 기록 및 워크플로 기록을 유지하여 이전에 논의된 주제로 빠르게 돌아갈 수 있도록 합니다. GitLab Duo Chat 인터페이스에서 채팅을 삭제할 수 있습니다. GitLab.com에서는 남용 방지 목적으로 채팅 및 워크플로 기록이 보존될 수 있습니다.

GitLab은 고객이 GitLab 지원 티켓을 통해 동의를 제공하지 않는 한 입력 및 출력 데이터를 보존하지 않습니다.

그룹 또는 인스턴스가 GitLab Duo 에이전트 플랫폼 워크플로에 대한 확장 로깅을 활성화하면 추적 데이터가 보존됩니다. 이는 AI 모델 하위 처리자와의 제로 데이터 보존 정책과 별개입니다.

자세한 내용은 AI 기능 로깅을 참조하세요.

학습 데이터#

GitLab은 생성형 AI 모델을 훈련하지 않습니다.

AI 하위 처리자에 대한 자세한 내용은 다음을 참조하세요:

텔레메트리#

GitLab Duo는 Snowplow 수집기를 통해 집계되거나 익명화된 자사 사용 데이터를 수집합니다. 이 사용 데이터에는 다음 메트릭이 포함됩니다:

  • 고유 사용자 수
  • 고유 인스턴스 수
  • 프롬프트 및 접미사 길이
  • 사용된 모델
  • 상태 코드 응답
  • API 응답 시간
  • Code Suggestions도 다음을 수집합니다:
    • 제안이 있었던 언어(예: Python)
    • 사용된 편집기(예: VS Code)
    • 표시, 수락, 거부 또는 오류가 있었던 제안 수
    • 제안이 표시된 시간

GitLab Model Context Protocol 서버#

다음 정보는 GitLab Self-Managed 인스턴스에서의 GitLab Model Context Protocol (MCP) 서버 사용에 적용됩니다.

GitLab MCP 서버가 사용될 때 GitLab은 어떠한 데이터도 전송, 저장, 보존 또는 처리하지 않습니다. 모든 통신은 MCP 클라이언트와 사용자 환경의 GitLab MCP 서버 사이에서 직접 이루어집니다.

리포지터리 데이터 및 메타데이터는 GitLab으로 전송되지 않습니다.

사용자는 어떤 MCP 클라이언트가 인스턴스에 연결하는지 제어합니다. 각 클라이언트 자체의 개인 정보 보호 및 데이터 보존 정책이 적용됩니다.

모델 정확성 및 품질#

생성형 AI는 다음과 같은 예상치 못한 결과를 생성할 수 있습니다:

  • 낮은 품질
  • 일관성 없음
  • 불완전
  • 실패한 파이프라인 생성
  • 안전하지 않은 코드
  • 공격적이거나 민감한 내용
  • 오래된 정보

GitLab은 생성된 콘텐츠의 품질을 향상시키기 위해 모든 AI 지원 기능을 지속적으로 개선하고 있습니다. 우리는 프롬프트 엔지니어링, 이러한 기능을 구동하는 새 AI/ML 모델 평가, 이러한 기능에 직접 내장된 새로운 휴리스틱을 통해 품질을 향상시킵니다.

시크릿 감지 및 편집#

히스토리

GitLab Duo에는 흐름 실행 중 시크릿 감지 및 편집이 포함됩니다. 시나리오에 따라 GitLab Duo는 대형 언어 모델로 처리하기 전에 코드에서 API 키, 자격 증명 및 토큰과 같은 민감한 정보를 자동으로 감지하고 제거합니다.

GitLab Duo 사용 시 코드는 사전 스캔 보안 워크플로를 거칩니다:

  1. 코드가 Gitleaks를 사용하여 민감한 정보를 스캔합니다.
  2. 감지된 시크릿이 자동으로 요청에서 제거됩니다.

시크릿 스캔은 다음 시나리오에서 실행됩니다:

  • 코드 완성 컨텍스트 변환 (컨텍스트가 AI로 전송되기 전)
  • AI 컨텍스트 변환
  • 워크플로 도구 결과
  • 에이전트 채팅 사용자 입력
  • Git 명령 로깅
  • CLI 구성 로깅
Note

웹 인터페이스를 통해 GitLab Duo Chat과 상호작용할 때는 시크릿 스캔이 수행되지 않습니다.

예외: 시크릿 오탐 감지#

시크릿 오탐 감지는 취약점에 대한 정보(감지된 시크릿 주변의 코드 컨텍스트 포함)를 분석을 위해 LLM으로 전송하는 옵트인 기능입니다. 이는 시크릿 감지 및 편집 동작의 의도적인 예외 사항입니다.

이 기능은 옵트인이므로 취약점 데이터가 LLM으로 전송되기 전에 그룹 및 프로젝트 수준 모두에서 명시적으로 활성화해야 합니다. 이 기능을 활성화하기 전에 조직의 데이터 정책을 검토하세요.

GitLab과 그룹 사용 데이터 공유#

히스토리
  • GitLab 18.9.1에서 도입됨.

서비스 품질을 개선하기 위해 GitLab Duo 에이전트 플랫폼 기능에 대한 사용 데이터를 GitLab과 공유할 수 있습니다.

데이터 수집을 켜면 네임스페이스의 모든 프로젝트 및 하위 그룹에서의 AI 상호작용이 GitLab에 기록됩니다. 이 데이터는 서비스 개선 및 디버깅에만 사용되며 AI 모델 훈련에는 사용되지 않습니다.

인스턴스에 대한 사용 데이터 수집을 켤 수도 있습니다.

필수 요건:

  • GitLab 18.9.1 이상 보유.
  • 최상위 그룹에 대한 Owner 권한 보유.
  • GitLab.com에서 그룹은 GitLab Duo가 활성화되어야 합니다.

그룹에 대한 데이터 수집을 켜려면:

  1. 상단 표시줄에서 검색 또는 이동을 선택하고 그룹을 찾습니다.
  2. 왼쪽 사이드바에서 설정 > GitLab Duo를 선택합니다.
  3. 구성 변경을 선택합니다.
  4. 데이터 수집 아래에서 사용 데이터 수집 체크박스를 선택합니다.
  5. 변경 사항 저장을 선택합니다.

에이전트 플랫폼 사용 데이터#

데이터 수집을 켜면 다음 데이터가 기록됩니다:

  • GitLab Duo와의 상호작용에서의 전체 프롬프트 및 응답 텍스트.
  • 설정이 활성화된 시점에 진행 중이었던 세션을 포함한 세션 컨텍스트.
  • 모델 메타데이터 (모델 버전, 토큰 수, 지연 시간).
  • 도구 호출 및 결과.
  • 사용자 피드백과 상관 관계를 맺기 위한 세션 ID.

다음 정보는 사용자가 자체 프롬프트에 포함하지 않는 한 로그에 포함되지 않습니다:

  • 사용자 ID 또는 사용자 이름.
  • 이메일 주소 또는 개인 식별자.
  • 프로젝트 또는 네임스페이스 식별자.

GitLab은 사용자가 프롬프트에 포함한 식별자를 제거하지 않습니다.

GitLab Duo 데이터 사용

원문 보기
요약

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다.

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. 각 AI 네이티브 기능은 독립적으로 작동하며 다른 기능이 작동하는 데 필요하지 않습니다.

GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. 이러한 LLM은 Anthropic Claude, Fireworks AI 호스팅 Codestral, Google Vertex AI 모델, 및 OpenAI 모델입니다.

점진적 향상#

GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다. 이러한 기능은 우아하게 실패하도록 설계되었으며 기본 기능의 핵심 기능을 방해하지 않아야 합니다. 각 기능은 관련 기능 지원 정책에서 정의한 예상 기능에 따라 달라진다는 점을 참고하세요.

안정성 및 성능#

GitLab Duo AI 네이티브 기능은 다양한 기능 지원 수준에 있습니다. 이러한 기능의 특성상 높은 사용 수요로 인해 성능 저하 또는 예상치 못한 기능 다운타임이 발생할 수 있습니다. 우리는 이러한 기능이 우아하게 저하되도록 구축했으며 남용이나 오용을 완화할 수 있는 제어 장치를 갖추고 있습니다. GitLab은 재량에 따라 일부 또는 모든 고객에 대해 베타 및 실험적 기능을 언제든지 비활성화할 수 있습니다.

데이터 개인 정보 보호#

GitLab Duo AI 네이티브 기능은 생성형 AI 모델로 구동됩니다. 개인 데이터 처리는 당사의 개인 정보 보호 정책에 따라 이루어집니다. 이러한 기능을 제공하기 위해 사용하는 하위 처리자 목록은 하위 처리자 페이지에서 확인할 수도 있습니다.

데이터 보존#

모델 하위 처리자#

다음은 GitLab AI 모델 하위 처리자의 현재 보존 기간을 반영합니다:

GitLab Duo 요청의 경우, GitLab은 Anthropic, AWS, Fireworks AI 및 Google과 함께 제로 데이터 보존 정책을 가지고 있습니다.

이러한 공급업체는 출력이 제공된 직후 모델 입력 및 출력 데이터를 폐기하며 남용 모니터링을 위해 입력 및 출력 데이터를 저장하지 않습니다. 이 정책의 예외는 Code Suggestions 및 GitLab Duo 에이전트 채팅에 대해 Fireworks AI 및 Vertex AI 프롬프트 캐싱이 활성화된 경우입니다.

OpenAI 모델의 경우 프롬프트 캐싱을 끌 수 없습니다. GPT-5.5 및 GPT-5.5 Pro를 포함한 일부 OpenAI 모델은 제한된 공급업체 측 데이터 보존의 적용을 받습니다. 이러한 제한된 공급업체 측 데이터 보존이 적용되는 모델은 GitLab Duo 지원 모델 문서에 표시됩니다.

모든 GitLab AI 모델 하위 처리자는 모델 입력 및 출력을 사용하여 모델을 훈련하는 것이 금지되며, 고객 콘텐츠를 자체 목적에 사용하는 것을 금지하는 GitLab과의 데이터 보호 계약을 체결하고 있습니다. 단, 독립적인 법적 의무를 이행하기 위한 경우는 제외됩니다.

GitLab#

GitLab Duo Chat 및 GitLab Duo 에이전트 플랫폼은 각각 채팅 기록 및 워크플로 기록을 유지하여 이전에 논의된 주제로 빠르게 돌아갈 수 있도록 합니다. GitLab Duo Chat 인터페이스에서 채팅을 삭제할 수 있습니다. GitLab.com에서는 남용 방지 목적으로 채팅 및 워크플로 기록이 보존될 수 있습니다.

GitLab은 고객이 GitLab 지원 티켓을 통해 동의를 제공하지 않는 한 입력 및 출력 데이터를 보존하지 않습니다.

그룹 또는 인스턴스가 GitLab Duo 에이전트 플랫폼 워크플로에 대한 확장 로깅을 활성화하면 추적 데이터가 보존됩니다. 이는 AI 모델 하위 처리자와의 제로 데이터 보존 정책과 별개입니다.

자세한 내용은 AI 기능 로깅을 참조하세요.

학습 데이터#

GitLab은 생성형 AI 모델을 훈련하지 않습니다.

AI 하위 처리자에 대한 자세한 내용은 다음을 참조하세요:

텔레메트리#

GitLab Duo는 Snowplow 수집기를 통해 집계되거나 익명화된 자사 사용 데이터를 수집합니다. 이 사용 데이터에는 다음 메트릭이 포함됩니다:

  • 고유 사용자 수
  • 고유 인스턴스 수
  • 프롬프트 및 접미사 길이
  • 사용된 모델
  • 상태 코드 응답
  • API 응답 시간
  • Code Suggestions도 다음을 수집합니다:
    • 제안이 있었던 언어(예: Python)
    • 사용된 편집기(예: VS Code)
    • 표시, 수락, 거부 또는 오류가 있었던 제안 수
    • 제안이 표시된 시간

GitLab Model Context Protocol 서버#

다음 정보는 GitLab Self-Managed 인스턴스에서의 GitLab Model Context Protocol (MCP) 서버 사용에 적용됩니다.

GitLab MCP 서버가 사용될 때 GitLab은 어떠한 데이터도 전송, 저장, 보존 또는 처리하지 않습니다. 모든 통신은 MCP 클라이언트와 사용자 환경의 GitLab MCP 서버 사이에서 직접 이루어집니다.

리포지터리 데이터 및 메타데이터는 GitLab으로 전송되지 않습니다.

사용자는 어떤 MCP 클라이언트가 인스턴스에 연결하는지 제어합니다. 각 클라이언트 자체의 개인 정보 보호 및 데이터 보존 정책이 적용됩니다.

모델 정확성 및 품질#

생성형 AI는 다음과 같은 예상치 못한 결과를 생성할 수 있습니다:

  • 낮은 품질
  • 일관성 없음
  • 불완전
  • 실패한 파이프라인 생성
  • 안전하지 않은 코드
  • 공격적이거나 민감한 내용
  • 오래된 정보

GitLab은 생성된 콘텐츠의 품질을 향상시키기 위해 모든 AI 지원 기능을 지속적으로 개선하고 있습니다. 우리는 프롬프트 엔지니어링, 이러한 기능을 구동하는 새 AI/ML 모델 평가, 이러한 기능에 직접 내장된 새로운 휴리스틱을 통해 품질을 향상시킵니다.

시크릿 감지 및 편집#

히스토리

GitLab Duo에는 흐름 실행 중 시크릿 감지 및 편집이 포함됩니다. 시나리오에 따라 GitLab Duo는 대형 언어 모델로 처리하기 전에 코드에서 API 키, 자격 증명 및 토큰과 같은 민감한 정보를 자동으로 감지하고 제거합니다.

GitLab Duo 사용 시 코드는 사전 스캔 보안 워크플로를 거칩니다:

  1. 코드가 Gitleaks를 사용하여 민감한 정보를 스캔합니다.
  2. 감지된 시크릿이 자동으로 요청에서 제거됩니다.

시크릿 스캔은 다음 시나리오에서 실행됩니다:

  • 코드 완성 컨텍스트 변환 (컨텍스트가 AI로 전송되기 전)
  • AI 컨텍스트 변환
  • 워크플로 도구 결과
  • 에이전트 채팅 사용자 입력
  • Git 명령 로깅
  • CLI 구성 로깅
Note

웹 인터페이스를 통해 GitLab Duo Chat과 상호작용할 때는 시크릿 스캔이 수행되지 않습니다.

예외: 시크릿 오탐 감지#

시크릿 오탐 감지는 취약점에 대한 정보(감지된 시크릿 주변의 코드 컨텍스트 포함)를 분석을 위해 LLM으로 전송하는 옵트인 기능입니다. 이는 시크릿 감지 및 편집 동작의 의도적인 예외 사항입니다.

이 기능은 옵트인이므로 취약점 데이터가 LLM으로 전송되기 전에 그룹 및 프로젝트 수준 모두에서 명시적으로 활성화해야 합니다. 이 기능을 활성화하기 전에 조직의 데이터 정책을 검토하세요.

GitLab과 그룹 사용 데이터 공유#

히스토리
  • GitLab 18.9.1에서 도입됨.

서비스 품질을 개선하기 위해 GitLab Duo 에이전트 플랫폼 기능에 대한 사용 데이터를 GitLab과 공유할 수 있습니다.

데이터 수집을 켜면 네임스페이스의 모든 프로젝트 및 하위 그룹에서의 AI 상호작용이 GitLab에 기록됩니다. 이 데이터는 서비스 개선 및 디버깅에만 사용되며 AI 모델 훈련에는 사용되지 않습니다.

인스턴스에 대한 사용 데이터 수집을 켤 수도 있습니다.

필수 요건:

  • GitLab 18.9.1 이상 보유.
  • 최상위 그룹에 대한 Owner 권한 보유.
  • GitLab.com에서 그룹은 GitLab Duo가 활성화되어야 합니다.

그룹에 대한 데이터 수집을 켜려면:

  1. 상단 표시줄에서 검색 또는 이동을 선택하고 그룹을 찾습니다.
  2. 왼쪽 사이드바에서 설정 > GitLab Duo를 선택합니다.
  3. 구성 변경을 선택합니다.
  4. 데이터 수집 아래에서 사용 데이터 수집 체크박스를 선택합니다.
  5. 변경 사항 저장을 선택합니다.

에이전트 플랫폼 사용 데이터#

데이터 수집을 켜면 다음 데이터가 기록됩니다:

  • GitLab Duo와의 상호작용에서의 전체 프롬프트 및 응답 텍스트.
  • 설정이 활성화된 시점에 진행 중이었던 세션을 포함한 세션 컨텍스트.
  • 모델 메타데이터 (모델 버전, 토큰 수, 지연 시간).
  • 도구 호출 및 결과.
  • 사용자 피드백과 상관 관계를 맺기 위한 세션 ID.

다음 정보는 사용자가 자체 프롬프트에 포함하지 않는 한 로그에 포함되지 않습니다:

  • 사용자 ID 또는 사용자 이름.
  • 이메일 주소 또는 개인 식별자.
  • 프로젝트 또는 네임스페이스 식별자.

GitLab은 사용자가 프롬프트에 포함한 식별자를 제거하지 않습니다.