GitLab Duo 데이터 사용

요약

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다.

GitLab Duo는 생성형 AI를 사용하여 속도를 높이고 생산성을 향상시켜 줍니다. 각 AI 네이티브 기능은 독립적으로 작동하며 다른 기능이 작동하는 데 필요하지 않습니다.

GitLab은 특정 작업에 적합한 대형 언어 모델(LLM)을 사용합니다. 이러한 LLM은 Anthropic Claude, Fireworks AI 호스팅 Codestral, Gemini Enterprise Agent Platform 모델, 및 OpenAI 모델입니다.

점진적 향상#

GitLab Duo AI 네이티브 기능은 DevSecOps 플랫폼 전반에 걸친 기존 GitLab 기능에 대한 점진적 향상으로 설계되었습니다. 이러한 기능은 우아하게 실패하도록 설계되었으며 기본 기능의 핵심 기능을 방해하지 않아야 합니다. 각 기능은 관련 기능 지원 정책에서 정의한 예상 기능에 따라 달라진다는 점을 참고하세요.

안정성 및 성능#

GitLab Duo AI 네이티브 기능은 다양한 기능 지원 수준에 있습니다. 이러한 기능의 특성상 높은 사용 수요로 인해 성능 저하 또는 예상치 못한 기능 다운타임이 발생할 수 있습니다. 우리는 이러한 기능이 우아하게 저하되도록 구축했으며 남용이나 오용을 완화할 수 있는 제어 장치를 갖추고 있습니다. GitLab은 재량에 따라 일부 또는 모든 고객에 대해 베타 및 실험 기능을 언제든지 비활성화할 수 있습니다.

데이터 개인 정보 보호#

GitLab Duo AI 네이티브 기능은 생성형 AI 모델로 구동됩니다. GitLab은 GitLab 개인 정보 보호 정책에 따라 개인 데이터를 처리합니다.

이러한 기능을 제공하기 위해 GitLab이 사용하는 AI 모델 하위 처리자 목록은 타사 하위 처리자를 참조하세요.

데이터 보존#

모델 하위 처리자#

GitLab Duo 요청의 경우, GitLab은 Fireworks AI와 제로 데이터 보존 정책을 가지고 있습니다. Fireworks AI는 출력이 제공된 직후 모델 입력 및 출력 데이터를 폐기하며 남용 모니터링을 위해 입력 및 출력 데이터를 저장하지 않습니다. 이 정책의 예외는 GitLab Duo Code Suggestions 및 GitLab Duo Agentic Chat에 대해 프롬프트 캐싱이 켜진 경우입니다. OpenAI 모델의 경우 프롬프트 캐싱을 끌 수 없습니다.

Amazon Bedrock 및 Gemini Enterprise Agent Platform에서 호스팅되는 경우를 포함하여 특정 Anthropic 및 OpenAI 모델은 제한된 공급업체 측 데이터 보존의 적용을 받습니다. 이러한 모델에 대한 자세한 내용은 GitLab Duo Agent Platform 지원 AI 모델을 참조하세요.

GitLab#

GitLab Duo Chat 및 GitLab Duo Agent Platform은 채팅 및 워크플로 기록을 유지하여 이전에 논의된 주제로 빠르게 돌아갈 수 있도록 합니다. GitLab Duo Chat 인터페이스에서 채팅을 삭제할 수 있습니다. GitLab.com에서는 남용 방지 목적으로 GitLab이 채팅 및 워크플로 기록을 보존합니다. GitLab은 고객이 GitLab 지원 티켓을 통해 동의를 제공하지 않는 한 입력 및 출력 데이터를 달리 보존하지 않습니다.

GitLab Duo Agent Platform에 대한 확장 로깅을 활성화하면 GitLab이 추적 데이터를 보존합니다. AI 기능과 관련된 로깅 정보는 GitLab AI 모델 하위 처리자와의 제로 데이터 보존 정책과 별개입니다. 자세한 내용은 GitLab 로그 시스템을 참조하세요.

모델 학습#

GitLab은 생성형 AI 모델을 훈련하지 않습니다.

모든 GitLab AI 모델 하위 처리자는 모델 입력 및 출력을 사용하여 모델을 훈련하는 것이 금지됩니다. 이러한 하위 처리자는 고객 콘텐츠를 자체 목적에 사용하는 것을 금지하는 GitLab과의 데이터 보호 계약을 체결하고 있습니다. 단, 독립적인 법적 의무를 이행하기 위한 경우는 제외됩니다.

텔레메트리#

GitLab Duo는 Snowplow 수집기를 통해 집계되거나 익명화된 자사 사용 데이터를 수집합니다. 이 사용 데이터에는 다음 메트릭이 포함됩니다:

고유 사용자 수
고유 인스턴스 수
프롬프트 및 접미사 길이
사용된 모델
상태 코드 응답
API 응답 시간
Code Suggestions도 다음을 수집합니다:

언어(예: Python)

사용된 편집기(예: VS Code)
표시, 수락, 거부 또는 오류가 있었던 제안 수
제안이 표시된 시간

GitLab Model Context Protocol 서버#

다음 정보는 GitLab Self-Managed 인스턴스에서의 GitLab Model Context Protocol (MCP) 서버 사용에 적용됩니다.

GitLab MCP 서버가 사용될 때 GitLab은 어떠한 데이터도 전송, 저장, 보존 또는 처리하지 않습니다. 모든 통신은 MCP 클라이언트와 사용자 환경의 GitLab MCP 서버 사이에서 직접 이루어집니다.

리포지터리 데이터 및 메타데이터는 GitLab으로 전송되지 않습니다.

사용자는 어떤 MCP 클라이언트가 인스턴스에 연결하는지 제어합니다. 각 클라이언트 자체의 개인 정보 보호 및 데이터 보존 정책이 적용됩니다.

모델 정확성 및 품질#

생성형 AI는 다음과 같은 예상치 못한 결과를 생성할 수 있습니다:

낮은 품질
일관성 없음
불완전
실패한 파이프라인 생성
안전하지 않은 코드
공격적이거나 민감한 내용
오래된 정보

GitLab은 생성된 콘텐츠의 품질을 향상시키기 위해 모든 AI 지원 기능을 지속적으로 개선하고 있습니다. 우리는 프롬프트 엔지니어링, 이러한 기능을 구동하는 새 AI/ML 모델 평가, 이러한 기능에 직접 내장된 새로운 휴리스틱을 통해 품질을 향상시킵니다.

시크릿 감지 및 편집#

History

GitLab 17.9에서 도입됨.

GitLab Duo에는 흐름 실행 중 시크릿 감지 및 편집이 포함됩니다. 시나리오에 따라 GitLab Duo는 대형 언어 모델로 처리하기 전에 코드에서 API 키, 자격 증명 및 토큰과 같은 민감한 정보를 자동으로 감지하고 제거합니다.

GitLab Duo 사용 시 코드는 사전 스캔 보안 워크플로를 거칩니다:

코드가 Gitleaks를 사용하여 민감한 정보를 스캔합니다.
감지된 시크릿이 자동으로 요청에서 제거됩니다.

시크릿 스캔은 다음 시나리오에서 실행됩니다:

코드 완성 컨텍스트 변환 (컨텍스트가 AI로 전송되기 전)
AI 컨텍스트 변환
워크플로 도구 결과
Agentic Chat 사용자 입력
Git 명령 로깅
CLI 구성 로깅

웹 인터페이스를 통해 GitLab Duo Chat과 상호작용할 때는 시크릿 스캔이 수행되지 않습니다.

예외: 시크릿 오탐 감지#

시크릿 오탐 감지는 취약점에 대한 정보(감지된 시크릿 주변의 코드 컨텍스트 포함)를 분석을 위해 LLM으로 전송하는 옵트인 기능입니다. 이는 시크릿 감지 및 편집 동작의 의도적인 예외 사항입니다.

이 기능은 옵트인이므로 취약점 데이터가 LLM으로 전송되기 전에 그룹 및 프로젝트 수준 모두에서 명시적으로 활성화해야 합니다. 이 기능을 활성화하기 전에 조직의 데이터 정책을 검토하세요.

GitLab과 그룹 사용 데이터 공유#

History

GitLab 18.9.1에서 도입됨.

서비스 품질을 개선하기 위해 GitLab Duo Agent Platform 기능에 대한 사용 데이터를 GitLab과 공유할 수 있습니다.

데이터 수집을 켜면 네임스페이스의 모든 프로젝트 및 하위 그룹에서의 AI 상호작용이 GitLab에 기록됩니다. 이 데이터는 서비스 개선 및 디버깅에만 사용되며 AI 모델 훈련에는 사용되지 않습니다.

인스턴스에 대한 사용 데이터 수집을 켤 수도 있습니다.

필수 요건:

GitLab 18.9.1 이상 보유.
최상위 그룹에 대한 Owner 권한 보유.
GitLab.com에서 그룹은 GitLab Duo가 활성화되어야 합니다.

그룹에 대한 데이터 수집을 켜려면:

상단 표시줄에서 Search or go to를 선택하고 그룹을 찾습니다.
왼쪽 사이드바에서 Settings > GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data collection 아래에서 Collect usage data 체크박스를 선택합니다.
Save changes를 선택합니다.

에이전트 플랫폼 사용 데이터#

데이터 수집을 켜면 다음 데이터가 기록됩니다:

GitLab Duo와의 상호작용에서의 전체 프롬프트 및 응답 텍스트.
설정이 활성화된 시점에 진행 중이었던 세션을 포함한 세션 컨텍스트.
모델 메타데이터 (모델 버전, 토큰 수, 지연 시간).
도구 호출 및 결과.
사용자 피드백과 상관 관계를 맺기 위한 세션 ID.

다음 정보는 사용자가 자체 프롬프트에 포함하지 않는 한 로그에 포함되지 않습니다:

사용자 ID 또는 사용자 이름.
이메일 주소 또는 개인 식별자.
프로젝트 또는 네임스페이스 식별자.

GitLab은 사용자가 프롬프트에 포함한 식별자를 제거하지 않습니다.

프롬프트 캐싱#

프롬프트 캐싱은 캐시된 프롬프트 및 입력 데이터의 재처리를 방지하여 지연 시간을 개선합니다. 프롬프트 캐싱을 켜면 모델 공급업체가 프롬프트 데이터를 메모리에 일시적으로 저장합니다. 캐시된 데이터는 영구 저장소에 기록되지 않습니다.

프롬프트 레지스트리를 사용하는 Agent Platform 기능과 Code Suggestions 모두에서 지원되는 모델에 대해 토큰 캐싱이 자동으로 켜집니다.

프롬프트 캐싱 끄기#

기본적으로 프롬프트 캐싱은 켜져 있습니다. 최상위 그룹 또는 인스턴스에 대해 프롬프트 캐싱을 끌 수 있습니다.

최상위 그룹의 경우

필수 요건:

최상위 그룹에 대한 Owner 권한.
상단 표시줄에서 Search or go to를 선택하고 그룹을 찾습니다.
왼쪽 사이드바에서 Settings > GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data and privacy 섹션의 Prompt cache 아래에서 Turn on prompt caching 체크박스를 선택 해제합니다.
Save changes를 선택합니다.

인스턴스의 경우

필수 요건:
관리자 접근 권한.
오른쪽 상단 모서리에서 Admin을 선택합니다.
왼쪽 사이드바에서 GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data and privacy 섹션의 Prompt cache 아래에서 Turn on prompt caching 체크박스를 선택 해제합니다.
Save changes를 선택합니다.

GitLab Duo 데이터 사용

GitLab v19.2

원문 보기

번역일: 2026-07-17

요약

점진적 향상#

안정성 및 성능#

데이터 개인 정보 보호#

GitLab Duo AI 네이티브 기능은 생성형 AI 모델로 구동됩니다. GitLab은 GitLab 개인 정보 보호 정책에 따라 개인 데이터를 처리합니다.

이러한 기능을 제공하기 위해 GitLab이 사용하는 AI 모델 하위 처리자 목록은 타사 하위 처리자를 참조하세요.

데이터 보존#

모델 하위 처리자#

GitLab#

모델 학습#

GitLab은 생성형 AI 모델을 훈련하지 않습니다.

텔레메트리#

GitLab Duo는 Snowplow 수집기를 통해 집계되거나 익명화된 자사 사용 데이터를 수집합니다. 이 사용 데이터에는 다음 메트릭이 포함됩니다:

고유 사용자 수
고유 인스턴스 수
프롬프트 및 접미사 길이
사용된 모델
상태 코드 응답
API 응답 시간
Code Suggestions도 다음을 수집합니다:

언어(예: Python)

사용된 편집기(예: VS Code)
표시, 수락, 거부 또는 오류가 있었던 제안 수
제안이 표시된 시간

GitLab Model Context Protocol 서버#

다음 정보는 GitLab Self-Managed 인스턴스에서의 GitLab Model Context Protocol (MCP) 서버 사용에 적용됩니다.

리포지터리 데이터 및 메타데이터는 GitLab으로 전송되지 않습니다.

사용자는 어떤 MCP 클라이언트가 인스턴스에 연결하는지 제어합니다. 각 클라이언트 자체의 개인 정보 보호 및 데이터 보존 정책이 적용됩니다.

모델 정확성 및 품질#

생성형 AI는 다음과 같은 예상치 못한 결과를 생성할 수 있습니다:

낮은 품질
일관성 없음
불완전
실패한 파이프라인 생성
안전하지 않은 코드
공격적이거나 민감한 내용
오래된 정보

시크릿 감지 및 편집#

History

GitLab 17.9에서 도입됨.

GitLab Duo 사용 시 코드는 사전 스캔 보안 워크플로를 거칩니다:

코드가 Gitleaks를 사용하여 민감한 정보를 스캔합니다.
감지된 시크릿이 자동으로 요청에서 제거됩니다.

시크릿 스캔은 다음 시나리오에서 실행됩니다:

코드 완성 컨텍스트 변환 (컨텍스트가 AI로 전송되기 전)
AI 컨텍스트 변환
워크플로 도구 결과
Agentic Chat 사용자 입력
Git 명령 로깅
CLI 구성 로깅

웹 인터페이스를 통해 GitLab Duo Chat과 상호작용할 때는 시크릿 스캔이 수행되지 않습니다.

예외: 시크릿 오탐 감지#

GitLab과 그룹 사용 데이터 공유#

History

GitLab 18.9.1에서 도입됨.

서비스 품질을 개선하기 위해 GitLab Duo Agent Platform 기능에 대한 사용 데이터를 GitLab과 공유할 수 있습니다.

인스턴스에 대한 사용 데이터 수집을 켤 수도 있습니다.

필수 요건:

GitLab 18.9.1 이상 보유.
최상위 그룹에 대한 Owner 권한 보유.
GitLab.com에서 그룹은 GitLab Duo가 활성화되어야 합니다.

그룹에 대한 데이터 수집을 켜려면:

상단 표시줄에서 Search or go to를 선택하고 그룹을 찾습니다.
왼쪽 사이드바에서 Settings > GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data collection 아래에서 Collect usage data 체크박스를 선택합니다.
Save changes를 선택합니다.

에이전트 플랫폼 사용 데이터#

데이터 수집을 켜면 다음 데이터가 기록됩니다:

GitLab Duo와의 상호작용에서의 전체 프롬프트 및 응답 텍스트.
설정이 활성화된 시점에 진행 중이었던 세션을 포함한 세션 컨텍스트.
모델 메타데이터 (모델 버전, 토큰 수, 지연 시간).
도구 호출 및 결과.
사용자 피드백과 상관 관계를 맺기 위한 세션 ID.

다음 정보는 사용자가 자체 프롬프트에 포함하지 않는 한 로그에 포함되지 않습니다:

사용자 ID 또는 사용자 이름.
이메일 주소 또는 개인 식별자.
프로젝트 또는 네임스페이스 식별자.

GitLab은 사용자가 프롬프트에 포함한 식별자를 제거하지 않습니다.

프롬프트 캐싱#

프롬프트 레지스트리를 사용하는 Agent Platform 기능과 Code Suggestions 모두에서 지원되는 모델에 대해 토큰 캐싱이 자동으로 켜집니다.

프롬프트 캐싱 끄기#

기본적으로 프롬프트 캐싱은 켜져 있습니다. 최상위 그룹 또는 인스턴스에 대해 프롬프트 캐싱을 끌 수 있습니다.

최상위 그룹의 경우

필수 요건:

최상위 그룹에 대한 Owner 권한.
상단 표시줄에서 Search or go to를 선택하고 그룹을 찾습니다.
왼쪽 사이드바에서 Settings > GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data and privacy 섹션의 Prompt cache 아래에서 Turn on prompt caching 체크박스를 선택 해제합니다.
Save changes를 선택합니다.

인스턴스의 경우

필수 요건:
관리자 접근 권한.
오른쪽 상단 모서리에서 Admin을 선택합니다.
왼쪽 사이드바에서 GitLab Duo를 선택합니다.
Change configuration을 선택합니다.
Data and privacy 섹션의 Prompt cache 아래에서 Turn on prompt caching 체크박스를 선택 해제합니다.
Save changes를 선택합니다.