InfoGrab Docs

간단 평가(Light Evaluations)

개발 단계에서 간단 평가를 사용하여 알려진 테스트 케이스의 결과를 확인함으로써 신뢰할 수 있는 LLM 기반 워크플로를 구축하는 방법을 설명합니다.

등록된 커뮤니티 및 유료 플랜에서 사용 가능 간단 평가는 등록된 커뮤니티 사용자와 모든 유료 플랜에서 사용할 수 있습니다. 간단 평가란 무엇인가? # 워크플로를 구축하는 과정에서 소수의 예시를 통해 성능을 파악하고 개선 사항을 찾아보고 싶을 때가 있습니다. 워크플로 개발의 이 단계에서는 각 예시에 대한 워크플로 출력 결과를 직접 살펴보는 것만으로도 충분한 경우가 많습니다. 이 단계에서는 보다 공식적인 점수 산정 또는 메트릭 을 설정하는 것이 투입 노력 대비 아직 효과적이지 않을 수 있습니다. 간단 평가를 사용하면 테스트 데이터셋의 예시를 워크플로에 하나씩 실행하면서 출력 결과를 데이터셋에 다시 기록할 수 있습니다. 그런 다음 해당 출력 결과를 나란히 놓고 예상 출력 결과(있는 경우)와 시각적으로 비교할 수 있습니다. 작동 방식 # Google Sheets 자격증명 평가 기능은 테스트 데이터셋을 저장하기 위해 데이터 테이블 또는 Google Sheets를 사용합니다. Google Sheets를 데이터셋 소스로 사용하려면 Google Sheets 자격증명 을 설정하세요. 간단 평가는 워크플로의 'Editor' 탭에서 수행되지만, 설정 방법에 대한 안내는 'Evaluations' 탭에서 확인할 수 있습니다. 단계: 데이터셋 생성 데이터셋을 워크플로에 연결 워크플로 출력 결과를 데이터셋에 기록 평가 실행 다음 설명에서는 들어오는 지원 티켓에 카테고리와 우선순위를 지정하는 샘플 워크플로를 사용합니다. 1. 데이터셋 생성 # 워크플로에 사용할 소수의 예시가 포함된 데이터 테이블 또는 Google Sheet를 생성합니다. 데이터셋에는 다음 항목의 열이 포함되어야 합니다: 워크플로 입력값 (선택 사항) 예상되는 또는 정확한 워크플로 출력값 실제 출력값 평가 실행 중에 채워질 예정이므로 실제 출력값 열은 비워 두십시오. ![지원 티켓 분류 워크플로의 샘플 데이터셋](/images/docs/n8n/_images/advanced-ai/evaluations/sample-dataset.png) 지원 티켓 분류 워크플로의 샘플 데이터셋 입니다. 2. 데이터셋을 워크플로에 연결 # 데이터셋을 가져오기 위한 평가 트리거 삽입 # 평가 트리거 가 실행될 때마다 데이터셋의 한 행을 나타내는 단일 항목을 출력합니다. 평가 트리거 왼쪽의 'Evaluate all' 버튼을 클릭하면 데이터셋의 각 행에 대해 한 번씩, 워크플로가 여러 번 순차적으로 실행됩니다. 이는 평가 트리거의 특수한 동작입니다. 트리거를 연결하는 동안에는 한 번만 실행하려는 경우가 많습니다. 다음 방법 중 하나를 사용할 수 있습니다: 트리거의 'Max rows to process'를 1로 설정 트리거의 'Execute node' 버튼 클릭 ('Evaluate all' 버튼 대신) 트리거를 워크플로에 연결 # 이제 평가 트리거를 나머지 워크플로에 연결하고 출력하는 데이터를 참조할 수 있습니다. 최소한 워크플로의 이후 단계에서 데이터셋의 입력 열을 사용해야 합니다. 워크플로에 여러 트리거가 있는 경우 분기들을