InfoGrab Docs

간단 평가(Light Evaluations)

개발 단계에서 간단 평가를 사용하여 알려진 테스트 케이스의 결과를 확인함으로써 신뢰할 수 있는 LLM 기반 워크플로를 구축하는 방법을 설명합니다.

등록된 커뮤니티 및 유료 플랜에서 사용 가능 간단 평가는 등록된 커뮤니티 사용자와 모든 유료 플랜에서 사용할 수 있습니다. 간단 평가란 무엇인가? # 워크플로를 구축하는 과정에서 소수의 예시를 통해 성능을 파악하고 개선 사항을 찾아보고 싶을 때가 있습니다. 워크플로 개발의 이 단계에서는 각 예시에 대한 워크플로 출력 결과를 직접 살펴보는 것만으로도 충분한 경우가 많습니다. 이 단계에서는 보다 공식적인 점수 산정 또는 메트릭 을 설정하는 것이 투입 노력 대비 아직 효과적이지 않을 수 있습니다. 간단 평가를 사용하면 테스트 데이터셋의 예시를 워크플로에 하나씩 실행하면서 출력 결과를 데이터셋에 다시 기록할 수 있습니다. 그런 다음 해당 출력 결과를 나란히 놓고 예상 출력 결과(있는 경우)와 시각적으로 비교할 수 있습니다. 작동 방식 # Google Sheets 자격증명 평가 기능은 테스트 데이터셋을 저장하기 위해 데이터 테이블 또는 Google Sheets를 사용합니다. Google Sh