OpenAI Audio 작업
이 작업을 사용해 OpenAI에서 오디오를 생성하거나 녹음을 변환(transcribe) 또는 번역(translate)할 수 있습니다. 텍스트 프롬프트에서 오디오를 생성하는 작업입니다. 자세한 내용은 Create speech | OpenAI 문서를 참조하세요.
이 작업을 사용해 OpenAI에서 오디오를 생성하거나 녹음을 변환(transcribe) 또는 번역(translate)할 수 있습니다. OpenAI 노드 자체에 대한 자세한 내용은 OpenAI를 참조하세요.
오디오 생성(Generate Audio)#
텍스트 프롬프트에서 오디오를 생성하는 작업입니다.
다음 파라미터를 입력하세요:
- Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택합니다.
- Resource: Audio를 선택합니다.
- Operation: Generate Audio를 선택합니다.
- Model: 오디오 생성에 사용할 모델을 선택합니다. 자세한 내용은 TTS | OpenAI를 참조하세요.
- TTS-1: 속도 최적화에 사용합니다.
- TTS-1-HD: 품질 최적화에 사용합니다.
- Text Input: 오디오로 생성할 텍스트를 입력합니다. 최대 4096자입니다.
- Voice: 오디오 생성 시 사용할 목소리를 선택합니다. 목소리 미리 듣기는 Text to speech guide | OpenAI에서 확인하세요.
옵션(Options)#
- Response Format: 오디오 응답 형식을 선택합니다. MP3(기본값), OPUS, AAC, FLAC, WAV, PCM 중에서 선택합니다.
- Audio Speed: 생성된 오디오의 속도를
0.25에서4.0사이의 값으로 입력합니다. 기본값은1입니다. - Put Output in Field: 기본값은
data입니다. 바이너리 파일 데이터를 담을 출력 필드 이름을 입력합니다.
자세한 내용은 Create speech | OpenAI 문서를 참조하세요.
녹음 변환(Transcribe a Recording)#
오디오를 텍스트로 변환(transcribe)하는 작업입니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.
다음 파라미터를 입력하세요:
- Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택합니다.
- Resource: Audio를 선택합니다.
- Operation: Transcribe a Recording을 선택합니다.
- Input Data Field Name: 기본값은
data입니다. 오디오 파일이 포함된 바이너리 속성의 이름을 입력합니다. 지원 형식:.flac,.mp3,.mp4,.mpeg,.mpga,.m4a,.ogg,.wav,.webm.
옵션(Options)#
- Language of the Audio File: 정확성과 지연 시간을 개선하기 위해 입력 오디오의 언어를 ISO-639-1 형식으로 입력합니다.
- Output Randomness (Temperature): 기본값은
1.0입니다. 응답의 무작위성을 조정합니다.0.0(결정론적)에서1.0(최대 무작위) 사이의 범위입니다.
자세한 내용은 Create transcription | OpenAI 문서를 참조하세요.
녹음 번역(Translate a Recording)#
오디오를 영어로 번역하는 작업입니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.
다음 파라미터를 입력하세요:
- Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택합니다.
- Resource: Audio를 선택합니다.
- Operation: Translate a Recording을 선택합니다.
- Input Data Field Name: 기본값은
data입니다. 오디오 파일이 포함된 바이너리 속성의 이름을 입력합니다. 지원 형식:.flac,.mp3,.mp4,.mpeg,.mpga,.m4a,.ogg,.wav,.webm.
옵션(Options)#
- Output Randomness (Temperature): 기본값은
1.0입니다. 응답의 무작위성을 조정합니다.0.0(결정론적)에서1.0(최대 무작위) 사이의 범위입니다.
자세한 내용은 Create transcription | OpenAI 문서를 참조하세요.
일반적인 문제#
일반적인 오류 또는 문제 및 권장 해결 방법은 Common Issues를 참조하세요.
