OpenAI Audio 작업

n8n OpenAI 노드의 Audio 작업 문서. 오디오 생성, 녹음 변환(transcribe), 번역(translate) 작업의 설정 및 자격 증명 안내를 포함합니다.

이 작업을 사용해 OpenAI에서 오디오를 생성하거나 녹음을 변환(transcribe) 또는 번역(translate)할 수 있습니다. OpenAI 노드 자체에 대한 자세한 내용은 OpenAI 를 참조하세요. 오디오 생성(Generate Audio) # 텍스트 프롬프트에서 오디오를 생성하는 작업입니다. 다음 파라미터를 입력하세요: Credential to connect with : 기존 OpenAI 자격 증명 을 생성하거나 선택합니다. Resource : Audio 를 선택합니다. Operation : Generate Audio 를 선택합니다. Model : 오디오 생성에 사용할 모델을 선택합니다. 자세한 내용은 TTS | OpenAI 를 참조하세요. TTS-1 : 속도 최적화에 사용합니다. TTS-1-HD : 품질 최적화에 사용합니다. Text Input : 오디오로 생성할 텍스트를 입력합니다. 최대 4096자입니다. Voice : 오디오 생성 시 사용할 목소리를 선택합니다. 목소리 미리 듣기는 Text to speech guide | OpenAI 에서 확인하세요. 옵션(Options) # Response Format : 오디오 응답 형식을 선택합니다. MP3 (기본값), OPUS , AAC , FLAC , WAV , PCM 중에서 선택합니다. Audio Speed : 생성된 오디오의 속도를 0.25 에서 4.0 사이의 값으로 입력합니다. 기본값은 1 입니다. Put Output in Field : 기본값은 data 입니다. 바이너리 파일 데이터를 담을 출력 필드 이름을 입력합니다. 자세한 내용은 Create speech | OpenAI 문서를 참조하세요. 녹음 변환(Transcribe a Recording) # 오디오를 텍스트로 변환(transcribe)하는 작업입니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다. 다음 파라미터를 입력하세요: Credential to connect with : 기존 OpenAI 자격 증명 을 생성하거나 선택합니다. Resource : Audio 를 선택합니다. Operation : Transcribe a Recording 을 선택합니다. Input Data Field Name : 기본값은 data 입니다. 오디오 파일이 포함된 바이너리 속성의 이름을 입력합니다. 지원 형식: .flac , .mp3 , .mp4 , .mpeg , .mpga , .m4a , .ogg , .wav , .webm . 옵션(Options) # Language of the Audio File : 정확성과 지연 시간을 개선하기 위해 입력 오디오의 언어를 ISO-639-1 형식으로 입력합니다. Output Randomness (Temperature) : 기본값은 1.0 입니다. 응답의 무작위성을 조정합니다. 0.0 (결정론적)에서 1.0 (최대 무작위) 사이의 범위입니다. 자세한 내용은 Create transcription | OpenAI 문서를 참조하