OpenAI 오디오 작업

요약

이 작업을 사용하여 OpenAI에서 오디오를 생성하거나, 녹음을 텍스트로 변환(전사)하거나, 번역할 수 있습니다. 이 작업을 사용하여 텍스트 프롬프트로부터 오디오를 생성합니다. 자세한 내용은 Create speech | OpenAI 문서를 참고하세요.

이 작업을 사용하여 OpenAI에서 오디오를 생성하거나, 녹음을 텍스트로 변환(전사)하거나, 번역할 수 있습니다. OpenAI 노드 자체에 대한 자세한 내용은 OpenAI를 참고하세요.

오디오 생성#

이 작업을 사용하여 텍스트 프롬프트로부터 오디오를 생성합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Generate Audio를 선택하세요.
Model: 오디오를 생성하는 데 사용할 모델을 선택하세요. 자세한 내용은 TTS | OpenAI를 참고하세요.
- TTS-1: 속도 최적화를 위해 사용하세요.
- TTS-1-HD: 품질 최적화를 위해 사용하세요.
Text Input: 오디오를 생성할 텍스트를 입력하세요. 최대 길이는 4096자입니다.
Voice: 오디오를 생성할 때 사용할 음성을 선택하세요. Text to speech guide | OpenAI에서 음성 미리듣기를 들어볼 수 있습니다.

옵션#

Response Format: 오디오 응답의 형식을 선택하세요. MP3(기본값), OPUS, AAC, FLAC, WAV, PCM 중에서 선택할 수 있습니다.
Audio Speed: 생성된 오디오의 속도를 0.25에서 4.0 사이의 값으로 입력하세요. 기본값은 1입니다.
Put Output in Field: 기본값은 data입니다. 바이너리 파일 데이터를 넣을 출력 필드의 이름을 입력하세요.

자세한 내용은 Create speech | OpenAI 문서를 참고하세요.

녹음 전사#

이 작업을 사용하여 오디오를 텍스트로 전사합니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Transcribe a Recording을 선택하세요.
Input Data Field Name: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav, .webm 형식 중 하나로 된 오디오 파일이 포함된 바이너리 속성의 이름을 입력하세요.

옵션#

Language of the Audio File: 입력 오디오의 언어를 ISO-639-1 형식으로 입력하세요. 이 옵션을 사용하면 정확도와 지연 시간을 개선할 수 있습니다.
Output Randomness (Temperature): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0(결정적)에서 1.0(최대 무작위성) 사이입니다. 이 옵션과 Output Randomness (Top P) 중 하나만 변경하는 것을 권장하며, 둘 다 변경하지 않는 것이 좋습니다. 중간 수준의 temperature(약 0.7)로 시작하여 관찰되는 출력에 따라 조정하세요. 응답이 너무 반복적이거나 딱딱하다면 temperature를 높이세요. 너무 혼란스럽거나 주제에서 벗어난다면 낮추세요.

자세한 내용은 Create transcription | OpenAI 문서를 참고하세요.

녹음 번역#

이 작업을 사용하여 오디오를 영어로 번역합니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Translate a Recording을 선택하세요.
Input Data Field Name: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav, .webm 형식 중 하나로 된 오디오 파일이 포함된 바이너리 속성의 이름을 입력하세요.

옵션#

Output Randomness (Temperature): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0(결정적)에서 1.0(최대 무작위성) 사이입니다. 이 옵션과 Output Randomness (Top P) 중 하나만 변경하는 것을 권장하며, 둘 다 변경하지 않는 것이 좋습니다. 중간 수준의 temperature(약 0.7)로 시작하여 관찰되는 출력에 따라 조정하세요. 응답이 너무 반복적이거나 딱딱하다면 temperature를 높이세요. 너무 혼란스럽거나 주제에서 벗어난다면 낮추세요.

자세한 내용은 Create transcription | OpenAI 문서를 참고하세요.

일반적인 문제#

일반적인 오류나 문제 및 해결 방법은 Common Issues를 참고하세요.

OpenAI 오디오 작업

n8n v2.29

원문 보기

번역일: 2026-06-22

요약

오디오 생성#

이 작업을 사용하여 텍스트 프롬프트로부터 오디오를 생성합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Generate Audio를 선택하세요.
Model: 오디오를 생성하는 데 사용할 모델을 선택하세요. 자세한 내용은 TTS | OpenAI를 참고하세요.
- TTS-1: 속도 최적화를 위해 사용하세요.
- TTS-1-HD: 품질 최적화를 위해 사용하세요.
Text Input: 오디오를 생성할 텍스트를 입력하세요. 최대 길이는 4096자입니다.
Voice: 오디오를 생성할 때 사용할 음성을 선택하세요. Text to speech guide | OpenAI에서 음성 미리듣기를 들어볼 수 있습니다.

옵션#

Response Format: 오디오 응답의 형식을 선택하세요. MP3(기본값), OPUS, AAC, FLAC, WAV, PCM 중에서 선택할 수 있습니다.
Audio Speed: 생성된 오디오의 속도를 0.25에서 4.0 사이의 값으로 입력하세요. 기본값은 1입니다.
Put Output in Field: 기본값은 data입니다. 바이너리 파일 데이터를 넣을 출력 필드의 이름을 입력하세요.

자세한 내용은 Create speech | OpenAI 문서를 참고하세요.

녹음 전사#

이 작업을 사용하여 오디오를 텍스트로 전사합니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Transcribe a Recording을 선택하세요.
Input Data Field Name: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav, .webm 형식 중 하나로 된 오디오 파일이 포함된 바이너리 속성의 이름을 입력하세요.

옵션#

Language of the Audio File: 입력 오디오의 언어를 ISO-639-1 형식으로 입력하세요. 이 옵션을 사용하면 정확도와 지연 시간을 개선할 수 있습니다.
Output Randomness (Temperature): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0(결정적)에서 1.0(최대 무작위성) 사이입니다. 이 옵션과 Output Randomness (Top P) 중 하나만 변경하는 것을 권장하며, 둘 다 변경하지 않는 것이 좋습니다. 중간 수준의 temperature(약 0.7)로 시작하여 관찰되는 출력에 따라 조정하세요. 응답이 너무 반복적이거나 딱딱하다면 temperature를 높이세요. 너무 혼란스럽거나 주제에서 벗어난다면 낮추세요.

자세한 내용은 Create transcription | OpenAI 문서를 참고하세요.

녹음 번역#

이 작업을 사용하여 오디오를 영어로 번역합니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요.

Credential to connect with: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
Resource: Audio를 선택하세요.
Operation: Translate a Recording을 선택하세요.
Input Data Field Name: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav, .webm 형식 중 하나로 된 오디오 파일이 포함된 바이너리 속성의 이름을 입력하세요.

옵션#

Output Randomness (Temperature): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0(결정적)에서 1.0(최대 무작위성) 사이입니다. 이 옵션과 Output Randomness (Top P) 중 하나만 변경하는 것을 권장하며, 둘 다 변경하지 않는 것이 좋습니다. 중간 수준의 temperature(약 0.7)로 시작하여 관찰되는 출력에 따라 조정하세요. 응답이 너무 반복적이거나 딱딱하다면 temperature를 높이세요. 너무 혼란스럽거나 주제에서 벗어난다면 낮추세요.

자세한 내용은 Create transcription | OpenAI 문서를 참고하세요.

일반적인 문제#

일반적인 오류나 문제 및 해결 방법은 Common Issues를 참고하세요.