OpenAI

Whisper

强大的语音识别模型，支持多语言转录和翻译

类型音频模型 Model ID whisper-1

语言支持99+ 种语言

模型类型语音识别 (ASR)

输入格式mp3, mp4, wav, m4a 等

定价与规格

💰 定价

价格$0.006 / 分钟

⚙️ 规格

语言支持99+ 种语言

模型类型语音识别 (ASR)

输入格式mp3, mp4, wav, m4a 等

最大文件25MB

API 调用示例

Python

from openai import OpenAI

client = OpenAI(
    base_url="https://api.xairouter.com/v1",
    api_key="your-api-key"
)

audio_file = open("audio.mp3", "rb")
transcript = client.audio.transcriptions.create(
    model="whisper-1",
    file=audio_file,
    language="zh"  # 可选：指定语言
)

print(transcript.text)

cURL

curl https://api.xairouter.com/v1/audio/transcriptions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="zh"

← 返回模型列表