OpenAI-Hub中文文档
首页控制台
首页控制台
  1. 音频接口
  • 序言
  • OpenAI接口
    • 聊天通用
      • 如何上传文件?
      • 语音对话接口
      • 聊天(通用)
      • gpts接口
      • gpt-4-all(生成图片)
      • gpt-4-all(分析图片)
    • 内容补全
      • 创建完成
    • 图像接口
      • 创建图像
      • 创建图像编辑
      • 创建图像变化
    • 音频接口
      • 创建语音
        POST
      • 创建转录
        POST
    • 向量生成
      • 创建嵌入
    • 模型列表
      • 列出模型
    • 内容审核
      • 创建内容审核
    • 帮助中心
      • HTTP接口状态码
  • Suno音乐接口
    • 接口格式(通用)
      • 生成音乐
      • 生成歌词
      • 查询单个任务
      • 批量查询任务
    • 其他接口格式
      • 生成音乐
      • 查询任务
  • 绘画接口
    • Midjourney
      • InsightFace任务提交
        • 提交swap_face任务(废弃)
      • 任务提交
        • 提交Imagine任务
        • 执行动作
        • 提交Blend任务
        • 提交Describe任务
        • 提交Modal
        • 提交Shorten任务
        • 上传文件到discord
      • 任务查询
        • 指定ID获取任务
        • 根据ID列表查询任务
        • 根据ID列表查询任务-字段displays
        • 获取任务图片的seed
    • Flux(暂不可用)
      • 生成图片
    • Ideogram(绘画)
      • Generate(文生图)
      • Remix(混合图)
      • Upscale(放大高清)
      • Describe(描述)
  • 视频接口
    • Luma视频接口
      • 官方接口格式
        • 视频生成
        • 获取结果
      • 平台格式
        • 任务提交
          • 生成视频
          • 扩展视频
          • 获取视频无水印链接
        • 任务查询
          • 查询单个任务
          • 批量查询任务
    • Runway视频接口
      • feed
      • generate(文本)
      • generate(参考图片)
    • Pika视频接口
      • 任务提交
      • 查询任务
  • 文本生成(通用)
    • 聊天(通用)
      POST
    • Anthropic Claude(全系列,已更新支持第三代)
      POST
    • gemini-pro
      POST
  • 可灵AI
    • 回调协议
    • 生成图像
      POST
    • 生成视频
      POST
    • 图生视频
      POST
    • 查询单个任务
      GET
  1. 音频接口

创建转录

POST
https://api.openai-hub.com/v1/audio/transcriptions
音频(Audio)
了解如何将音频转换为文本。
相关指南:语音转文本
将音频转录为输入语言。

请求参数

Header 参数
Authorization
string 
必需
在 Header 添加参数 Authorization,其值为在 Bearer 之后拼接 令牌
示例
Authorization: Bearer 2f68dbbf-519d-4f01-9636-e2421b68f379
默认值:
Bearer {{YOUR_API_KEY}}
Content-Type
string 
可选
默认值:
application/json
Body 参数multipart/form-data
file
file 
必需
要转录的音频文件对象(不是文件名),格式为:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。
示例值:
file://C:\Users\71400\Downloads\response.mpga
model
string 
必需
要使用的模型 ID。目前只有 whisper-1 是可用的。
language
string 
可选
输入音频的语言。以 ISO-639-1 格式提供输入语言可以提高准确性和延迟。
prompt
string 
可选
一个可选的文本来指导模型的风格或继续之前的音频段落。提示应该与音频语言匹配。
response_format
string 
可选
默认为 json
转录输出的格式,可选择:json、text、srt、verbose_json 或 vtt。
temperature
number 
可选
默认为 0
采样温度,between 0 和 1。更高的值像 0.8 会使输出更随机,而更低的值像 0.2 会使其更集中和确定性。如果设置为 0,模型将使用对数概率自动增加温度直到达到特定阈值。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.openai-hub.com/v1/audio/transcriptions' \
--header 'Authorization;' \
--form 'file=@"C:\\Users\\71400\\Downloads\\response.mpga"' \
--form 'model=""' \
--form 'language=""' \
--form 'prompt=""' \
--form 'response_format=""' \
--form 'temperature=""'

返回响应

🟢200成功
application/json
Body
text
string 
必需
示例
{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
上一页
创建语音
下一页
创建嵌入
Built with