OpenAI Whisper API (curl)

Transcribe an audio file via OpenAI’s /v1/audio/transcriptions endpoint.

Quick start

bash

{baseDir}/scripts/transcribe.sh /path/to/audio.m4a

Defaults:

Model: whisper-1
Output: <input>.txt

Useful flags

bash

{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --model whisper-1 --out /tmp/transcript.txt
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --language en
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --prompt "Speaker names: Peter, Daniel"
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json

API key

Set OPENAI_API_KEY, or configure it in ~/.openclaw/openclaw.json:

json5

{
  skills: {
    "openai-whisper-api": {
      apiKey: "OPENAI_KEY_HERE",
    },
  },
}

操作

install --global skills.sh

npx skills add openclaw/openclaw/skills/openai-whisper-api

使用指南

1. 运行安装命令
复制上方的安装命令在终端中执行，以进行全局安装。
2. 配置环境变量
根据组件说明，在您的 MCP 客户端配置相应的环境密鑰。
3. 客户端使用
在支持 MCP 的应用（如 Claude 或 Cursor）中配置并启用该技能。