SKILL.md
readonly

openai-whisper-api

作者:openclaw
分类:
开发
323.6k
62.4k
name: openai-whisper-api
description: Transcribe audio via OpenAI Audio Transcriptions API (Whisper).
homepage: https://platform.openai.com/docs/guides/speech-to-text

OpenAI Whisper API (curl)

Transcribe an audio file via OpenAI’s /v1/audio/transcriptions endpoint.

Quick start

bash
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a

Defaults:

  • Model: whisper-1
  • Output: <input>.txt

Useful flags

bash
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --model whisper-1 --out /tmp/transcript.txt
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --language en
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --prompt "Speaker names: Peter, Daniel"
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json

API key

Set OPENAI_API_KEY, or configure it in ~/.openclaw/openclaw.json:

json5
{
  skills: {
    "openai-whisper-api": {
      apiKey: "OPENAI_KEY_HERE",
    },
  },
}

操作

install --global skills.sh
npx skills add openclaw/openclaw/skills/openai-whisper-api

使用指南

  1. 1. 运行安装命令

    复制上方的安装命令在终端中执行,以进行全局安装。

  2. 2. 配置环境变量

    根据组件说明,在您的 MCP 客户端配置相应的环境密鑰。

  3. 3. 客户端使用

    在支持 MCP 的应用(如 Claude 或 Cursor)中配置并启用该技能。