接入多模態產生模型

映像產生模型需通過工具的擴充機制（Skill、Slash Command 或 Agent）接入。

樣本：在 Claude Code 中接入映像產生模型

以 Claude Code 為例，通過 Slash Command 接入映像產生模型。其他工具的接入方式類似，區別在於擴充機制和設定檔路徑不同。

步驟一：建立 Slash Command

在專案根目錄建立 .claude/commands/text-to-image.md，寫入以下內容：

調用 Token Plan 文生圖 API，根據描述產生圖片。

使用者需求：$ARGUMENTS

## 步驟

1. 從使用者需求中提取 prompt（圖片描述）、model（預設 qwen-image-2.0）、size（預設 1024*1024）。

2. 調用 API 產生圖片（使用 Bash 工具執行 curl）：

```
curl -s -X POST "https://token-plan.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation" \
  -H "Authorization: Bearer $ANTHROPIC_AUTH_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<model>",
    "input": {
      "messages": [{"role":"user","content":[{"text":"<prompt>"}]}]
    },
    "parameters": {"size":"<size>"}
  }'
```

3. 從返回 JSON 的 output.choices[*].message.content[*].image 中提取圖片 URL。

4. 用 curl -s -o "generated_$(date +%Y%m%d_%H%M%S).png" "<URL>" 下載到目前的目錄。

5. 向使用者展示產生的圖片檔案路徑。

步驟二：產生圖片

在 Claude Code 中輸入 /text-to-image 畫一隻貓。

其他工具

不同工具的擴充機制和設定檔路徑如下表所示。將上述 Claude Code 樣本中的配置內容儲存到對應路徑即可。

工具	擴充機制	設定檔路徑
Claude Code	Slash Command	`.claude/commands/text-to-image.md`
Codex	Skill	`~/.codex/skills/token-plan-image/SKILL.md`
Qwen Code	Skill	`~/.qwen/skills/text-to-image/SKILL.md`
OpenCode	Agent	`.opencode/agents/text-to-image.md`
OpenClaw	Skill	`~/.openclaw/workspace/skills/token-plan-image/SKILL.md`
Hermes Agent	Skill	`~/.hermes/skills/media/text-to-image/SKILL.md`

說明

Skill 類工具（Codex、Qwen Code、OpenClaw、Hermes Agent）需要在設定檔開頭添加 YAML front matter：

---
name: "token-plan-image"
description: "調用 Token Plan 文生圖模型，根據文字描述產生圖片。當使用者要求畫圖、產生圖片時啟用。"
---

（... 與上述 Claude Code 樣本相同的內容 ...）

OpenCode Agent 需要不同的 front matter 格式：

---
description: "調用 Token Plan 文生圖模型，根據文字描述產生圖片。"
mode: subagent
tools:
  bash: true
  write: false
  edit: false
---

（... 與上述 Claude Code 樣本相同的內容 ...）