映像產生模型需通過工具的擴充機制(Skill、Slash Command 或 Agent)接入。
樣本:在 Claude Code 中接入映像產生模型
以 Claude Code 為例,通過 Slash Command 接入映像產生模型。其他工具的接入方式類似,區別在於擴充機制和設定檔路徑不同。
步驟一:建立 Slash Command
在專案根目錄建立 .claude/commands/text-to-image.md,寫入以下內容:
調用 Token Plan 文生圖 API,根據描述產生圖片。
使用者需求:$ARGUMENTS
## 步驟
1. 從使用者需求中提取 prompt(圖片描述)、model(預設 qwen-image-2.0)、size(預設 1024*1024)。
2. 調用 API 產生圖片(使用 Bash 工具執行 curl):
```
curl -s -X POST "https://token-plan.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation" \
-H "Authorization: Bearer $ANTHROPIC_AUTH_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "<model>",
"input": {
"messages": [{"role":"user","content":[{"text":"<prompt>"}]}]
},
"parameters": {"size":"<size>"}
}'
```
3. 從返回 JSON 的 output.choices[*].message.content[*].image 中提取圖片 URL。
4. 用 curl -s -o "generated_$(date +%Y%m%d_%H%M%S).png" "<URL>" 下載到目前的目錄。
5. 向使用者展示產生的圖片檔案路徑。步驟二:產生圖片
在 Claude Code 中輸入 /text-to-image 畫一隻貓。
其他工具
不同工具的擴充機制和設定檔路徑如下表所示。將上述 Claude Code 樣本中的配置內容儲存到對應路徑即可。
工具 | 擴充機制 | 設定檔路徑 |
Claude Code | Slash Command |
|
Codex | Skill |
|
Qwen Code | Skill |
|
OpenCode | Agent |
|
OpenClaw | Skill |
|
Hermes Agent | Skill |
|
說明
Skill 類工具(Codex、Qwen Code、OpenClaw、Hermes Agent)需要在設定檔開頭添加 YAML front matter:
---
name: "token-plan-image"
description: "調用 Token Plan 文生圖模型,根據文字描述產生圖片。當使用者要求畫圖、產生圖片時啟用。"
---
(... 與上述 Claude Code 樣本相同的內容 ...)OpenCode Agent 需要不同的 front matter 格式:
---
description: "調用 Token Plan 文生圖模型,根據文字描述產生圖片。"
mode: subagent
tools:
bash: true
write: false
edit: false
---
(... 與上述 Claude Code 樣本相同的內容 ...)