Step1X-Edit是階躍星辰推出的先進開源影像編輯模型,致力於提升編輯精度和映像逼真度。通過整合多模態語言技術與擴散映像解碼器,該模型在多種編輯任務中展現出卓越效能,能夠滿足專業影像編輯的需求。PAI已全面支援該模型,您可以在PAI-Model Gallery中輕鬆進行一鍵部署和調用。
模型簡介
階躍星辰正式發布並開源了影像編輯大模型Step1X-Edit。該模型結合了多模態大型語言模型(MLLM)與擴散映像解碼器(DiT),在影像編輯領域實現了顯著的效能提升。Step1X-Edit的總參數量達到19B,具備高精度的編輯能力和映像逼真度,在技術上展現出多方面的優勢:
語義精準解析:模型能夠精確理解使用者的編輯指令,並進行語義層面的解析,從而確保編輯結果符合使用者的意圖。
身份一致性保持:在進行編輯時,模型能夠保持映像中的身份一致性,確保主體特徵不受影響。
高精度地區級控制:支援對映像特定地區進行精確控制和編輯,實現細粒度的映像修改。
豐富的任務支援:支援多達11類高頻影像編輯任務類型,包括文字替換、風格遷移等,滿足使用者在多樣化影像編輯中的廣泛需求。
卓越的效能表現:在最新的影像編輯基準GEdit-Bench中,Step1X-Edit在語義一致性、映像品質和綜合得分三項指標上均表現優異,展現了其在影像編輯領域的領先地位。
更多關於Step1X-Edit資訊,請參見stepfun-ai/Step1X-Edit。
運行環境要求
部署階躍星辰 Step1X-Edit模型,建議使用顯存容量為48GB或以上的卡型。
模型部署
進入Model Gallery頁面。
登入PAI控制台。
在頂部左上方根據實際情況選擇地區。
在左側導覽列選擇工作空間列表,單擊指定工作空間名稱,進入對應工作空間。
在左側導覽列選擇快速開始 > Model Gallery。
在Model Gallery頁面右側的模型列表中,搜尋階躍星辰 Step1X-Edit,並單擊該模型卡片,進入模型詳情頁面。
單擊右上方部署,配置推理服務名稱以及部署使用的資源資訊,即可將模型部署到EAS推理服務平台。

模型調用
已部署的階躍星辰 Step1X-Edit模型支援Web應用和API調用兩種方式:
Web應用
在模型服務詳情頁單擊右上方查看WEB應用,進入WebUI頁面。

上傳圖片和輸入Prompt之後,單擊Generate,即可生圖。

API調用
在模型服務詳情頁單擊查看調用資訊,即可擷取服務地址和Token資訊。

通過以下Python範例程式碼即可實現API調用:
import requests
import time
EAS_URL = "<YOUR_EAS_URL>"
EAS_TOKEN = "<YOUR_EAS_TOKEN>"
class TaskStatus:
PENDING = "pending"
PROCESSING = "processing"
COMPLETED = "completed"
FAILED = "failed"
response = requests.post(
f"{EAS_URL}/generate",
headers={
"Authorization": f"{EAS_TOKEN}"
},
json={
"prompt": "A spaceship orbiting Earth",
"seed": 42,
"neg_prompt": "low quality, blurry",
"infer_steps": 28,
"cfg_scale": 6,
"size":1024,
"image": "<您圖片的Base64編碼>"
}
)
task_id = response.json()["task_id"]
print(f"Task ID: {task_id}")
while True:
status_response = requests.get(
f"{EAS_URL}/tasks/{task_id}/status",
headers={
"Authorization": f"{EAS_TOKEN}"
})
status = status_response.json()
print(f"Current status: {status['status']}")
if status["status"] == TaskStatus.COMPLETED:
print("Image ready!")
break
elif status["status"] == TaskStatus.FAILED:
print(f"Failed: {status['error']}")
exit(1)
time.sleep(5)
image_response = requests.get(
f"{EAS_URL}/tasks/{task_id}/image",
headers={
"Authorization": f"{EAS_TOKEN}"
})
with open("generated_image.jpg", "wb") as f:
f.write(image_response.content)
print("Image downloaded successfully!")註:代碼中EAS_URL和EAS_TOKEN的值需替換為已擷取的服務地址和Token。