Step1X-Edit adalah model pengeditan gambar canggih dan open-source dari Stepfun yang dirancang untuk meningkatkan presisi pengeditan serta kesetiaan gambar. Dengan mengintegrasikan teknologi bahasa multimodal dengan decoder gambar penyebaran, model ini menunjukkan performa luar biasa dalam berbagai tugas pengeditan dan memenuhi kebutuhan pengeditan gambar profesional. Platform for AI (PAI) sepenuhnya mendukung model ini. Anda dapat menerapkan dan memanggil model ini dengan satu klik di PAI Model Gallery.
Perkenalan model
Stepfun secara resmi telah merilis dan membuka sumber model pengeditan gambar Tingkat Tinggi Step1X-Edit. Model ini menggabungkan Multimodal Large Language Model (MLLM) dengan Diffusion Image Transformer (DiT), mencapai peningkatan performa signifikan dalam pengeditan gambar. Step1X-Edit memiliki total 19 miliar parameter. Model ini menyediakan pengeditan presisi tinggi dan kesetiaan gambar, serta menunjukkan beberapa keunggulan teknis:
Penguraian semantik yang presisi: Model ini secara akurat memahami instruksi pengeditan pengguna dan menguraikannya pada tingkat semantik, memastikan hasil pengeditan sesuai dengan maksud pengguna.
Konsistensi identitas: Selama proses pengeditan, model menjaga konsistensi identitas dalam gambar, memastikan fitur subjek utama tidak terpengaruh.
Kontrol regional presisi tinggi: Model ini mendukung kontrol dan pengeditan presisi pada area gambar tertentu, memungkinkan modifikasi gambar secara detail halus.
Dukungan tugas yang kaya: Model ini mendukung hingga 11 jenis tugas pengeditan gambar umum, seperti penggantian teks dan style transfer, memenuhi berbagai kebutuhan pengguna dalam skenario pengeditan gambar yang beragam.
Performa luar biasa: Dalam benchmark pengeditan gambar GEdit-Bench terbaru, Step1X-Edit menunjukkan performa luar biasa dalam konsistensi semantik, kualitas gambar, dan skor keseluruhan, menunjukkan posisi terdepannya di bidang pengeditan gambar.
Untuk informasi lebih lanjut tentang Step1X-Edit, lihat stepfun-ai/Step1X-Edit.
Persyaratan lingkungan
Menerapkan model Stepfun Step1X-Edit memerlukan GPU dengan memori video 48 GB atau lebih.
Menerapkan model
Buka halaman Model Gallery.
Masuk ke Konsol PAI.
Di pojok kiri atas, pilih Wilayah.
Di panel navigasi di sebelah kiri, pilih Workspace Management. Klik nama ruang kerja target untuk membukanya.
Di panel navigasi di sebelah kiri, pilih QuickStart > Model Gallery.
Di halaman Model Gallery, cari Stepfun Step1X-Edit di daftar model di sebelah kanan dan klik kartu model untuk pergi ke halaman detail model.
Di pojok kanan atas, klik Deploy. Konfigurasikan nama layanan inferensi dan sumber daya penerapan untuk menerapkan model ke platform layanan inferensi Elastic Algorithm Service (EAS).

Panggil model
Model Stepfun Step1X-Edit yang diterapkan dapat dipanggil dari aplikasi web atau menggunakan API.
Aplikasi web
Di halaman detail layanan model, klik View WEB App di pojok kanan atas untuk membuka antarmuka web.

Unggah gambar, masukkan prompt, lalu klik Generate untuk membuat gambar.

Panggilan API
Di halaman detail layanan model, klik View Invocation Information untuk mendapatkan Titik akhir dan token.

Anda dapat menggunakan kode contoh Python berikut untuk melakukan panggilan API:
import requests
import time
EAS_URL = "<YOUR_EAS_URL>"
EAS_TOKEN = "<YOUR_EAS_TOKEN>"
class TaskStatus:
PENDING = "pending"
PROCESSING = "processing"
COMPLETED = "completed"
FAILED = "failed"
response = requests.post(
f"{EAS_URL}/generate",
headers={
"Authorization": f"{EAS_TOKEN}"
},
json={
"prompt": "A spaceship orbiting Earth",
"seed": 42,
"neg_prompt": "low quality, blurry",
"infer_steps": 28,
"cfg_scale": 6,
"size":1024,
"image": "<The Base64 encoding of your image>"
}
)
task_id = response.json()["task_id"]
print(f"Task ID: {task_id}")
while True:
status_response = requests.get(
f"{EAS_URL}/tasks/{task_id}/status",
headers={
"Authorization": f"{EAS_TOKEN}"
})
status = status_response.json()
print(f"Status saat ini: {status['status']}")
if status["status"] == TaskStatus.COMPLETED:
print("Gambar siap!")
break
elif status["status"] == TaskStatus.FAILED:
print(f"Gagal: {status['error']}")
exit(1)
time.sleep(5)
image_response = requests.get(
f"{EAS_URL}/tasks/{task_id}/image",
headers={
"Authorization": f"{EAS_TOKEN}"
})
with open("generated_image.jpg", "wb") as f:
f.write(image_response.content)
print("Gambar berhasil diunduh!")Catatan: Ganti EAS_URL dan EAS_TOKEN dengan Titik akhir dan token yang Anda peroleh.