すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:PAI ArtLab で Stable Diffusion モデルを使用して画像を生成

最終更新日:Apr 02, 2026

PAI ArtLab には、AUTOMATIC1111 が開発した Stable Diffusion Web UI が含まれており、コードを記述することなくブラウザベースのインターフェイスで画像を生成・編集できます。Stable Diffusion 自体は、Stability AI が開発した Text-to-Image の AI モデルです。このガイドでは、Text-to-Image による画像生成、Image-to-Image による画像編集、インペインティング、ControlNet を用いた構造制御生成の 4 つの主要なワークフローについて説明します。

このモデルを、熟練したアーティストだと考えてみてください。アーティストに指示 (プロンプト)、参照画像、またはスケッチを与えると、アーティストが結果を生成します。このガイドの各セクションは、そのメンタルモデルに基づいて構成されており、読み進めるにつれてアーティストのツールがより精密になっていきます。

モデルの選択

Object Storage Service (OSS) のディレクトリにモデルをアップロードし、Web UI を更新します。アップロードしたモデルは、ページ上部のモデルセレクターに表示されます。

Civitai からモデルをダウンロードします。

Civitai にアクセスできない場合は、プロキシを設定して再度お試しください。
image

txt2img

txt2img タブは、テキストプロンプトを画像に変換します。これは、ほとんどの画像生成ワークフローの出発点となります。

プロンプトの構文

キーワードのカテゴリ

プロンプトは、AI に何を生成させるかを指示するキーワードのリストです。キーワードは通常、次の 3 つのグループに分類されます。

  • プレフィックス — 画像の品質、描画スタイル、レンズ効果、照明 (例:HDR8Kstudio lighting)

  • 主題 — 主要な要素、そのポーズ、服装、または属性 (例:1girlbrown hairgloves)

  • シーン — 環境と背景の詳細 (例:outdoorsblue skyforest)

プロンプトの先頭にあるキーワードほど、重みが大きくなります。主題を最初に、次に画材とスタイル、そして解像度と照明の順に、優先順位に従って配置します。学習済みモデルには、キーワードを上書きまたは補足できる組み込みのスタイルプリセットが用意されていることがよくあります。

重み付けの構文 (チートシート)

構文効果
(word)重み × 1.1(beautiful)
((word))重み × 1.21((beautiful))
{word}重み × 1.05{beautiful}
[word]重み × 0.952[background]
(word:1.5)重み × 1.5 (明示的)(eyes:1.2)
(word:0.5)重み × 0.5 (明示的)(blurry:0.3)
<lora:filename:multiplier>LoRA モデルの呼び出し<lora:hanfu_v29:1>
<hypernet:filename:multiplier>Hypernetwork モデルの呼び出し<hypernet:style:0.8>
[promptA:promptB:0.7]ステップの 70% で A から B に遷移[apple:peach:0.9]

重みは 0.4~1.6 の範囲に保ってください。この範囲外の値は、過学習を引き起こしたり、モデルがキーワードを無視したりする原因となる可能性があります。

一般的なプロンプト

これらのプロンプトを出発点として使用してください:

ポジティブプロンプト

プロンプト効果
HDR, UHD, 8K, 4K画質を向上させます
best quality画像を鮮やかにします
masterpiece画像を傑作のように見せます
highly detailed細かいディテールを追加します
studio lighting質感のあるスタジオ照明を適用します
ultra-fine painting超精細な絵画スタイルを適用します
sharp focus画像にシャープなフォーカスを合わせます
physically-based rendering物理ベースのレンダリングを使用します
vivid colors色をより鮮やかにします
(EOS R8, 50mm, F1.2, 8K, RAW photo:1.2)プロフェッショナルな写真スタイルを取り入れます
bokeh背景をぼかし、主題を際立たせます
sketch描画方法としてスケッチを使用します
painting描画方法としてペインティングを使用します

ネガティブプロンプト

プロンプト効果
mutated hands and fingers手や指の形状が崩れるのを防ぎます
deformed変形を防ぎます
bad anatomy解剖学的な誤りを防ぎます
disfigured醜い形になるのを防ぎます
poorly drawn face下手な顔の描画を防ぎます
extra limb余分な手足を防ぎます
ugly醜い要素を防ぎます
missing limb手足の欠損を避けます
floating limbs浮遊する手足を防ぎます
disconnected limbs部位の分離を防ぐ
malformed hands奇形の手を防ぎます
long neck不自然に長い首を防ぎます
long body不自然に長い体を防ぎます

例:複雑なプロンプト

ポジティブプロンプト:

8k portrait of beautiful cyborg with brown hair, intricate, elegant, highly detailed, majestic, digital photography, art by artgerm and ruan jia and greg rutkowski surreal painting gold butterfly filigree, broken glass, (masterpiece, sidelighting, finely detailed beautiful eyes: 1.2), hdr

ネガティブプロンプト:

canvas frame, cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wired colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d render

プロンプトのソース:Civitai

上記のリンクにアクセスできない場合は、プロキシを設定して再度お試しください。

パラメーター

#パラメーター説明
サンプリングメソッド生成中に使用されるノイズ除去アルゴリズム。Euler aDPM++ 2s aDPM++ 2s a Karras は同様の構図を生成します。EulerDPM++ 2mDPM++ 2m Karras は別のグループを形成します。DDIM は明らかに異なる構図を生成します。
サンプリングステップノイズ除去の反復回数。ステップ数を増やすとディテールが追加されますが、時間と計算リソースをより多く消費します。Euler a は 30~40 ステップあたりで安定し、それ以上増やしてもディテールは追加されません。
Hires. fix最初に低解像度で生成し、その後構図を維持しながらアップスケールします。[Hires steps][Denoising strength] の設定が必要です。詳細については、「PAI ArtLab を使用して画像をアップスケールする 3 つの方法」をご参照ください。
幅 / 高さ出力解像度。値を高くするとディテールが追加されますが、VRAM の消費量が増加します。デフォルト:512×512
バッチ回数連続した生成バッチの数。結果はバッチごとに異なります。
バッチサイズバッチごとに生成される画像数。値を大きくすると VRAM の消費量が増加します。
CFG スケールモデルがプロンプトにどれだけ厳密に従うか。高いほど文字通りに、低いほど創造的になります。
シード-1 は毎回異なる画像を生成します。他のすべてのパラメーターが変更されていない場合、他の任意の値 (負の数や小数を含む) は同じ画像を再現します。
*(アイコン)*プロンプトまたは以前に生成された画像から生成パラメーターを読み取ります。
*(アイコン)*プロンプトの内容をクリアします。
imageimageimage

img2img

img2img タブは、既存の画像とプロンプトに基づいて新しい画像を生成します。これは、アーティストに参照写真を再解釈してもらうようなものです。これを使用して、写真をイラストに変換したり、下書きにスタイルを適用したり、既存のアートワークを再構築したりします。

システムは入力画像を分析し、CLIP モデル (リアルな画像に最適) または DeepBooru (イラストや漫画の画像に最適) を使用して、キーワードを自動的に提案することもできます。

基本的な img2img

  1. ソース画像をアップロードします。縦横比をターゲットの出力ディメンションに合わせます。512×512 の出力の場合、1:1 の画像をアップロードします。

  2. [Interrogate CLIP] または [Interrogate DeepBooru] を使用してプロンプトを自動生成するか、ポジティブプロンプトとネガティブプロンプトを手動で入力します。

  3. [生成] をクリックします。

image

スケッチ

スケッチタブでは、生成前に画像の上に描画することができ、モデルに何を作成するかの視覚的なヒントを与えます。

参照画像に色を塗る:

画像をアップロードし、ブラシツールを使用してその上に描画します。必要に応じてプロンプトを調整し、[生成] をクリックします。モデルは描画と参照画像をブレンドします。

image

線画の下書きに色を塗る:

線画の下書きをアップロードし、手動で色を適用します。プロンプトを変更して、さまざまなスタイルを試します。大まかな色付けでも、モデルは洗練された結果を生成するのに十分なコンテキストを得られます。

image

インペイント

インペインティングを使用すると、画像の特定の部分を再描画し、残りの部分は変更しないようにできます。変更したい領域にマスクを描き、プロンプトを使用して要素を追加または削除します。

マスクされた領域をインペイントする:

ポジティブプロンプトに目的の要素を追加し、[生成] をクリックします。以下の例では、ポジティブプロンプトに wears sweater を追加すると、マスクされた領域が置き換えられます。

image

マスク以外のすべてをインペイントする:

保持したい主題をマスクします。新しい背景をポジティブプロンプトに追加し、[生成] をクリックします。以下の例では、classroom を追加すると、マスクの外側すべてが置き換えられます。

image

インペイントスケッチ

インペイントスケッチは、インペインティングのワークフローにカラーパレットを追加します。生成前にマスク領域に色を塗ると、モデルはその色をマスクされた領域を塗りつぶす際の参照として使用します。

image

インペイントアップロード

Photoshop などの外部ツールで作成したマスク画像をアップロードします。[マスク] セクションをクリックして、準備したマスクをアップロードします。手で描くのが難しいマスクの境界線を正確に制御する必要がある場合に使用します。

バッチインペインティング

共有マスクを使用して、ディレクトリ全体の画像を処理します。開始する前に、3 つのディレクトリを作成します。

  • 入力ディレクトリ — 元の画像を保存します

  • 出力ディレクトリ — 生成された結果を保存します

  • インペイントバッチマスクディレクトリ — マスク画像を保存します

マスクを特定の画像とペアにするには、両方のファイルに同じ名前を付けます (例:ali_sd.png)。画像に対応するマスクがない場合、モデルはマスクディレクトリの最初のファイルを使用します。その最初のファイルを全白画像に設定して画像全体のインペインティングを行うか、最も一般的に必要なマスクを使用します。

img2img パラメーター

Interrogation

オプション動作
Interrogate CLIP人が画像を説明するような自然言語でプロンプトを生成します。リアルな写真に最適です。
Interrogate DeepBooruタグ形式のプロンプト (例:beautiful womanriverafternoon) を生成します。より詳細です。イラストに最適です。

リサイズモード

モード動作
単純リサイズターゲットのディメンションに直接リサイズします。画像が引き伸ばされたり圧縮されたりする可能性があります。
切り抜き & リサイズ最初に切り抜き、次にリサイズします。歪みを最小限に抑えますが、元の画像の一部が破棄されます。
リサイズ & フィルリサイズし、空の領域を色やパターンで埋めます。元の比率を維持しますが、フィル品質はさまざまです。
単純リサイズ (latent upscale)順伝播中に潜在空間でのみリサイズします。より速く、より安定していますが、細かいディテールへの忠実度は低くなります。
image.png

image.pngimage.png

image.png

outpainting mk2 スクリプトを使用して画像キャンバスを拡張することもできます。ノイズ除去強度を調整して、新しい領域が元の領域からどれだけ逸脱するかを制御します。

imageimage.pngimage.png

ノイズ除去強度

出力が入力画像からどれだけ逸脱するかを制御します。値が高いほど滑らかな結果になりますが、元のディテールの多くが失われます。値が低いほど、元のディテールがより多く保持されます。

image.png

インペイント固有のパラメーター

マスクのぼかし

マスクの端をぼかして、再描画された領域を画像の残りの部分とブレンドします。値が高いほど、より柔らかく、より透明なエッジが作成されます。

以下の画像は、マスクのぼかしの値が 0、20、40、60 の場合を比較したものです。

image.pngimage.pngimage.pngimage.png

マスクモード

image.png

マスク領域のコンテンツ

モデルがマスクされた領域の開始点として何を使用するかを決定します。

オプション動作最適な用途
塗りつぶし生成前にマスクされた領域を塗りつぶします不要なオブジェクトの削除
オリジナル元の画像コンテンツを参照として使用します欠陥 (傷、汚れ) の修復
latent noiseマスクされた領域にランダムノイズをシードします芸術的な効果。より高いノイズ除去強度を使用します
latent nothing空白のピクセルで塗りつぶします空白や境界線の追加

塗りつぶし — 木の幹を削除します:

image

オリジナル — 木の幹を花に置き換えます:

image

latent noise (低いノイズ除去強度):

image

latent noise (高いノイズ除去強度):

image

latent nothing (低いノイズ除去強度):

image

latent nothing (高いノイズ除去強度):

image

インペイントエリア:全体 — ノイズ除去強度 0 と 0.6 での塗りつぶしとオリジナルを比較:

*塗りつぶし、ノイズ除去強度 0:*

image

*塗りつぶし、ノイズ除去強度 0.6:*

image

*オリジナル、ノイズ除去強度 0:*

image

*オリジナル、ノイズ除去強度 0.6:*

image

インペイントエリア:マスク領域のみ — ノイズ除去強度 0 と 0.6 での塗りつぶしとオリジナルを比較:

*塗りつぶし、ノイズ除去強度 0:*

image

*塗りつぶし、ノイズ除去強度 0.6:*

image

*オリジナル、ノイズ除去強度 0:*

image

*オリジナル、ノイズ除去強度 0.6:*

image

マスク領域のみのパディング (ピクセル)

[インペイントエリア][マスク領域のみ] に設定されている場合にのみ使用できます。マスクされた領域の周りにパディングを追加します。これは、マスクが顔を覆っている場合に便利で、顔を画像の残りの部分から分離し、全体的な構図の変更を減らします。この設定を有効にすると、latent noise はより良い芸術的な結果を生み出します。

インペイントスケッチパラメーター:マスクの透明度

出力でペイントされたマスクの色がどれだけ見えるかを制御します。値が高いほどマスクの色が優勢になり、その領域での元の画像の影響が減少します。これはノイズ除去強度にも影響します。範囲:0~100。

以下の画像は、マスクの透明度の値が 0、30、60、90 の場合を比較したものです。

image.png

image.pngimage.pngimage.pngimage.png

画像情報

Stable Diffusion によって生成された任意の画像を [画像情報] タブにアップロードすると、元のプロンプトと生成パラメーターを表示できます。

image

スクリーンショットや他のアプリケーションから保存された画像はこの方法では読み取れません。メタデータが削除されているためです。

image

ControlNet プラグイン

TheMisto.ai が開発した MistoLine-SDXL-ControlNet プラグインは、PAI ArtLab の Stable Diffusion WebUI および ComfyUI のすべてのバージョンで利用可能です。

プロンプトベースの生成にはかなりのランダム性が伴います。何を望むかを記述しますが、モデルがそれをどのように配置するかを決定します。ControlNet は、構造的な制約を追加することでこの問題を解決します。モデルは、参照画像から抽出された形状、ポーズ、または線に従いながら、プロンプトからのスタイルとディテールを適用する必要があります。

パラメーター

image
パラメーター説明
有効化現在の生成に対して ControlNet を有効にします。
低 VRAMGPU の VRAM が 4 GB 未満の場合はこれを有効にします。
プリプロセッサ入力画像から構造情報 (エッジ、深度、ポーズなど) を抽出します。各プリプロセッサは対応するモデルと連携して動作します。
モデルプリプロセッサの出力を使用して生成をガイドする ControlNet モデル。モデルをダウンロードし、OSS の適切なディレクトリにアップロードします。
コントロールの重みControlNet が出力にどれだけ強く影響するか。img2img の場合:低いノイズ除去強度 + 高いコントロールの重みは、ディテールを変更せずにスタイルを変更します。高いノイズ除去強度 + 低いコントロールの重みは、構造を維持しながらディテールを変更します。
コントロール開始ステップControlNet が拡散プロセスに影響を与え始めるタイミングを、総ステップ数の割合 (0~1) で示します。早期の介入は全体的な構図に影響し、後期の介入は細かいディテールに影響します。例:サンプリングステップが 20 で値が 0.3 の場合、ControlNet はステップ 6 (20 × 0.3) で開始します。
終了コントロールステップControlNet が拡散プロセスへの影響を停止するタイミング (0~1)。

コントロールタイプ

コントロールタイプ検出対象最適な用途デフォルトモデル
Cannyエッジと輪郭 — 衣服のしわ、表情、アウトラインキャラクターの線画、正確な輪郭制御control_sd15_canny
Depthグレースケール値を使用したオブジェクトの距離 (明るい灰色 = 近い、暗い灰色 = 遠い)空間的な配置。顔のディテールにはあまり効果的ではありませんcontrol_sd15_depth
NormalMapRGB 値を使用した表面の粗さと方向キャラクターモデリング、複雑な表面のディテールcontrol_sd15_normal
OpenPose人体の骨格と関節の位置異なるキャラクターやスタイルでポーズを再現するcontrol_sd15_openpose
MLSD直線とエッジ建築の内部と外部、幾何学的なオブジェクトcontrol_sd15_mlsd
Scribble/Sketch白黒のスケッチとラフな描画手描きのスケッチから生成する。白背景の描画には [入力色を反転] を選択しますcontrol_sd15_scribble
Segmentationカテゴリ別のオブジェクト領域シーンの構図制御control_sd15_seg

ControlNet ショーケース

三面図の画像

推奨モデル:CheckpointLoRA

ポジティブプロンプト:

JinxLol,mature female,1girl, solo,looking at viewer, navel, gloves, fingerless gloves, character name, midriff, bare shoulders, looking at viewer, gun, crop top, belt,outdoors

ネガティブプロンプト:

(low quality, worst quality:1.3), (lowres), blurry,text,watermark,signature,artist name,letterboxed, female pubic hair,realism

サンプリングメソッド:DPM++2M Karras

ControlNet:複数の角度からのビューを持つ線画をアップロードします。[コントロールタイプ][Canny] に設定します。

結果:

1682578796063-dc37f288-bb24-4c7c-9fe0-8c4138cd6cc8image

屋外の建物

推奨モデル:CheckpointLoRA

ポジティブプロンプト:

XSWB,architecture,autumn,bench, blue_sky, building,cloudy_sky, day, fence,forest, garden, grass, house, mountain, nature, no_humans, outdoors, palm_tree, path, pavement, plant, road, scenery, sky,tree, water,wooden_fence,triangular top,masterpiece,ultra-fine painting,sharp focus,HDR,UHD,8K,4K <lora:xsarchitectural3aerial_xsarchitectural3:0.9>

ネガティブプロンプト:

soft line,Distorted, fuzzy

サンプリングメソッド:Euler a

ControlNet:建物の線画をアップロードします。[コントロールタイプ][MLSD] に設定します。

結果:

image

内装仕上げ

推奨モデル:v1-5-pruned-emaonly.safetensorsLoRA

ポジティブプロンプト:

Interior advanced Design<lora:xsarchitectural9advanced_xsarchitectural:1>

サンプリングメソッド:Euler a

ControlNet:空の部屋の画像をアップロードします。[コントロールタイプ][MLSD] に、[バッチサイズ] を 4 に設定します。

結果:

image.png

アニメ風プロフィール画像

推奨モデル:CheckpointLoRA

ポジティブプロンプト:

best quality, masterpiece, (realistic:1.2), 1 girl, brown hair, brown eyes,Front, detailed face, beautiful eyes <lora:hanfu_v29 Lora:1>

ネガティブプロンプト:

(low quality, worst quality:1.4),nsfw

サンプリングメソッド:Euler a

ControlNet:顔写真をアップロードします。[コントロールタイプ][Canny] に設定します。

結果:

imageimage

着せ替え

推奨モデル:Civitai

ポジティブプロンプト:

close up of a european woman, ginger hair, winter forest, natural skin texture, 24mm, 4k textures, soft cinematic light, RAW photo, photorealism, photorealistic, intricate, elegant, highly detailed, sharp focus, ((((cinematic look)))), soothing tones, insane details, intricate details, hyperdetailed, low contrast, soft cinematic light, dim colors, exposure blend, hdr, faded

ネガティブプロンプト:

(deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation,nsfw

サンプリングメソッド:Euler a

ControlNet:人物画像をアップロードします。[コントロールタイプ][OpenPose] に設定します。

結果:

imageimage

髪の色の変更

プロンプト:ポジティブプロンプトに black hair を追加します。

パラメーター:インペイント機能を使用します。髪の領域にマスクを描き、[ノイズ除去強度] を 0.6 に設定します。

結果:

image.pngimage.png

背景のインペインティング

プロンプト:ポジティブプロンプトに green trees,((beach)),((sea)),((blue sky)),black hair を追加します。括弧を使用して重みを調整し、重要な要素を強調します。

パラメーター:背景にマスクを描きます。置き換える領域に応じて [マスクモード][ノイズ除去強度] を調整します。

結果:

image.pngimage.png