Stable Diffusion 3 を試してみた

2024.06.12 2 minute read

最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表

Stable Diffusion 3 のモデルがリリースされたようなので、試してみます。なお、現在は非商用利用のみ可能なライセンスのようです。

準備

GPU を使えるように設定済みのコンテナを使います。

docker run -it --gpus=all --rm -v /home/tadashi/work:/work nvcr.io/nvidia/cuda:12.1.0-base-ubuntu22.04 /bin/bash

必要なパッケージをインストールします。

apt update
apt install -y git python3-pip libgl1-mesa-dev libglib2.0-0

pip で pytorch をインストールします。

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

Huggin Face のモデルダウンロードページを開き、モデルの使用に同意します。あわせて Hugging Face のアカウントのトークンも取得します。

モデルのページに記載の通り、diffusers をインストールします。サンプルの実行には transformers も必要なので、あわせてインストールします。

pip install -U diffusers transformers[sentencepiece]

※補足：transformers をインストールしただけだと、以下のエラーが発生しました。

ValueError: Cannot instantiate this tokenizer from a slow version. If it's based on sentencepiece, make sure you have sentencepiece installed.

これを解決するために、sentencepiece をあわせてインストールするようにしています。

実行

モデルのページにあるコードを実行してみます。初回実行時はモデルをダウンロードするので、20GB 程のダウンロードが発生します。

import torch
from diffusers import StableDiffusion3Pipeline

pipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", torch_dtype=torch.float16)
pipe = pipe.to("cuda")

image = pipe(
    "A cat holding a sign that says hello world",
    negative_prompt="",
    num_inference_steps=28,
    guidance_scale=7.0,
).images[0]
image

GPU をガンガン使っているのが見えます。なお、右下に青丸で囲んだ通り、1 枚生成するのに手元の環境では 12 分以上かかります。

実行中

Hello World! 文字もきれいに出力されていますね。サンプル

DUALSHOCK 4 を Type-C コネクタ化

2025.10.13 3 minute read

背景 Steam のゲームを DUALSHOCK 4 のジャイロで操作するで書いたように、PS4 の DUAL SHOCK 4 コントローラーを持っています。PC から PS4 をリモートプレイをする場合は、Bluetooth の無線接続はサポートしておらず、有線でコントローラーを接続する必要があります。DUA...

ケルヒャー OC5 Handy Plus 購入

2025.10.12 4 minute read

買ったモノ以前から高圧洗浄機を使ってみたいと思っていました。洗車や家の外壁、浴室など使ってみたい場面はいくつかあったのですが、大きな用途となりそうな洗車に関しては、駐車場に電源がないことがネックでした。屋外なので遠くからコンセントを延長することも難しく、そうなるとかなり用途が限られそうなので購入を見送っていまし...

ラップタイム比較グラフ [自作の fastf1 便利ライブラリ]

2025.09.23 5 minute read

複数ドライバーのラップタイムをグラフ化する以前、複数ドライバーのラップタイム推移を比較で複数ドライバーのラップタイムをグラフ化して比較する関数を作成しました。これまでもたびたび使用していましたが、手入力していると引数が大変なので、こちらも Jupyter Lab のウィジェットで実行できるようなコードを書いて...

2 ドライバーの車速、アクセル/ブレーキ操作を比較する [自作の fastf1 便利ライブラリ]

2025.09.08 5 minute read

車速でドライバーを比較する 2025年のイタリア GP の予選で、フェルスタッペンと角田のタイム差が Q3 で大きく広がりました。

Pokoten

Stable Diffusion 3 を試してみた

準備

実行

共有

関連記事

DUALSHOCK 4 を Type-C コネクタ化

ケルヒャー OC5 Handy Plus 購入

ラップタイム比較グラフ [自作の fastf1 便利ライブラリ]

2 ドライバーの車速、アクセル/ブレーキ操作を比較する [自作の fastf1 便利ライブラリ]