「俺は絵が描けない」という課題は、同人誌を製作する上で常に付き纏っていた問題だった。

プロのデザイナーにお願いすることはあるが、やはり、自分の思ったものに近い絵を自分でつくり出したいというモチベーションは創作家にはつきもの。

2022年、世界を震撼させた画像生成AIサービス「Stable Diffusion」のオープンソース化によって、その理想がぐっと現実的になったのでないだろうか。

ロンドンを拠点とするAIスタートアップ・Stability AI社は2022年8月22日（現地時間）、画像生成AIサービス「Stable Diffusion（ステーブル・ディフュージョン）」をオープンソースとして全世界に公開した。

成果物
用意するもの
絵作りステップ
おまけ
- ジブンノセツメイショとは
このブログを書くにあたっての参考記事

成果物

ここまで完全に無料でやりきったので、経済的にダメージはない。

時間としては、Google Colabにプログラムを記述したり生成したりするのに30分。描かせたい絵を表現するための「呪文」検討に1時間。Canvaでタイトル検討と作成に15分。といったところである。
締め切り（頒布当日）が来週なので、正直時間のなさは異常。

この成果物は何枚か生成（ガチャ）させたうちの中でよかったものを厳選してタイトル付与している。

なお、ガチャしたものは記録として残してある。呪文ニュアンスをあとで検討できるようにするためだ。

用意するもの

以下の登録が済んでいなければ実施する必要がある。もちろん全部無料。

Stable diffusion（Hugging face）のアカウント
- https://huggingface.co/

Googleアカウント（Google Colab）
- https://colab.research.google.com/ にアクセスできるようになればOK
Canvaのアカウント
- https://www.canva.com/

---2023年1月9日追記---

blog.vtryo.me

絵作りステップ

Stable diffusion

CompVis/stable-diffusion-v1-4 · Hugging Face

Stable diffusionのAccess Token準備

---2023年1月9日追記---
---2023年現在、このTokenは不要になった---

blog.vtryo.me

Hugging faceへのSign Upが終わったら、Access Tokenをつくる。

ページ右上のプロフィール設定メニューからSettingsを開き、Access Tokenページに飛ぶ。
Sign Upしたときに飛んでいるEmail承認を済ませていれば、Tokenを発行できるようになっているはず。

huggingface.co

権限をREADにして発行すれば、無事Token準備完了。

リポジトリの利用同意

この手順を飛ばすと後でプログラムを実行するときにアクセス権限エラーが出る。手順を飛ばさないように。

ライセンスについて読んだらAgree and access repositoryを押すことでリポジトリにアクセスできるようになる。

huggingface.co

Google Colab

ノートブックを作成する

マイドライブからでもGoogle Colabへのアクセスでも良いので、新規で作成する。

drive.google.com

colab.research.google.com

するとこのページになるので、編集 - ノートブックの設定を押す。

ハードウェアアクセラレータをGPUに変えて保存しておく。

コーディング

基本的には公式手順通りでも動く。

huggingface.co

diffusersはこのブログを書いた時点での最新v0.7.2を指定。

github.com

以下のようにコピペするだけで動く。

1セル目
- ftfyはUnicodeを修正してくれるライブラリ

!pip install diffusers==0.7.2 transformers scipy ftfy

2セル目
- <YOUR_ACCESS_TOKEN>には、事前に作成したAccess Tokenを記述する
- promtに書きたい絵の指示を書く。今書かれているのは成果物で貼ってある絵を書くために指示した内容
- for num in range(2)で絵の生成を2枚実行させる。10枚ほしければ10に変えればよし

import torch
from torch import autocast
from diffusers import StableDiffusionPipeline

model_id = "CompVis/stable-diffusion-v1-4"
device = "cuda"

pipe = StableDiffusionPipeline.from_pretrained(model_id, use_auth_token='<YOUR_ACCESS_TOKEN>')
pipe = pipe.to(device)

# Write what you want to draw
prompt = "Back view of beautiful girl, walking far away looking at map, elaborate modern building background, hopeful, concept art, comic, wallpaper, by Makoto Shinaki"

num = 0
for num in range(2):
  with autocast("cuda"):
      image = pipe(prompt, guidance_scale=7.5).images[0]

  image.save(str(num) + "_girl.png")
  image

そんなわけで実行していくとこうなるはず。

画像の保存をimage.save(str(num) + "_girl.png")でやっているので、左のフォルダアイコンを押すとそのような名前で生成されている。ファイル名をダブルクリックすると表示されるので、ダウンロードするなりコピーするなりしておこう。

呪文の吟味

これは自分でやったというよりは、先人の知恵を借りながら試行錯誤した。

パワーワードについての章が役に立つ。

note.com

Canva

https://www.canva.com/

編集する

絵をつくったので、表紙として成立させたい。Webデザイナーとかではないので、気の利いたアプリケーションは持っていない。せいぜいKeynoteで頑張るくらいしかなかったのだが、Canvaが無料で充分にがんばれそうな雰囲気を出してたので採用した。なにせ他を吟味する時間がない。締め切り（頒布当日）は来週なのだ。

ダウンロードしてきた画像をCanvaにアップロードする。（が、その前にA5サイズになっててほしかったのでリサイズした）

CanvaのUIがわかりやすいので難しいことは何もいらなかった。