【第2回】ツール放浪記——287枚のキャラガチャと、たどり着いた答え
マンガ特化SaaSのクレジットガチャに撤退し、ローカルモデルで287枚のキャラシートを回し、OSSマンガエディタのMCP化に挫折する。AIマンガ制作ツールを求めてさまよった記録
← 前の記事: 【第1回】AIマンガ制作に懲りた話——生成AIのNG集Gemini に懲りた
前回、Gemini(NanoBanana Pro)でマンガを生成して、セリフの修正に6時間かかった話を書いた。
生成は速い。でも修正が地獄。ひげが生え、メガネが現れ、服装が勝手に変わる。「もうGeminiでマンガを作るのはやめよう」——そう決めて、別のツールを探すことにした。
ここから長い放浪が始まる。
マンガ特化SaaS——クレジットガチャで撤退
最初に目をつけたのがあるマンガ特化の SaaS だ。キャラシート生成機能、コマ割りから組版まで一体化されている。Kindle 出力にも対応。計算上は1話あたり約950クレジット(リテイク3割込み)で制作できるはずだった。
| 操作 | クレジット |
|---|---|
| キャラシート生成 | 50/キャラ |
| ページ生成 | 約60/ページ |
| パネル再生成 | 20/回 |
| エクスポート | 40/ページ |
見積もりは美しい。でも現実は違った。
キャラ作成の時点でつまづく。思い通りのキャラが出るまでクレジットを消費する。理想のクレジット消費量は「見積もり」であって、現実はクレジットを使ったガチャだ。
しかもそのクレジットは現金で買っている。
課金ガチャを回している感覚になった。ソーシャルゲームじゃないんだから。現金をすり減らしながらのガチャに耐えきれなくなって、撤退した。
ローカルモデル——287枚のキャラガチャ
次に試したのがローカル環境で動くアニメ・マンガ特化の画像生成モデルだ。ComfyUI 上で動き、自分の GPU で処理する。クレジット課金は発生しない。
心置きなくガチャを回せる。
これは大きかった。SaaS では「1回50クレジット…」と躊躇していたキャラシート生成を、好きなだけ回せる。電気代はかかるが、1回ごとに課金される心理的な重さがない。
ここからキャラシート作成に没頭した。結果として、287枚の画像を生成することになる。
ワタシ(主人公)——v1からv9まで
原作ではワタシは男性だが、マンガ版では見栄えのよさから女性に変更した。「ダークネイビーのスーツ、ショートヘア、真面目で一生懸命」という設定でプロンプトを組んだ。
最初に出てきたのがこれだ。

v1:セクシー路線

v2:方向性は合ってきた

v3:セクシーに戻る
v1。ロングヘアにミニスカ、コートがはだけている。「ダークネイビーのスーツ」とプロンプトに書いたのに、出てきたのはセクシーなお姉さんだ。アニメモデルの学習データの偏りが、まっすぐ出ている。
v2 で方向性が合ってきたと思ったら、v3 でまたシャツがはだけてセクシー路線に戻る。プロンプトを追い込んでも、モデルが「かっこいい女性」を「セクシーな女性」と解釈する癖が抜けない。

v5:キャラシート形式に

v7:落ち着いてきた

v9(最終版):完成
v5 でキャラシート形式(複数アングル)を出せるようになり、v7 で方向性が安定し、v9 でようやく「パンツスーツの凛とした若手ビジネスパーソン」にたどり着いた。
v1 からv9 まで、9回のメジャーバージョンアップ。各バージョンで5枚ずつ生成しているから、ワタシだけで45枚以上回している。
先輩——筋肉との戦い
先輩のキャラ設定は「がっしり体型、短い髪、大きな自信のある笑顔」だ。

v1:アクションヒーロー

v2:マッチョすぎる
v1。出てきたのは筋肉ムキムキのアクションヒーローだ。シャツが破れんばかりの腕、向かってくるような構図。「がっしり体型」を「格闘家」と解釈されている。
v2 でキャラシート形式にしたが、まだマッチョすぎるし肌が黒すぎる。「居酒屋で後輩の相談に乗る面倒見のいい先輩」のイメージからは程遠い。

v3:収束してきた

v4(最終版):完成
v3 でようやく「スーツを着た普通のビジネスパーソン」になり、v4 で表情集やディテールまで含む完成度の高いキャラシートができた。
先輩は4バージョンで着地できた。ワタシほど暴れなかったのは、「男性のスーツ姿」はモデルの学習データに素直な方向だったからかもしれない。
287枚の内訳
ワタシ、先輩、師匠(まだ固まっていない)の3キャラに加えて、表情差分、アングル違い、バスト画、グリッド比較——全部合わせて287枚。電気代は計算していない。計算したくない。
でもこの287枚には意味があった。SaaS のクレジットガチャと違って、失敗にコストがかからない。だから「もう少しだけ」「あと1パターンだけ」と粘れる。結果として、納得のいくキャラシートが手に入った。
OSSマンガエディタ——期待と挫折
キャラシートができた。次はマンガの「組み立て」だ。
冷静に考えると、マンガ制作でやっていることは3つしかない。
- コマごとの画像生成 — プロンプトから絵を出す
- コマへの切り抜き — コマ枠のマスクで画像を配置する
- セリフと効果の挿入 — 吹き出し、テキスト、効果音
「これならOSSがあるんじゃないか」——そう思って探したら、あるOSSの Web マンガエディタを見つけた。fabric.js ベースでコマ割り、テキスト配置、トーン・エフェクトまで備えている。
すごく凝ったツールだった。でも動かし方がわからない。
そこで、コードを解析して MCP(Model Context Protocol)でラップし、Claude Code から操作できるようにしようとした。元のファイルは一切変更しない「Proxy パターン」で、Express + WebSocket サーバーからブラウザのキャンバスを操作する構成だ。
MCP化は進んだが
MCP ツールは12個作った。ページ作成、パネル追加、テキスト追加、画像配置、スクリーンショット、さらには任意の JavaScript を実行できる manga_eval まで。技術的にはかなり踏み込んだ。
でも構造が厄介だった。
- HTML 1枚の SPA 構成 — モジュール分割されていない
- モデルとアクションの分離がない — データとUIが密結合
- 癖のある自動処理が多数 — 意図しない副作用が起きる
最終的に、セリフ入力の微調整ができずに挫折した。縦書きテキストのサイズ調整や位置の微調整が、外からの API 操作ではどうしても思い通りにならない。
たどり着いた答え
Gemini で懲りた。SaaS で課金が痛かった。ローカルモデルでキャラは作れた。OSSエディタでは組み立てに挫折した。
ここまで来て、一つの結論にたどり着いた。
既存のツールを使うのではなく、自分で作る方が早い。
しかもこの放浪の過程で、必要な設計が見えていた。そのOSSエディタで苦労した原因——HTML 1枚の密結合、外から制御できない設計——を避ければいい。逆にいえば「こう作ればいい」がわかった。
そしてもう一つ、ガチャについての発想の転換があった。でもそれは次回の話。
次回「ガチャを強みにする——AI3者ネーム会議という悪魔的発想」に続く。