Yyatmita

【第2回】ツール放浪記——287枚のキャラガチャと、たどり着いた答え

マンガ特化SaaSのクレジットガチャに撤退し、ローカルモデルで287枚のキャラシートを回し、OSSマンガエディタのMCP化に挫折する。AIマンガ制作ツールを求めてさまよった記録

AIマンガ制作ワークフロー#ai-manga#saas#local-model#comfyui#oss-editor#mcp
← 前の記事: 【第1回】AIマンガ制作に懲りた話——生成AIのNG集

Gemini に懲りた

前回、Gemini(NanoBanana Pro)でマンガを生成して、セリフの修正に6時間かかった話を書いた。

生成は速い。でも修正が地獄。ひげが生え、メガネが現れ、服装が勝手に変わる。「もうGeminiでマンガを作るのはやめよう」——そう決めて、別のツールを探すことにした。

ここから長い放浪が始まる。

マンガ特化SaaS——クレジットガチャで撤退

最初に目をつけたのがあるマンガ特化の SaaS だ。キャラシート生成機能、コマ割りから組版まで一体化されている。Kindle 出力にも対応。計算上は1話あたり約950クレジット(リテイク3割込み)で制作できるはずだった。

操作クレジット
キャラシート生成50/キャラ
ページ生成約60/ページ
パネル再生成20/回
エクスポート40/ページ

見積もりは美しい。でも現実は違った。

キャラ作成の時点でつまづく。思い通りのキャラが出るまでクレジットを消費する。理想のクレジット消費量は「見積もり」であって、現実はクレジットを使ったガチャだ。

しかもそのクレジットは現金で買っている。

課金ガチャを回している感覚になった。ソーシャルゲームじゃないんだから。現金をすり減らしながらのガチャに耐えきれなくなって、撤退した。

ローカルモデル——287枚のキャラガチャ

次に試したのがローカル環境で動くアニメ・マンガ特化の画像生成モデルだ。ComfyUI 上で動き、自分の GPU で処理する。クレジット課金は発生しない。

心置きなくガチャを回せる。

これは大きかった。SaaS では「1回50クレジット…」と躊躇していたキャラシート生成を、好きなだけ回せる。電気代はかかるが、1回ごとに課金される心理的な重さがない。

ここからキャラシート作成に没頭した。結果として、287枚の画像を生成することになる。

ワタシ(主人公)——v1からv9まで

原作ではワタシは男性だが、マンガ版では見栄えのよさから女性に変更した。「ダークネイビーのスーツ、ショートヘア、真面目で一生懸命」という設定でプロンプトを組んだ。

最初に出てきたのがこれだ。

ワタシv1

v1:セクシー路線

ワタシv2

v2:方向性は合ってきた

ワタシv3

v3:セクシーに戻る

v1。ロングヘアにミニスカ、コートがはだけている。「ダークネイビーのスーツ」とプロンプトに書いたのに、出てきたのはセクシーなお姉さんだ。アニメモデルの学習データの偏りが、まっすぐ出ている。

v2 で方向性が合ってきたと思ったら、v3 でまたシャツがはだけてセクシー路線に戻る。プロンプトを追い込んでも、モデルが「かっこいい女性」を「セクシーな女性」と解釈する癖が抜けない。

ワタシv5

v5:キャラシート形式に

ワタシv7

v7:落ち着いてきた

ワタシv9(最終版)

v9(最終版):完成

v5 でキャラシート形式(複数アングル)を出せるようになり、v7 で方向性が安定し、v9 でようやく「パンツスーツの凛とした若手ビジネスパーソン」にたどり着いた。

v1 からv9 まで、9回のメジャーバージョンアップ。各バージョンで5枚ずつ生成しているから、ワタシだけで45枚以上回している。

先輩——筋肉との戦い

先輩のキャラ設定は「がっしり体型、短い髪、大きな自信のある笑顔」だ。

先輩v1

v1:アクションヒーロー

先輩v2

v2:マッチョすぎる

v1。出てきたのは筋肉ムキムキのアクションヒーローだ。シャツが破れんばかりの腕、向かってくるような構図。「がっしり体型」を「格闘家」と解釈されている。

v2 でキャラシート形式にしたが、まだマッチョすぎるし肌が黒すぎる。「居酒屋で後輩の相談に乗る面倒見のいい先輩」のイメージからは程遠い。

先輩v3

v3:収束してきた

先輩v4(最終版)

v4(最終版):完成

v3 でようやく「スーツを着た普通のビジネスパーソン」になり、v4 で表情集やディテールまで含む完成度の高いキャラシートができた。

先輩は4バージョンで着地できた。ワタシほど暴れなかったのは、「男性のスーツ姿」はモデルの学習データに素直な方向だったからかもしれない。

287枚の内訳

ワタシ、先輩、師匠(まだ固まっていない)の3キャラに加えて、表情差分、アングル違い、バスト画、グリッド比較——全部合わせて287枚。電気代は計算していない。計算したくない。

でもこの287枚には意味があった。SaaS のクレジットガチャと違って、失敗にコストがかからない。だから「もう少しだけ」「あと1パターンだけ」と粘れる。結果として、納得のいくキャラシートが手に入った。

OSSマンガエディタ——期待と挫折

キャラシートができた。次はマンガの「組み立て」だ。

冷静に考えると、マンガ制作でやっていることは3つしかない。

  1. コマごとの画像生成 — プロンプトから絵を出す
  2. コマへの切り抜き — コマ枠のマスクで画像を配置する
  3. セリフと効果の挿入 — 吹き出し、テキスト、効果音

「これならOSSがあるんじゃないか」——そう思って探したら、あるOSSの Web マンガエディタを見つけた。fabric.js ベースでコマ割り、テキスト配置、トーン・エフェクトまで備えている。

すごく凝ったツールだった。でも動かし方がわからない。

そこで、コードを解析して MCP(Model Context Protocol)でラップし、Claude Code から操作できるようにしようとした。元のファイルは一切変更しない「Proxy パターン」で、Express + WebSocket サーバーからブラウザのキャンバスを操作する構成だ。

MCP化は進んだが

MCP ツールは12個作った。ページ作成、パネル追加、テキスト追加、画像配置、スクリーンショット、さらには任意の JavaScript を実行できる manga_eval まで。技術的にはかなり踏み込んだ。

でも構造が厄介だった。

  • HTML 1枚の SPA 構成 — モジュール分割されていない
  • モデルとアクションの分離がない — データとUIが密結合
  • 癖のある自動処理が多数 — 意図しない副作用が起きる

最終的に、セリフ入力の微調整ができずに挫折した。縦書きテキストのサイズ調整や位置の微調整が、外からの API 操作ではどうしても思い通りにならない。

たどり着いた答え

Gemini で懲りた。SaaS で課金が痛かった。ローカルモデルでキャラは作れた。OSSエディタでは組み立てに挫折した。

ここまで来て、一つの結論にたどり着いた。

既存のツールを使うのではなく、自分で作る方が早い。

しかもこの放浪の過程で、必要な設計が見えていた。そのOSSエディタで苦労した原因——HTML 1枚の密結合、外から制御できない設計——を避ければいい。逆にいえば「こう作ればいい」がわかった。

そしてもう一つ、ガチャについての発想の転換があった。でもそれは次回の話。

次回「ガチャを強みにする——AI3者ネーム会議という悪魔的発想」に続く。