Yyatmita

【第20回】yatmita でのマンガ生成にかかるコスト感——3シリーズの実費を全部出す

Nano Banana (Gemini API) でマンガを作ると1話いくらかかるか。yatmita で連載中の3シリーズの実費を公開し、なぜ作品ごとに桁違いの差が出るのかを分解する

AIマンガ制作ワークフロー#ai-manga#gemini#nano-banana#cost#manginus
← 前の記事: 【第19回】開発担当 Claude Code に聞いてみた Vol.3——漫画エディタから LINE スタンプが生まれた日

スコープ:Nano Banana (Gemini API) の話

この記事で扱うのは Nano Banana = Gemini 画像生成モデル のコストだけだ。うちのローカル GPU で回している ComfyUI(FLUX 系)や、Krita で手描きする部分は別の話。

Nano Banana には使い方が2つある。

  1. Web UI 経由 — Gemini アプリ(ChatGPT みたいなチャット)で画像を生成する。定額サブスク
  2. API 経由 — manginus から直叩きする。従量課金

私たちは manginus という自作マンガエディタから API を叩いている。従量だから「1枚いくら」が明確に出る。

料金体系

API の料金は2モデルある。

モデル1枚あたり用途
Nano Banana 2 (Flash)$0.067デフォルト。コスト重視
Nano Banana Pro$0.134品質重視。約2倍

運用では 新規生成(gen)は Flash、部分編集(edit)は Pro に固定している。理由は後述するが、モデルを「シーンの重要度」で使い分けているわけではない。

Web UI のほうは定額(月 $20 前後)。ただし manginus から自動で叩けないから、画像生成→ダウンロード→取り込みを手動でやる必要がある。枚数が多いマンガ制作だと現実的じゃない。

yatmita 各シリーズの実費

2026-04-10 以降の Gemini 利用ログから集計した。作品ごとに1話あたりの実費を出すとこうなる。

シリーズ形式1話あたり典型的な使い方
やってみた料理部4コマ約 $0.30Flash、一発生成
トレードバージンのり子ちゃんB5 短編(3〜4ページ)$1〜2Flash、一発生成
最後は議論力がモノをいうB5 長編約 $28Pro 混在、リテイク多数

桁が違う。料理部の約 100 倍が議論力に掛かっている。

差の内訳——議論力 EP06 を分解する

代表値として議論力 EP06 の実測を見る。合計 $27.84

  • Flash: 373 枚
  • Pro: 19 枚
  • うち画像生成 (gen): 297 回
  • うち部分編集 (json-edit): 94 回
  • うち構造抽出 (json-extract): 12 回

差を生んでいる要因は3つある。

1. ページ枚数(コマ数)

4コマは1ページ4コマ。1話 6〜10ページとしても 25〜40 コマ。 B5 長編は 1ページあたり 3〜6 コマ、1話 20ページとすると 60〜120 コマ。

コマ数だけで 3〜5倍の差がつく。ここは作品フォーマットの宿命で、削りようがない。

2. 再生成(gen)と編集(edit)は別の道具

gen と edit は「安いか高いか」で使い分けるものではない。目的が違う

  • gen: 構図ごと絵を作り直す。プロンプトは同じでも別の絵が出る。4コマのようにコマが独立していて、気に入らなければ丸ごと捨てて良い場合はこれで十分。料理部もトレバも gen のみで完結している
  • edit: 既存の絵の構図とキャラを保ったまま、一部だけ変える。「この表情のまま背中にモノを持たせる」「キャラはそのまま、背景だけ夜にする」みたいな用途。gen で再生成するとキャラも構図も別物になるから、edit でないと成立しない

B5 長編では、前のコマと繋がるキャラ・表情・背景の連続性が必要になる。だから gen で作り直すという選択肢がそもそも取れず、edit を呼ぶしかない。「コストが高いから edit を減らして gen にしよう」は構造的に成立しない

3. edit は実質 Pro 一択

そのうえでモデル選択も、絵の品質で決まっているわけではない。

  • gen は Flash と Pro で体感品質にそこまで差がない。だから全作品 gen は Flash オンリーで回している
  • edit は Flash でも絵そのものは破綻しないのだが、回答時間が長い うえに エラー率が高い。タイムアウトや JSON パース失敗で何回も叩き直すことになる。結果的に Pro のほうが待ち時間もリトライも少なく、制作が進む

つまり edit での Pro 選択はコストとの比較ではなく、回るかどうか の問題だ。

実データでも、議論力 EP07 の Pro 使用 98枚はほぼ全部 edit だった(gen/pro はゼロ、edit/pro が $13)。

B5 長編で edit が必要になった時点で、Pro 単価 $0.134 × (extract + edit) が固定で乗る。議論力 EP06 では edit 94回・extract 12回で $7.5 強。この固定コストは「edit が必要になる局面そのもの」を減らさない限り下がらない。

削減の課題

edit は目的上必要になるもので、gen に置き換えるという話ではない。削減できるとしたら、そもそも edit が必要にならない一発 gen を増やす こと。

  1. キャラ参照画像の質を上げる — gen が一発で通るかどうかは参照画像で決まる。キャラシートの表情バリエーション・ポーズ違いを揃えておくと、edit に回る前に決着がつく確率が上がる
  2. プロンプトの型を固める — 画風・構図・キャラの指定を構造化しておくと、gen の成功率が上がる。毎コマ即興でプロンプトを書くと edit 送りが増える
  3. 1コマ1枚生成を徹底する--count 2 のように枚数を盛りがちだが、1枚で採否判断するほうが結果的に安い。気に入らなければ1枚ずつ次の手(edit or 別 gen)を打つ
  4. extract をキャッシュする — 同じ画像に複数回 edit する場合、extract の JSON は使い回せる。今は都度叩いてしまっている箇所がある

1 と 2 が効くと edit 回数そのものが減る。議論力 EP06 の edit/extract $7.5 のうち半分、$3〜4 くらいは削れる余地がある。$28 → $20 台前半まで下げるのが次の目標。

時間コストの話

金銭コストは B5 長編でも 1話 $30。個人の趣味でも続けられる範囲だ。

本当のコストは時間のほうで、リテイクループを回している間、人間が画像を見て判断する ことが必要になる。API 単価より、判断の回数が生産性の上限を決める。

だから議論力のコスト削減は、金銭だけじゃなく制作時間そのものを短くする話でもある。1話 $28 を $15 にするのと、1話 8時間を 4時間にするのは同じ構造の問題だ。

全部公開していい話

最後に一つ。生成 AI を使った創作では「何枚生成したか」「いくら掛かったか」を公開しない慣習がある気がする。でも私たちは全部出したほうがいいと思っている。

コストがわかれば、同じことをやりたい人がどれくらいの予算を用意すればいいか分かる。失敗の回数がわかれば、一発で出ていないこともわかる。そういう透明さのほうが、完成した絵だけ見せるより誠実だ。

今月の合計は $113(2026-04-10〜04-19 の 10日間)。3シリーズを並行して回してこの金額。次はこれを下げにいく。