~NanobananaからChatGPT、そしてローカルAIへ~
ここ最近、画像生成AIの進化が本当にすごい。
少し前までは「AIが描いた画像」と聞くと、どこか不自然だったり、ネタ用途の印象が強かったのですが、最近では普通に実用レベル。
気が付けば、私自身もブログやYoutube制作で日常的に使うようになっていました。
特に現在は、
- ブログのアイキャッチ画像
- Youtube動画用画像
- 説明用イラスト
- ネタ画像
など、かなりの頻度で画像生成AIを使っています。

最初に衝撃を受けたのはNanobanana
私が本格的に画像生成AIを使うようになったきっかけは、Gemini系の画像生成AI「Nanobanana」でした。
当時は、
「え、ここまで作れるの!?」

とかなり衝撃を受けました。
特に良かったのが、プロンプトを難しく考えなくても、かなり良い感じの画像を作ってくれるところ。
ブログ用のアイキャッチやYoutube用の画像を作るには十分すぎる性能で、
2カ月ほど前までは、私のアイキャッチ画像はほぼNanobanana製でした。
「画像生成AIって、もう実用レベルなんだな…」
と感じたのもこの頃です。
最近はChatGPT画像生成を使うことが増えた
ただ、ここ最近は状況がかなり変わってきました。
ChatGPTの画像生成機能が急激に進化したからです。

特に使っていて感じるのが、
- 日本語の理解力
- 修正指示の伝わりやすさ
- 会話しながら調整できること
この3つ。
例えば、
「もう少し表情を柔らかく」
「背景をシンプルに」
「この部分だけ変更したい」
といった内容が、かなり自然に伝わります。
画像生成AIというより、「会話しながら一緒に作っている感覚」に近い。
そのため最近は、ブログやYoutube用の画像も、ChatGPTで作ることがかなり増えてきました。
でも、やりたい事が増えると限界も見えてくる
そんな中で、Youtube動画用に「アハ画像」を作りたくなりました。
画像の一部だけが少しずつ変化する、あの脳トレ系の動画です。
ただ、この手の編集はWeb系の画像生成AIだと意外と難しい。
例えば、
- 一部分だけ変えたいのに全体が変わる
- 同じ構図を維持できない
- 微調整が難しい
など、細かな制御がなかなかできません。
そこで興味を持ったのが、ローカル画像生成AIでした。

SD.NEXTを導入してみた
私のPCはIntel製GPU。
画像生成AI界隈はNVIDIA前提の情報がかなり多く、正直かなり苦戦しました。
それでも調べていくと、Intel GPU対応も少しずつ進んでいる事を知り、ローカル画像生成AI「SD.NEXT」を導入してみることに。
最初は設定や用語だけでも大変。
- checkpoint?
- LoRA?
- VAE?
- ControlNet?
など、聞き慣れない単語だらけ。
ですが、ローカルAIならではの自由度はかなり魅力的でした。

実際にSD.NEXTを使って、アハ画像系のYoutube動画も数本作成しました。アハ画像を作りにはNanobananaやChatGPTだと元画像を編集して欲しい時、文字で伝えないといけません。SD.NEXTなら色々な機能がありますが、アハ画像ならインペイント最適。こちらは「画像の一部分だけを指定して修正・変化させる機能で、同じ構図を維持したまま、細かな違いを作れるのが特徴です。
やり方は簡単。元画像を読み込まし、変更箇所を塗りつぶします。今回は目の部分を。

次にプロンプトに変更して欲しい内容を、今回は目を倍ぐらい大きくしてと入力し、画像生成を開始。

今回は設定せず出力しましたが、さらに設定次第で、元画像の雰囲気を少し変える程度から、“もう別画像では?”というレベルまで大胆に変化させる事も可能です。
こういった細かな調整ができるのも、ローカル画像生成AIの面白いところです。
ただ、「作れる」と「伸びる」は別だった
しかし、動画の視聴数は思ったほど伸びませんでした。
こんな感じで上と下の画像で3つ違う点を考える動画等を作っていました。

結果は…視聴回数779回。かなり自信があったのに1000回もいかないなんて。(涙)
もちろん、AIで画像を作ること自体は面白い。
ですが、
「AI画像を作れること」と
「Youtubeで視聴されること」は別問題。
これはかなり実感しました。
その後、Youtubeの方向性も変わっていき、最近ではSD.NEXTを触る機会はかなり減っています。
それでもローカルAIへの興味は消えなかった
ただ、ローカル画像生成AI自体を嫌いになったわけではありません。
むしろ、
- 制限なく生成できる
- 自由度が高い
- カスタマイズ性が強い
- 細かな調整ができる
など、Web系AIにはない魅力をかなり感じています。
そんな中、最近かなり評判になっている画像生成AI「Ideogram 4.0」を知りました。
ネットでは、
「かなり強い」
「Nanobanana以上かも」
という声も多く、かなり興味を持ちました。
「これは使ってみたい!」
と思い、導入方法を調べ始めたのですが…。
必要VRAM:24GB
……終了です。
さすがにそこまでのハイエンドGPUは持っていません。
ゲームをほとんどしない私にとって、そこまでのGPUは完全にオーバースペック。
電気代も怖い。
という事で、泣く泣く断念。
そして、AUTOMATIC1111へ
ただ、その流れで気になったのが「AUTOMATIC1111」。
画像生成AI界隈では超有名な存在です。
最近はIntel GPU対応の情報も増えてきており、
「今なら試せるかもしれない」
と思い、導入してみることにしました。
次回は、実際にAUTOMATIC1111をインストールしてみた話を書いていこうと思います。



コメント