画像生成AI、気が付けば日常ツールになっていた話

ガジェットレビュー

~NanobananaからChatGPT、そしてローカルAIへ~

ここ最近、画像生成AIの進化が本当にすごい。

少し前までは「AIが描いた画像」と聞くと、どこか不自然だったり、ネタ用途の印象が強かったのですが、最近では普通に実用レベル。
気が付けば、私自身もブログやYoutube制作で日常的に使うようになっていました。

特に現在は、

  • ブログのアイキャッチ画像
  • Youtube動画用画像
  • 説明用イラスト
  • ネタ画像

など、かなりの頻度で画像生成AIを使っています。


最初に衝撃を受けたのはNanobanana

私が本格的に画像生成AIを使うようになったきっかけは、Gemini系の画像生成AI「Nanobanana」でした。

当時は、

「え、ここまで作れるの!?」

とかなり衝撃を受けました。

特に良かったのが、プロンプトを難しく考えなくても、かなり良い感じの画像を作ってくれるところ。

ブログ用のアイキャッチやYoutube用の画像を作るには十分すぎる性能で、
2カ月ほど前までは、私のアイキャッチ画像はほぼNanobanana製でした。

「画像生成AIって、もう実用レベルなんだな…」

と感じたのもこの頃です。


最近はChatGPT画像生成を使うことが増えた

ただ、ここ最近は状況がかなり変わってきました。

ChatGPTの画像生成機能が急激に進化したからです。

特に使っていて感じるのが、

  • 日本語の理解力
  • 修正指示の伝わりやすさ
  • 会話しながら調整できること

この3つ。

例えば、

「もう少し表情を柔らかく」
「背景をシンプルに」
「この部分だけ変更したい」

といった内容が、かなり自然に伝わります。

画像生成AIというより、「会話しながら一緒に作っている感覚」に近い。

そのため最近は、ブログやYoutube用の画像も、ChatGPTで作ることがかなり増えてきました。


でも、やりたい事が増えると限界も見えてくる

そんな中で、Youtube動画用に「アハ画像」を作りたくなりました。

画像の一部だけが少しずつ変化する、あの脳トレ系の動画です。

ただ、この手の編集はWeb系の画像生成AIだと意外と難しい。

例えば、

  • 一部分だけ変えたいのに全体が変わる
  • 同じ構図を維持できない
  • 微調整が難しい

など、細かな制御がなかなかできません。

そこで興味を持ったのが、ローカル画像生成AIでした。


SD.NEXTを導入してみた

私のPCはIntel製GPU。

画像生成AI界隈はNVIDIA前提の情報がかなり多く、正直かなり苦戦しました。

それでも調べていくと、Intel GPU対応も少しずつ進んでいる事を知り、ローカル画像生成AI「SD.NEXT」を導入してみることに。

最初は設定や用語だけでも大変。

  • checkpoint?
  • LoRA?
  • VAE?
  • ControlNet?

など、聞き慣れない単語だらけ。

ですが、ローカルAIならではの自由度はかなり魅力的でした。

実際にSD.NEXTを使って、アハ画像系のYoutube動画も数本作成しました。アハ画像を作りにはNanobananaやChatGPTだと元画像を編集して欲しい時、文字で伝えないといけません。SD.NEXTなら色々な機能がありますが、アハ画像ならインペイント最適。こちらは「画像の一部分だけを指定して修正・変化させる機能で、同じ構図を維持したまま、細かな違いを作れるのが特徴です。

やり方は簡単。元画像を読み込まし、変更箇所を塗りつぶします。今回は目の部分を。

次にプロンプトに変更して欲しい内容を、今回は目を倍ぐらい大きくしてと入力し、画像生成を開始。

今回は設定せず出力しましたが、さらに設定次第で、元画像の雰囲気を少し変える程度から、“もう別画像では?”というレベルまで大胆に変化させる事も可能です。
こういった細かな調整ができるのも、ローカル画像生成AIの面白いところです。


ただ、「作れる」と「伸びる」は別だった

しかし、動画の視聴数は思ったほど伸びませんでした。

こんな感じで上と下の画像で3つ違う点を考える動画等を作っていました。

結果は…視聴回数779回。かなり自信があったのに1000回もいかないなんて。(涙)

もちろん、AIで画像を作ること自体は面白い。

ですが、

「AI画像を作れること」と
「Youtubeで視聴されること」は別問題。

これはかなり実感しました。

その後、Youtubeの方向性も変わっていき、最近ではSD.NEXTを触る機会はかなり減っています。


それでもローカルAIへの興味は消えなかった

ただ、ローカル画像生成AI自体を嫌いになったわけではありません。

むしろ、

  • 制限なく生成できる
  • 自由度が高い
  • カスタマイズ性が強い
  • 細かな調整ができる

など、Web系AIにはない魅力をかなり感じています。

そんな中、最近かなり評判になっている画像生成AI「Ideogram 4.0」を知りました。

ネットでは、

「かなり強い」
「Nanobanana以上かも」

という声も多く、かなり興味を持ちました。

「これは使ってみたい!」

と思い、導入方法を調べ始めたのですが…。

必要VRAM:24GB

……終了です。

さすがにそこまでのハイエンドGPUは持っていません。

ゲームをほとんどしない私にとって、そこまでのGPUは完全にオーバースペック。
電気代も怖い。

という事で、泣く泣く断念。


そして、AUTOMATIC1111へ

ただ、その流れで気になったのが「AUTOMATIC1111」。

画像生成AI界隈では超有名な存在です。

最近はIntel GPU対応の情報も増えてきており、

「今なら試せるかもしれない」

と思い、導入してみることにしました。

次回は、実際にAUTOMATIC1111をインストールしてみた話を書いていこうと思います。

コメント

タイトルとURLをコピーしました