画像生成AI

画像生成AI動画生成AI画像入力プロンプト入力音声付き動画SeedreamVeo 3.1

おちつきAIラジオでは、画像生成AIは「テキストから画像を生成できる」だけでなく、画像を入力して別の形に変換・編集するサービスとして語られていた。ep.6では、SeedreamがNanoBananaと同様の画像生成AIとして紹介され、その機能の説明を通じて、番組内での画像生成AIの捉え方が示された。該当箇所を聴く

その後のep.9では、Veo 3.1の話題を通じて、画像そのものの生成だけでなく、画像入力から音声付き動画へつながる方向にも話題が広がった。番組内では、Veo 3.1について前バージョンからクオリティが上がっている感じがすると語られ、画像入力でも音が出るようになった更新として説明されていた。該当箇所を聴く

ep.6での語られ方

ep.6でしぶちょーは、Seedreamについて「画像生成AI」だと説明し、NanoBananaと同じく、テキストから画像を生成できるサービスとして話していた。また、画像を入力して、それを変換したり編集したりする形で、別の画像へ変換できるものとしても説明していた。該当箇所を聴く

番組内で示された画像生成AIの機能

この回の説明では、画像生成AIの機能は大きく二つの方向で語られていた。ひとつは、テキストから画像を生成すること。もうひとつは、画像を入力し、その画像を変換・編集して別の形にすることだった。該当箇所を聴く

この語られ方から、番組Wiki上では、画像生成AIを「テキストだけを扱うもの」ではなく、画像入力も含めて扱われるテーマとして蓄積していく。関連する観点としては、テキストや画像など複数の入力・出力をまたぐマルチモーダルな使われ方とも接続して読める。該当箇所を聴く

ep.9での語られ方：画像入力から音声付き動画へ

ep.9では、画像生成AIそのものの説明というより、Veo 3.1の更新を通じて、画像入力が動画生成・音声生成へ広がる例として語られていた。しぶちょーは、Veo 3.1について「結構それなりにクオリティは上がっている感じがする」と述べ、前バージョンから品質が上がっている印象を話していた。該当箇所を聴く

また、これまでVeo 3では、音声付き動画を作れるのはプロンプト、つまり言葉だけを入力した場合に限られていたと説明されていた。番組では、今回の更新によって画像入力でも音が出るようになった、という点が取り上げられていた。該当箇所を聴く

このため、ep.9時点の番組内では、画像生成AIに関する話題は、単に「画像を作る」だけでなく、画像を入力として動画や音に展開する画像から動画と音声を作るAIとは？の方向にも接続している。Veo 3.1は動画生成モデルとして扱われているため、厳密には静止画の画像生成AIそのものとは別領域だが、番組Wikiでは、画像入力を起点にした生成AIの使い方の広がりとして、このページにも蓄積しておく。

語られ方の変遷

初期のep.6では、画像生成AIはSeedreamの説明を通じて、テキストから画像を生成するもの、また画像を入力して変換・編集するものとして語られていた。該当箇所を聴く

一方でep.9では、Sora2との比較文脈も含む動画生成AIの話題の中で、Veo 3.1のクオリティ向上や、画像入力から音声付き動画を作れるようになった点が語られた。該当箇所を聴く

この変化により、おちつきAIラジオでの画像生成AIの扱いは、「テキストや画像から静止画を作る・編集する技術」から、「画像入力を起点に、動画や音声付きコンテンツへ広がる生成AIの一部」としても読めるものになっている。

ここにも登場

💬 この話題をAIに質問する（RAG検索へ）→

出典エピソード

10c823ac802afc9b977a71
533f3b495bb4f571734cf4

各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。