Googleの新機能!3枚の画像を魔法のように1枚に変身

Google Labsが開発した新たな画像生成ツール「Whisk」が注目されています。これは、従来のテキストではなく、画像をプロンプトとして使用し、写真の主題、シーン、スタイルを変えることによりリミックスすることが可能です。
例えば、あるユーザーが手持ちの写真を使いたいとき、Whiskを利用すると、その写真をベースに異なるスタイルやシーンで再構成された新しいバージョンを作成できます。これにより、写真に新たな命を吹き込むことができ、よりクリエイティブな表現が実現します。
この技術のバックボーンとなるのはGoogleの画像生成モデル「Imagen 3」です。新しいアプローチとして、Whiskは一つの画像を、主題用、シーン用、スタイル用の3つの画像に分解し、それを組み合わせることにより多様な表現が可能となっています。Imagen 3はこの複雑な生成過程を支え、質の高い画像生成を実現しています。
Whiskの試験段階では、ユーザーがどのようにこのツールを用途に合わせて創造的に利用するかが焦点となっており、Googleはこの技術をどのように改善していくか模索中です。この技術革新により、写真編集の新たな基準を確立することが期待されています。
これって、どんなメリットがあるの?
写真がどう変わるのか、想像つかないんだけど!
画像をプロンプトにすると、スタイルやシーンを自在に変えられ、新しい表現が可能になります。
ユータさん、Whiskの最大のポイントは、画像をベースにリミックスできることです。
これまでのテキストプロンプトとは違い、既存の写真を使い新たなシーンやスタイルに変換可能です。
例えば、旅先の写真を違った季節や雰囲気に変えることなどができます。
写真編集の枠を超え、今までにないクリエイティブな手法が生まれる、といえるでしょう。
アヤカさんのおっしゃる通り、画像プロンプトによって自由な発想が活性化されます。
この技術は、私たちの表現の幅を広げ、新しい可能性を開拓してくれるでしょう。