Googleの新しいAI「Whisk」、画像生成を革命化する!
2024-12-17
著者: 雪
米Googleは12月16日(現地時間)に、画像を入力することで新たな画像を生成するAIツール「Whisk」を発表しました。
Whiskは、ユーザーが画像をドラッグ&ドロップすることで、プロンプトを作成し、それに基づいて独自の画像を生成できるGoogle Labsの実験的プロジェクトです。これにより、ユーザーは個別の画像から得た情報をもとに、よりクリエイティブな作品を作り出すことができます。
具体的には、Subject(被写体)、Scene(シーン)、Style(スタイル)という3つの要素を組み合わせることで、ユーザーは自分の思い描くビジュアルを簡単に作り上げることが可能です。このプロセスは、従来の画像生成と比べてはるかに直感的で、誰でも気軽にクリエイティブな表現ができるようになります。
Whiskは、Googleの生成AI「Gemini」を使用して、画像に関する詳細なキャプションを自動的に作成し、それをGoogleの画像生成モデル「Imagen 3」に入力する形で動作します。これにより、ユーザーが要求するイメージを正確に反映した結果を提供することが可能となります。
また、独特な画像を生成するための条件の設定が豊富で、色合い、質感、体型などの要素も自由自在にコントロールできる点が強調されています。たとえば、生成される画像の身体的特徴や色合いを指定することで、よりパーソナライズされた出力が得られるのです。
Googleは、Whiskを通じてクリエイターやアーティストが新たな表現方法を発見し、インスピレーションを得られることを期待しています。また、Webデザインや広告、ゲーム開発など、多岐にわたる分野で活用できる技術とされています。
未来のクリエイティブな可能性を広げるWhisk、その登場はまさに画像生成の新時代の幕開けと言えるでしょう。今すぐ試して、未知の世界を探索してみてください!