Google、Imagen 3を発表:AI画像生成の新時代
Googleは、2024年のGoogle I/Oでの最初の発表から5か月後に、最新のテキストから画像へのAIモデルであるImagen 3を正式に発表しました。この新しいバージョンは、前のモデルと比較して、詳細が向上し、照明が改善され、視覚的アーティファクトが少なくなった画像品質の向上を約束します。Imagen 3は、自然言語のプロンプトをより正確に解釈するように設計されており、ユーザーは複雑なプロンプトエンジニアリングを必要とせずに特定の画像を生成できます。ハイパーリアリスティックな写真から幻想的なイラストまで、さまざまなスタイルを生成でき、画像内のテキストも明確にレンダリングできるため、カスタムグリーティングカードやプロモーション資料などの革新的なアプリケーションへの道を開きます。
安全性と責任ある使用は、Imagen 3の開発の最前線にあります。Google DeepMindは、有害または不適切なコンテンツの生成リスクを最小限に抑えるために、厳格なデータフィルタリングとラベリング技術を実施しています。生成AI技術がさまざまな業界にますます統合される中で、この倫理基準へのコミットメントは重要です。Imagen 3を試してみたいユーザーは、自然言語のプロンプトを入力することでGoogleのGeminiチャットボットを通じて利用でき、モデルが彼らの説明に基づいて詳細な画像を作成します。
進歩がある一方で、Imagen 3には一部の専門家の使いやすさに影響を与える制限があります。現在、四角いアスペクト比のみをサポートしており、風景やポートレート形式を必要とするプロジェクトには制約があります。さらに、インペインティングやアウトペインティングなどの編集機能が欠如しており、ユーザーは画像に芸術的なフィルターやスタイルを適用することができません。Midjourney、DALL-E 3、Fluxなどの競合他社と比較すると、Imagen 3は画像品質と自然言語処理において優れていますが、ユーザーのコントロールやカスタマイズオプションにおいては劣っています。全体として、Imagen 3は高品質の画像を生成するための強力なツールですが、その制限は創造的プロセスにおいてより柔軟性を求めるユーザーを遠ざける可能性があります。