Thursday, December 14, 2023 11:27 AM

グーグル、画像生成人工知能のイマージェン2を発表

 グーグル(Google)は、テキスト・プロンプトにもとづいて画像を生成および編集する人工知能モデル「イマージェン(Imagen)」第2世代へのアクセスをヴァーテックスAI(Vertex AI)およびグーグル・クラウドの利用者らに開放する。

 テッククランチ誌によると、イマージェン2は、初代イマージェンの性能を拡充したもので、画像生成に加えてテキストやロゴの生成や編集、重ね合わせを実行する。その結果、たとえば広告や販促材料を創作したい担当者らの作業を大幅に簡便化する。

 したがって、イマージェン2は、オープンAIのダーリー3(DALL-E 3)や、アマゾンが先日発表したタイタン・イメージ・ジェネレイター(Titan Image Generator)と直接競争する生成人工知能製品だ。

 グーグルはイマージェン2の差別化点として、複数言語(中国語、ヒンディー語、日本語、韓国語、ポルトガル語、英語、スペイン語))でテキストをレンダリングできる機能と、既存画像にロゴを重ね合わせる機能を実現した。2024年にはさらに多くの言語が追加される。

 グーグルによると、イマージェン2は、グーグル傘下の人工知能開発大手ディープマインド(Deepmind)が開発したシンスID(SynthID)技術を活用し、目に見えない透かしを生成画像に組み込むこともできる。

 その透かしを検出するにはグーグル独自のツールが必要で、第三者はその透かしを使うことも検出することもできない。グーグルはそれによって、生成人工知能が創作する偽情報や誤情報の出どころや責任の所在を明確化し、悪質または悪意ある画像や動画の生成を抑止する。

https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/