Imagen

Imagen は、Google Brain から発表されたテキストからの画像生成モデル。拡散モデルに基づいており、(1) テキストからの埋め込みの生成、(2) 埋め込みからの低解像度画像の生成、(3) 低解像度画像からの高解像度化、の3つのプロセスで高画質な画像を生成する。OpenAI の DALL·E 2 を生成の質で破ったことで話題になった。

論文: Saharia et al., 2022. Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

コード:

参考

DALL·E 2 を早くも破る!超リアル画像生成モデル Imagen を解説