Imagen - 探索高级语言理解与前所未有的照片级真实感的图像生成模型

Google AI文字到图像生成模型

网站介绍:

Imagen是Google Research开发的一种新型文本到图像扩散模型。该平台通过结合前所未有的照片级真实感和深层次的语言理解，突破了传统图像生成技术的局限。

产品功能:

Imagen展示了大型预训练冻结文本编码器在文本到图像任务中的高效性，引入了新的阈值扩散采样器和更高效的U-Net架构，提高了计算效率和内存效率，缩短了收敛时间。在COCO数据集上，Imagen实现了目前最佳的COCO FID分数，并通过人类评审与参考图像进行了比较验证，显示出高级的图像-文本一致性。