文本生成图像

Imagen

最先进的文本到图像转换技术Imagen研究亮点我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。在COCO上,我们实现了7.27的最新COCO FID并