这种新的技术被称为SnapFusion,它可以根据用户输入的文字提示,快速生成清晰的图像。Snap公司表示,这是目前学术界公布的最快的速度。该公司在博客文章中介绍了这项技术的原理和优势:
Snap Research通过优化网络结构和去噪过程,使得模型非常高效,同时保持了图像质量。因此,现在可以运行模型来根据文字提示生成图像,并在移动设备上几秒钟内得到结果,而不是像其他研究那样需要等待很长时间。
Snap Research还发布了一篇论文(PDF格式),详细介绍了SnapFusion技术,并展示了一些由该技术生成的艺术作品。论文中指出:
具体来说,我们提出了一个高效的UNet,通过识别原始模型的冗余,并通过数据蒸馏减少图像解码器的计算。此外,我们通过探索训练策略和引入无分类器指导的正则化,增强了步骤蒸馏。
不过,这项新技术还需要一段时间才能面向广大用户开放。但是Snap公司表示,它“有潜力在未来为移动设备上的高质量AI生成图像体验提供强大的动力”。IT之家猜测,这项新技术很可能会添加到Snapchat移动
应用程序的未来更新中。