ChatGPTAI绘画,画出课本上的《桃花源记》!

陶渊明的《桃花源记》是我们初中学过的一篇耳熟能详的文言文,文中描述了一个与世隔绝的桃源仙境,那么能不能通过AI绘画将它画出来呢?

本文将教大家通过Stable Diffusion和ChatGPT来实现这一想法。

Stable Diffusion作为一款高性能模型,它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小,是AI图像生成领域的里程碑。

在使用前,我们先来了解一下它背后的工作原理。

文本生成图片为例,Stable Diffusion并不是一个单一模型,而是由多个部分和模型一起构成的系统。

从内部来看,可以将Stable Diffusion分为三个组件部分,每个部分都有自己的神经网络

ClipText: 用于文本编码。输入: 文本。输出: 77个token embeddings向量,每个向量有768维。

UNet+调度程序: 在信息(潜在)空间中逐步处理信息。输入: 文本embeddings和一个初始化的多维数组(结构化的数字列表,也称为张量)组成的噪声。输出:经过处理的信息数组。

自动编码解码器(Autoencoder Decoder): 使用经过处理的信息数组绘制最终图像。输入:经过处理的信息数组(维数:(4,64,64))输出: 生成的图像(维数:(3,512,512),即(红/绿/蓝;宽,高))。

为了我们输入的文本更好的被AI理解,我们应该输入一些具象的词语,避免输入一些抽象的词语,让Stable Diffusion文本识别组件按照我们的要求出图。

这里我们通过ChatGPT按照特定的规则帮助我们翻译AI绘画的Tag词语。

首先,我们给ChatGPT定义一个输出规则:

从现在开始,你是一名中英翻译,你会根据我输入的中文内容,翻译成对应英文。请注意,你翻译后的内容主要服务于一个绘画AI,它只能理解具象的描述而非抽象的概念,同时根据你对绘画AI的理解,比如它可能的训练模型、自然语言处理方式等方面,进行翻译优化。由于我的描述可能会很散乱,不连贯,你需要综合考虑这些问题,然后对翻译后的英文内容再次优化或重组,从而使绘画AI更能清楚我在说什么。请严格按照此条规则进行翻译,也只输出翻译后的英文内容。 例如,我输入:一只想家的小狗。 你不能输出:A homesick little dog. 你必须输出:A small dog that misses home, with a sad look on its face and its tail tucked between its legs. It might be standing in front of a closed door or a gate, gazing longingly into the distance, as if hoping to catch a glimpse of its beloved home. 如果你明白了,请回复"我准备好了",当我输入中文内容后,翻译我需要的英文内容。

ChatGPTAI绘画,画出课本上的《桃花源记》!

再把《桃花源记》中的描述放进去。

ChatGPTAI绘画,画出课本上的《桃花源记》!

ChatGPT已经按照我们的要求输出了提示词,将提示词复制到Stable Diffusion中,等待出图。

ChatGPTAI绘画,画出课本上的《桃花源记》!

最终AI绘画出来的效果如下:

ChatGPTAI绘画,画出课本上的《桃花源记》!

看起来效果还不错,再来试一下李白的《望庐山瀑布

ChatGPTAI绘画,画出课本上的《桃花源记》!

ChatGPTAI绘画,画出课本上的《桃花源记》!

总的来说,ChatGPT + Stable Diffusion的组合还是挺强的,通过想在本机部署起来Stable Diffusion对电脑显卡要求是比较高的,不过想要体验Stable Diffusion也有其他办法,关注本号,下期发布如何远程部署Stable Diffusion,对电脑硬件无要求。

生意营销3大宝:彩铃、定位、认证,一个也不能少,如有需要,添加 微信:xnc528  备注:3

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 820277912@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.clzz8.com/50720.html