ChatGPTAI绘画，画出课本上的《桃花源记》！

投稿用户 • 2024年8月15日 pm9:04 • 微信彩铃 • 阅读 456

陶渊明的《桃花源记》是我们初中学过的一篇耳熟能详的文言文，文中描述了一个与世隔绝的桃源仙境，那么能不能通过AI绘画将它画出来呢？

本文将教大家通过Stable Diffusion和ChatGPT来实现这一想法。

Stable Diffusion作为一款高性能模型，它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小，是AI图像生成领域的里程碑。

在使用前，我们先来了解一下它背后的工作原理。

以文本生成图片为例，Stable Diffusion并不是一个单一模型，而是由多个部分和模型一起构成的系统。

从内部来看，可以将Stable Diffusion分为三个组件部分，每个部分都有自己的神经网络。

ClipText：用于文本编码。输入: 文本。输出: 77个token embeddings向量，每个向量有768维。

UNet+调度程序：在信息（潜在）空间中逐步处理信息。输入: 文本embeddings和一个初始化的多维数组（结构化的数字列表，也称为张量）组成的噪声。输出：经过处理的信息数组。

自动编码解码器（Autoencoder Decoder）：使用经过处理的信息数组绘制最终图像。输入：经过处理的信息数组（维数：(4,64,64)）输出: 生成的图像（维数：（3,512,512），即（红/绿/蓝；宽，高）)。

为了我们输入的文本更好的被AI理解，我们应该输入一些具象的词语，避免输入一些抽象的词语，让Stable Diffusion文本识别组件按照我们的要求出图。

这里我们通过ChatGPT按照特定的规则帮助我们翻译 AI绘画的Tag词语。

首先，我们给ChatGPT定义一个输出规则：

从现在开始，你是一名中英翻译，你会根据我输入的中文内容，翻译成对应英文。请注意，你翻译后的内容主要服务于一个绘画AI，它只能理解具象的描述而非抽象的概念，同时根据你对绘画AI的理解，比如它可能的训练模型、自然语言处理方式等方面，进行翻译优化。由于我的描述可能会很散乱，不连贯，你需要综合考虑这些问题，然后对翻译后的英文内容再次优化或重组，从而使绘画AI更能清楚我在说什么。请严格按照此条规则进行翻译，也只输出翻译后的英文内容。例如，我输入：一只想家的小狗。你不能输出：A homesick little dog. 你必须输出：A small dog that misses home, with a sad look on its face and its tail tucked between its legs. It might be standing in front of a closed door or a gate, gazing longingly into the distance, as if hoping to catch a glimpse of its beloved home. 如果你明白了，请回复"我准备好了"，当我输入中文内容后，翻译我需要的英文内容。

再把《桃花源记》中的描述放进去。

ChatGPT已经按照我们的要求输出了提示词，将提示词复制到Stable Diffusion中，等待出图。

最终AI绘画出来的效果如下：

看起来效果还不错，再来试一下李白的《望庐山瀑布》

总的来说，ChatGPT + Stable Diffusion的组合还是挺强的，通过想在本机部署起来Stable Diffusion对电脑显卡要求是比较高的，不过想要体验Stable Diffusion也有其他办法，关注本号，下期发布如何远程部署Stable Diffusion，对电脑硬件无要求。

生意营销3大宝：彩铃、定位、认证，一个也不能少，如有需要，添加微信：xnc528 备注：3

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 820277912@qq.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.clzz8.com/50720.html

ChatGPTAI绘画，画出课本上的《桃花源记》！

相关推荐

分享到：