如何最大化利用ChatGPT的对话导出数据

注意:本文话题并不适用于没有计划通过AI构建自身知识库的普通使用者。

ChatGPT的WebUI最近有了一次小更新,在Setting选项中出现了Export Data这样的选项:

如何最大化利用ChatGPT的对话导出数据

这个选项,使你能够将当前所有的对话数据下载到本地。

如何操作呢?只需点击“Export data”按钮,页面出现提示:

如何最大化利用ChatGPT的对话导出数据

然后点击绿色按钮“Confirm export”即可。

导出的对话数据不是直接让你下载,而是会以邮件的方式,把Coversations数据下载链接发送到你账号对应的邮箱中。

有些朋友很早使用的ChatGPT账号,可能是从某宝等平台买的,极有可能是无法使用邮箱的,这种情况下,就无法使用这个功能。并且,建议也千万不要用这个功能,因为发送的数据是没有经过加密的,邮箱的持有者可以轻易看到你的对话内容。

如果是通过Google或Microsoft账号授权登录的,邮件会发送到你的注册邮箱中。

这个功能很实用,因为我们经过大量使用Chatgpt后会堆积很多的Chat会话,在左侧积累过多以至于你去找一些历史信息时很不方便。有了导出功能之后,你的历史会话信息就可以进行清理了,点击左侧的Clear conversations即可。

如何最大化利用ChatGPT的对话导出数据

那么导出的数据如何能够进行最大化利用呢?

我们先来看看导出数据的格式是什么样的。

如何最大化利用ChatGPT的对话导出数据

去你的邮箱,找到OpenAI给你发的邮件,里面有一个Download的按钮,需要注意的是,链接的有效期是从邮件发出的时间算起的24小时。所以你需要尽快下载。

如何最大化利用ChatGPT的对话导出数据

下载文件名是一串十六进制的字符串,下载前建议你修改文件名,方便你以后找到文件。建议的命名格式是“OpenAI-Conversatiosn-{日期}.zip”。

之所以要讲命名呢,是后面我会给大家介绍一些用Python和数据库来管理你的历史对话数据的方式,标准化的命名会让这件事变得更简单。

解压缩后,进入文件目录,你会看到1个html文件和4个json文件。

如何最大化利用ChatGPT的对话导出数据

conversations.json文件中存放的内容,格式与使用api方式调用gpt-3.5-turbo的请求格式完全相同。

这就意味着,OpenAI给你这个数据,是假设你以后仍会将这些数据,以嵌入式(Embedding)的方式再次使用的。这也正是本文今天要告诉大家的“最大化利用”的方法。

在message_feedback.json中,它给你提供的是你曾经在对话的某些回答中提供了反馈的数据记录。

什么叫“提供了反馈”呢?

就是每个回答右侧的这两个图标。

如何最大化利用ChatGPT的对话导出数据

很多人经常忽略这两个图标,可能很少对自己提问所获得的回答进行评价,事实上这不利于个人的使用。如果你进行更多的“赞”或者“踩”标注,你的ChatGPT会更加了解你的需求和习惯——当然,也会帮助OpenAI改进它的模型。

那么,如果你曾经提供过反馈,那么在message_feedback.json文件中,它会以上图的格式提供给你数,分别是:消息id(指的是你某个会话中的某一条消息的标识)、会话id、用户id、反馈的评价方向(Up是赞,估计Down是踩),以及你评价的文本内容。

如何最大化利用ChatGPT的对话导出数据

这是一个示例,所以它是一个数组形态,但里面只有一条数据。

有了这个信息之后,在后面我们要把这些会话历史利用起来时,它会带来一定的帮助。

model_comparison.json文件内容是空的,目前还不确定它本应有什么样的数据。

在user.json中,是你的账号信息。

如何最大化利用ChatGPT的对话导出数据

把导出的conversations.json中的数据读取到Python中,利用Qdrant这样的向量数据库,就可以把自己所使用过的知识存储起来。

本文暂不涉及实施的部分,只简明扼要介绍原理,在下一篇文章中,我会提供实施后的开源代码。

基本的原理如下:

  1. 通过一个导入脚本,将conversations.json中的数据读取并将文本发送给OpenAI的Embedding接口,获得这些文本的向量化数据;
  2. 将向量化数据存入Qdrant中;
  3. 另行做一个本地化的Web服务或脚本,支持你通过非官方界面的方式提问,在Qdrant存储的历史数据中,对提问信息进行相似度搜索,将检索到的内容作为嵌入式信息,发送给OpenAI的gpt-3.5-turbo接口,gpt-3.5-turbo模型将为你拟合出更优质的回答。

FAQ

有人会说:既然我用了网页版,为什么还有必要做个这样的东西?

如果仅仅只是短期的、临时的使用人工智能,那么必要性几乎为0。但假设前提是你希望逐渐积累自己的知识库,并且希望未来AI能非常懂你,那么这个方式,眼下使用度或许不高,但日积月累将成为你庞大的知识体系,它远远胜过自己花时间再去做各种格式化的笔记——毕竟那需要花更多的人工时间。

ChatGPT提供的数据导出方式,为我们构建这种个人知识库,提供了非常好且格式化的数据格式,拿来即用。真香!

生意营销3大宝:彩铃、定位、认证,一个也不能少,如有需要,添加 微信:xnc528  备注:3

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 820277912@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.clzz8.com/48092.html