数字纵深论坛精彩回顾解密大模型与百度“ChatGPT”文心一言

数字纵深论坛由北京大学光华管理学院数字教育中心主办，专注分享科技前沿与商业洞见。4月，数字纵深论坛第31期邀请到了百度集团副总裁袁佛玉女士，为我们带来解密大模型与文心一言的内容分享。

分享精华

大家都能感受到，ChatGPT和百度文心一言这样的大模型非常火。今天我们就聊一聊，它爆火背后到底是什么原因？接下来还会发生什么？我们每个人、每家企业如何参与其中？

这个现象的发生，有一部分是在大家的设想之中，也有一部分在大家意料之外。甚至说，由于技术的快速发展，即使是身在其中的企业，对它的认知也在不断迭代中。很多新生事物的发展，有很大的不确定性，我们往往对它的发展方向有个大致的判断，然后需要在实践中探索获得积极反馈，才能不断地往前走。这就是“反馈驱动创新”的理念。

我们也希望跟大家一起，在新一波人工智能产业化浪潮中，共同去推动一些创新，推动人工智能技术的落地。

接下来，我重点讲一下大模型。这是当下最热、最前沿的人工智能发展方向。

1. ChatGPT爆火，AGI曙光初现

有媒体报道说：没有任何一次产业方向，行业这么快地达成共识。全球所有的大公司，都在往同一个方向去做——预训练大模型。

我们定义当下是人工智能发展的“拐点”，而不是“终点”。不是说，ChatGPT或者是文心一言就是最终形态；而是说，它是人工智能发展到这个阶段产生的一个现象级产品。接下来，还会有非常多现象级的产品出现，还会有更多的突破发生。

这种基础设施级、操作系统级的创新，又意味着什么？让我们先回看一下历史——上面这张图，左边是中国过去40年GDP的增长曲线图；右边是过去2000年世界人均GDP的增长曲线图。我们可以看到，在人类发展历史中，有很长一段时间，人均GDP是不怎么增长的。但在最近的大约250年，GDP有了高速的、指数级的增长。这个增长就是人类历史上的三次科技革命带来的。是创新驱动增长，科技创新驱动了大的增长。

所以，对于当下我们所经历的现象，本质上是我们正在经历第四次工业革命。人工智能是第四次工业革命的核心驱动力量，标志性技术就是深度学习算法。这项技术能够驱动的经济增长，会比很多人想象得更大。当下大家看到的是一些热门的应用方向，但是接下来，它会重塑整个经济、社会、产业和人们生活的方方面面。

2. 大模型智能涌现人工智能迎来拐点

那为什么是今天？为什么是现在？

其实人工智能已经跌宕起伏，火了几十年。它有过很多次被社会层面认知，受追捧，然后又冷却，又重新再受追捧。大家应该都记得，当年Google的AlphaGo在围棋上打败李世石，就引发了巨大的关注。

那么，当下这波人工智能大浪潮有什么不同？我们知道，人工智能有三要素：算力、算法、数据。今天，这三个要素的齐头并进，让人工智能技术产生了本质性的改变，来到了一个临界点。

算法上的突破是最显著的，大模型背后核心技术就是深度学习算法。数据上看，2020-2025 年，全球数据平均增速预计达到23%。而且数据是越用越多，大量企业的数字化，还会不断产生更多的数据。在算力方面，2006年-2020年，芯片计算性能提升了600多倍，未来可能还会有更大的突破。今天大家还在讨论算力卡脖子，我们认为，到一定阶段算力也许都不是问题。

算力、算法、数据三方面共同的狂飙突进，成就了今天人工智能的拐点来临。

大模型带来了更高的生产效率：一是更少的训练数据。预训练开发模式可以把训练数据量减少90%；二是更少的算力投入，通过端到端训练和微调，算力投入可以减少90%；三是更短的开发周期。模型开发时间可以下降85%，从1周缩短到1天。

3. 文心大模型

人工智能时代，应用会基于大模型来进行开发。

百度的文心大模型，是由百度智能云的AI大底座训练出来的。同时，AI大底座又包含了文心大模型的能力，并服务千行百业。

百度智能云的AI大底座，是全栈自研的，是一个全要素、端到端的AI基础设施。包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型，还有上层的产业应用。

在这四层架构上，都能做端到端的优化，性能和效果、效率就能达到极致。比如说，千卡的加速比可以提升90%，资源的利用率可以提升70%，开发效率可以提升100%。

当我们讲百度文心大模型，我们要强调的是，它是产业级的知识增强大模型。

“产业级”，指的是我们的文心大模型是来自产业，应用于产业的大模型。它是在产业实际应用中真正产生价值的一个模型，这是我们非常有特色的一个地方。业界一些大模型，其实是既没有应用场景，也没有真正的用户和客户。

“知识增强”，指的是我们的文心大模型，它不仅从无监督的语料中学习知识，还通过百度多年积累的海量知识中学习。这些知识，是高质量的训练语料，有一些是人工精标的，有一些是自动生成的。比如搜索和点击数据，信息流上打的标签，这些都是经过大量的规则和模型训练优化过的数据。再比如，我们有全世界最大的中文知识图谱数据，有5500亿事实，这些都可以作为大模型的输入。文心大模型参数量非常大，达到了2600亿。

4. 全球性AI再造拉开序幕云计算游戏规则根本性改变

大模型浪潮，带来了全球性的AI再造。那它的本质是什么呢？是生产经营效率和用户体验效率的“双效”提升，这将加速社会的 “智能化跃迁”。

一个是从供给端来看，生产经营的效率将会得到极大提升。大模型和生成式AI，已经可以帮我们写代码、写合同、写PPT。而接下来，多模融合的生成式AI，则会更深入的重塑我们生产的全流程。

另一个是从需求端来看，用户体验的效果将会得到极大提升。基于生成式AI的各种数字人，或者叫做个性化助理，会帮助我们解决健康、理财、法律等一系列问题；人和机器的交互界面也会更加自然、友好。除了生成文字之外，未来通过plug-in，就是接口的方式，你跟它讲讲话，它就可以上携程，帮你把酒店机票都订完了。对用户来讲，这个体验变得非常好，不用在各种APP之间跳转。

人工智能可以把所有的行业再造一遍。过去拥有优势的企业，可用它来巩固自己的优势。过去优势不很明显的企业，则有机会在新的阶段，用它来建立自己独特的竞争优势。

数以千计的创业公司，也正在用生成式AI来改造千行百业。全球性的AI再造已经势不可挡。每个企业需要重新思考，自己的优势是什么、如何用AI来放大这个优势。

文心一言大语言模型，会带来哪些创业机会、投资机会？我们认为，至少有三方面的机会。

一是新型云计算公司。我们认为，它适合少数大型科技公司，因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力，然后才能打磨出大语言模型，成本非常高。也没有必要每个公司都去搞一个大语言模型。大模型做得好的公司，它就会成为下一代的云计算领导者。

二是行业模型精调，是中间层，适合一些高科技创业公司，它可以基于通用大模型做一些有创造性的工作。除此之外，还有大型的集团型企业、集团中心、产业园区，也可以作为中间层的玩家。这几类公司，可以构建它所在行业的行业大模型，然后形成行业的数据闭环，根据业务需求对大模型进行精调，激发出大模型在行业里面的特定能力。

三是应用开发。这对所有的企业来说都有机会。那么这一层需要的核心能力是什么呢？是能够充分理解什么是大模型，然后对大模型充分利用，同时也对自己所在的场景，有产品能力和创新能力。

我们认为模型即服务，就是MaaS，它将撬动万亿级的市场。

中国的产业链非常丰富，我们本土产业会产生很多真实的场景和数据，这会反过来推动我们自己的大语言模型，不断地迭代和优化，最后会产生更大的价值，我们对此非常有信心。

在人工智能时代，我相信一定会出现杀手级的应用、现象级的新的产品，大家会不断地看到一个一个里程碑事件的发生。基于大语言模型的超级应用，未来创造的价值可能是移动互联网的10倍。

扫码申请

完整版视频回放

生意营销3大宝：彩铃、定位、认证，一个也不能少，如有需要，添加微信：xnc528 备注：3

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 820277912@qq.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.clzz8.com/46423.html

数字纵深论坛精彩回顾解密大模型与百度“ChatGPT”文心一言

相关推荐

分享到：