数字纵深论坛由北京大学光华管理学院数字教育中心主办,专注分享科技前沿与商业洞见。4月,数字纵深论坛第31期邀请到了百度集团副总裁袁佛玉女士,为我们带来解密大模型与文心一言的内容分享。
分享精华
大家都能感受到,ChatGPT和百度文心一言这样的大模型非常火。今天我们就聊一聊,它爆火背后到底是什么原因?接下来还会发生什么?我们每个人、每家企业如何参与其中?
这个现象的发生,有一部分是在大家的设想之中,也有一部分在大家意料之外。甚至说,由于技术的快速发展,即使是身在其中的企业,对它的认知也在不断迭代中。很多新生事物的发展,有很大的不确定性,我们往往对它的发展方向有个大致的判断,然后需要在实践中探索获得积极反馈,才能不断地往前走。这就是“反馈驱动创新”的理念。
我们也希望跟大家一起,在新一波人工智能产业化浪潮中,共同去推动一些创新,推动人工智能技术的落地。
接下来,我重点讲一下大模型。这是当下最热、最前沿的人工智能发展方向。
1. ChatGPT爆火,AGI曙光初现
有媒体报道说:没有任何一次产业方向,行业这么快地达成共识。全球所有的大公司,都在往同一个方向去做——预训练大模型。
我们定义当下是人工智能发展的“拐点”,而不是“终点”。不是说,ChatGPT或者是文心一言就是最终形态;而是说,它是人工智能发展到这个阶段产生的一个现象级产品。接下来,还会有非常多现象级的产品出现,还会有更多的突破发生。
这种基础设施级、操作系统级的创新,又意味着什么?让我们先回看一下历史——上面这张图,左边是中国过去40年GDP的增长曲线图;右边是过去2000年世界人均GDP的增长曲线图。我们可以看到,在人类发展历史中,有很长一段时间,人均GDP是不怎么增长的。但在最近的大约250年,GDP有了高速的、指数级的增长。这个增长就是人类历史上的三次科技革命带来的。是创新驱动增长,科技创新驱动了大的增长。
所以,对于当下我们所经历的现象,本质上是我们正在经历第四次工业革命。人工智能是第四次工业革命的核心驱动力量,标志性技术就是深度学习算法。这项技术能够驱动的经济增长,会比很多人想象得更大。当下大家看到的是一些热门的应用方向,但是接下来,它会重塑整个经济、社会、产业和人们生活的方方面面。
2. 大模型智能涌现 人工智能迎来拐点
那为什么是今天?为什么是现在?
其实人工智能已经跌宕起伏,火了几十年。它有过很多次被社会层面认知,受追捧,然后又冷却,又重新再受追捧。大家应该都记得,当年Google的AlphaGo在围棋上打败李世石,就引发了巨大的关注。
那么, 当下这波人工智能大浪潮有什么不同?我们知道,人工智能有三要素:算力、算法、数据。今天,这三个要素的齐头并进,让人工智能技术产生了本质性的改变,来到了一个临界点。
算法上的突破是最显著的,大模型背后核心技术就是深度学习算法。数据上看,2020-2025 年,全球数据平均增速预计达到23%。而且数据是越用越多,大量企业的数字化,还会不断产生更多的数据。在算力方面,2006年-2020年,芯片计算性能提升了600多倍,未来可能还会有更大的突破。今天大家还在讨论算力卡脖子,我们认为,到一定阶段算力也许都不是问题。
算力、算法、数据三方面共同的狂飙突进,成就了今天人工智能的拐点来临。
大模型带来了更高的生产效率:一是更少的训练数据。预训练开发模式可以把训练数据量减少90%;二是更少的算力投入,通过端到端训练和微调,算力投入可以减少90%;三是更短的开发周期。模型开发时间可以下降85%,从1周缩短到1天。
3. 文心大模型
人工智能时代,应用会基于大模型来进行开发。
百度的文心大模型,是由百度智能云的AI大底座训练出来的。同时,AI大底座又包含了文心大模型的能力,并服务千行百业。
百度智能云的AI大底座,是全栈自研的,是一个全要素、端到端的AI基础设施。包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型,还有上层的产业应用。
在这四层架构上,都能做端到端的优化,性能和效果、效率就能达到极致。比如说,千卡的加速比可以提升90%,资源的利用率可以提升70%,开发效率可以提升100%。
当我们讲百度文心大模型,我们要强调的是,它是产业级的知识增强大模型。
“产业级”,指的是我们的文心大模型是来自产业,应用于产业的大模型。它是在产业实际应用中真正产生价值的一个模型,这是我们非常有特色的一个地方。业界一些大模型,其实是既没有应用场景,也没有真正的用户和客户。
“知识增强”,指的是我们的文心大模型,它不仅从无监督的语料中学习知识,还通过百度多年积累的海量知识中学习。这些知识,是高质量的训练语料,有一些是人工精标的,有一些是自动生成的。比如搜索和点击数据,信息流上打的标签,这些都是经过大量的规则和模型训练优化过的数据。再比如,我们有全世界最大的中文知识图谱数据,有5500亿事实,这些都可以作为大模型的输入。文心大模型参数量非常大,达到了2600亿。
4. 全球性AI再造拉开序幕 云计算游戏规则根本性改变
大模型浪潮,带来了全球性的AI再造。那它的本质是什么呢?是生产经营效率和用户体验效率的“双效”提升,这将加速社会的 “智能化跃迁”。
一个是从供给端来看,生产经营的效率将会得到极大提升。大模型和生成式AI,已经可以帮我们写代码、写合同、写PPT。而接下来,多模融合的生成式AI,则会更深入的重塑我们生产的全流程。
另一个是从需求端来看,用户体验的效果将会得到极大提升。基于生成式AI的各种数字人,或者叫做个性化助理,会帮助我们解决健康、理财、法律等一系列问题;人和机器的交互界面也会更加自然、友好。除了生成文字之外,未来通过plug-in,就是接口的方式,你跟它讲讲话,它就可以上携程,帮你把酒店机票都订完了。对用户来讲,这个体验变得非常好,不用在各种APP之间跳转。
人工智能可以把所有的行业再造一遍。过去拥有优势的企业,可用它来巩固自己的优势。过去优势不很明显的企业,则有机会在新的阶段,用它来建立自己独特的竞争优势。
数以千计的创业公司,也正在用生成式AI来改造千行百业。全球性的AI再造已经势不可挡。每个企业需要重新思考,自己的优势是什么、如何用AI来放大这个优势。
文心一言大语言模型,会带来哪些创业机会、投资机会?我们认为,至少有三方面的机会。
一是新型云计算公司。我们认为,它适合少数大型科技公司,因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力,然后才能打磨出大语言模型,成本非常高。也没有必要每个公司都去搞一个大语言模型。大模型做得好的公司,它就会成为下一代的云计算领导者。
二是行业模型精调,是中间层,适合一些高科技创业公司,它可以基于通用大模型做一些有创造性的工作。除此之外,还有大型的集团型企业、集团中心、产业园区,也可以作为中间层的玩家。这几类公司,可以构建它所在行业的行业大模型,然后形成行业的数据闭环,根据业务需求对大模型进行精调,激发出大模型在行业里面的特定能力。
三是应用开发。这对所有的企业来说都有机会。那么这一层需要的核心能力是什么呢?是能够充分理解什么是大模型,然后对大模型充分利用,同时也对自己所在的场景,有产品能力和创新能力。
我们认为模型即服务,就是MaaS,它将撬动万亿级的市场。
中国的产业链非常丰富,我们本土产业会产生很多真实的场景和数据,这会反过来推动我们自己的大语言模型,不断地迭代和优化,最后会产生更大的价值,我们对此非常有信心。
在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,大家会不断地看到一个一个里程碑事件的发生。基于大语言模型的超级应用,未来创造的价值可能是移动互联网的10倍。
扫码申请
完整版视频回放
生意营销3大宝:彩铃、定位、认证,一个也不能少,如有需要,添加 微信:xnc528 备注:3
如若转载,请注明出处:https://www.clzz8.com/46423.html