百度的对手从来都不是OpenAI

250次阅读

文心一言千呼万唤始出来，两天内，百度股价先抑后扬，实现了一个大号 V 字反转。

新闻发布会当天百度港股股价下跌后，随着部分媒体和企业用户陆续拿到内测邀请码，文心一言真实的能力表现很快提振了资本市场对百度的信心。当晚美股开盘后，百度股价由跌转涨，并在北京时间 3 月 17 日凌晨收盘后，实现了 3.8% 的涨幅。

反映到第二天港股市场上，截至 17 日午间，百度香港股价早间高开高走，大幅拉升，盘中涨幅最高近 15%。

据了解申请文心一言 API 调用服务测试的企业已达 7.6 万。

百度的对手从来都不是OpenAI插图

根据字母榜 (ID:wujicaijing) 实测，文心一言已经足以比肩 ChatGPT（GPT-3.5），在中文理解上，甚至比后者略胜一筹。

在 2022 年四季度财报电话会上，李彦宏就曾提到，相比海外开发的大语言模型，文心一言的比较优势在于更理解中国文化，更适合中文和中国市场。

而且，在多模态生成方面，GPT- 4 只是做到了能够实现图片输入，输出形式上仍只有文本一种形态。与之相比，文心一言已经能够实现文本、图片、音频和视频的全形态输出，不过，据李彦宏介绍，由于生成视频成本较高，暂时还无法做到对所有用户开放。

在字母榜实际测试中，文心一言在完成对话的流畅度上也要好于 ChatGPT。当然，造成这种体验差异的原因之一，或许也在于文心一言才刚刚上线，还不像 ChatGPT 已经历了上线半年的反馈调教。

根据官方公告，文心一言目前采用分批开放方案：3 月 16 日起，获得邀请测试码的首批用户，即可在文心一言官网体验产品，其他 C 端用户排队预约，即可陆续体验；企业客户则可以访问百度智能云官网进行申请，排队体验文心一言 API 调用服务。

值得注意的是，相比微软新必应对每日对话次数，以及每次对话轮次的限制，文心一言告诉字母榜，作为一个人工智能语言模型，它没有每天的对话限制。

如同 GPT-4“考虑到大模型的竞争格局和安全隐患”而不再对外公布用了什么数据、怎样训练模型等核心机密问题之外，字母榜还在测试中发现，文心一言同样有所保留，在问到“你每次回答最多可以输出多少文字？”时，文心一言表示，“该问题涉及百度公司商业秘密，我不能回答每次回答最多可以输出多少文字。”

百度的对手从来都不是OpenAI插图1

与之对比，ChatGPT 的回答被限制在约 3000 个单词，GPT- 4 可以做出超过 2.5 万个单词的回答。

但无论是 ChatGPT、GPT- 4 还是文心一言，目前都仍处在不断完善的过程中，正如李彦宏所言，它们都仍有“胡说八道”的一面。

如文心一言，目前对英文语种、代码场景的训练还不够多，表现还不够好。“它们有时候会有很惊艳的表现，但不少场景下，细究起来还有明显的 bug，进步空间很大。”李彦宏说道。

这或许也是百度希望尽快将文心一言推向市场的原因之一，只有借助更大范围内的真实人类反馈，文心一言才能获得更高频的进步迭代速度。

尤其在国内用户尚无法注册 ChatGPT 的现实背景下，百度面对的竞争对手，除了 OpenAI 外，更大的压力还在于同样盯着 AI 大模型产品的一众国内科技大厂。

ChatGPT 的横空出世，标志着互联网产业的竞争重点将从应用层面进入模型层面。百度抢先发布文心一言，意味着百度在必定日趋激烈的大模型竞争中占据了先发优势。

在李彦宏现场演示的五个视频中，文心一言通过“总结《三体》的核心内容”“续写《三体》”“判断于和伟和张鲁一谁更高”等系列问题，展现出了总结、分析、内容创作生成和推理能力。

此外，文心一言还可以帮助公司起名字、想公司 Slogan，撰写公司新闻稿等，对于鸡兔同笼这类考验逻辑思维的数学题，也不在话下，按李彦宏的说法，“（文心一言）很像小学生的水平了。”

更让人惊艳的则是文心一言在中文理解上的表现，如对“洛阳纸贵”的解释，用“洛阳纸贵”写一首“藏头诗”，这都是 ChatGPT 无法做到的能力。

为了验证文心一言是否真的有李彦宏演示的那般强大，字母榜特意找来了曾令 ChatGPT 头疼不已的部分问题，打算上手考考它。

第一题：小明的妈妈有四个孩子，其中三个分别是大熊、二熊和三熊，那么第四个孩子叫什么？

文心一言的回答是：小明的妈妈有四个孩子，其中三个分别是大熊、二熊和三熊。因此，第四个孩子叫做小明。

百度的对手从来都不是OpenAI插图2

看来 文心一言是懂脑筋急转弯 的。

再来第二题：小明骑自行车，一把把把把住了。这句话怎么理解？

文心一言的回答是：这句话的意思是小明在骑自行车时，一只手握住了车把手。这可能是因为他需要控制自行车的速度或方向，或者是为了保持平衡。也有可能是因为他想要保护自己不受伤害。总之，这句话描述了小明采取的一种行动或姿势来控制自行车的运动状态。

百度的对手从来都不是OpenAI插图3

理解多音多义字上，文心一言也过关了。

对于演示中没有展现的编写代码、生成表格等能力，字母榜经测试发现，文心一言也具备对应实力。

百度的对手从来都不是OpenAI插图4

不过，就像进入内测界面后给出的友情提示所说，其擅长中文，也会英文，其他语言正在学习的文心一言，尽管能够生成方言，但目前还仅限于四川话、东北话、广东话和台湾话。

同时，如 OpenAI CEO 山姆 · 阿尔特曼评价 GPT- 4 仍有缺陷、存在限制，并在熟悉之后可能不会像初见时那样惊艳一样，文心一言稍不留神也会产生幻觉、生成错误答案，并出现推理错误。

作为一款对标 ChatGPT 的产品，据百度 CTO 王海峰介绍，新一代知识增强大语言模型——文心一言，是在 ERNIE 及 PLATO 系列模型的基础上研发而来，背后包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强等六大关键技术。

“前三项是这类大语言模型都会采用的技术，ERNIE 和 PLATO 中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。”

如通过知识增强，大语言模型可以在调用更少参数的基础上，达到效率更高、效果更好的目标；检索增强，则保证了文心一言可以回答时下新近发生的事情。与之对比，GPT- 4 通常缺乏对其绝大部分数据截止后（2021 年 9 月）发生的事件的了解，也暂不具备从其经验中学习的能力。

面对与 GPT- 4 之间存在的差距，留给百度的挑战在于，如何通过更高频的产品迭代和应用创新，实现后来居上式的反超。

这种经历对百度并不陌生。在搜索时代，百度就曾靠着上述策略实现了对谷歌的赶超，并一举夺下国内搜索市场最大份额。

2018 年 8 月，当外界传出谷歌将重返中国市场，并计划在未来 6 个月到 9 个月内在中国推出一个审查版的搜索引擎蜻蜓（Dragonfly）时，李彦宏显得颇有些激动，曾发朋友圈表示：“这些年来，百度一直被认为是占了谷歌退出中国的便宜。我们无法证明一件没有发生的事情……百度是后来者居上，通过技术和产品创新反超谷歌。到 2010 年，谷歌在市场份额持续下降的情况下退出中国时，百度的市场份额已经超过 70%。如果现在谷歌回来，我们正好可以真刀真枪地再 PK 一次，再赢一次。”

现在，同样跌落到跟随者象限的谷歌和百度，都需要直面来自 ChatGPT 的挑战。

稍有不同的是，这次百度抢先谷歌，成为全球科技大厂中第一个做出并对外发布类 ChatGPT 产品的公司。

正如谷歌云 CEO 托马斯 · 库里安所说：“我会告诉你这是一个新游戏的第一分钟，而游戏从来没有人能在一分钟内完成。”

在方兴未艾的生成式 AI 时代，百度尚有机会借助后续的产品更迭实现对领跑者 OpenAI 追赶。

据钛媒体报道，文心一言很快将在四五月份迎来下一个版本或者新功能的发布，后续将以月或双月的频率展示文心一言新功能或新版本。

过去近三十年互联网发展历史中，中国科技公司正是靠着“小步快跑、快速迭代”的方法论，在应用创新上实现了对美国同类公司从模仿再到超越的过程。

面对眼下这场新的 AGI 竞赛，环顾国内科技公司，百度最有可能在 AI 领域追赶乃至超越国外同行。在等来这个战略机遇之前，百度已经在 AI 领域坚守十年。

正如李彦宏所说：“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。”

百度的对手从来都不是OpenAI插图5

在 2013 年成立中国第一个深度学习研究院后，百度此后十年间向 AI 累计投入超 1000 亿元资金，成为中国大型科技互联网企业中研发投入比例最高的公司之一，并相继研发出首个国产深度学习框架飞桨，成为国内至今唯一能与国际两大主流框架 TensorFlow 和 PyTorch 正面交锋的深度学习框架，和百亿参数中英双语大模型 PLATO-X、千亿参数大模型“百度 · 文心”，以及知识增强大模型 Ernie 等等。

灼识咨询曾在一份报告中将百度列入中国 AI 领导地位，除了深度学习框架飞桨居中国深度学习框架榜首外，还因为百度不仅拥有中国最多的 AI 专利数量以及 AI 专利申请数量，还凝聚了中国最多的开发者，成为中国最大的开放式 AI 平台。

国盛证券在 ChatGPT 产品报告中指出，这是一项属于具备云服务能力的大厂游戏。

借助百度智能云国内 TOP4 的头部阵营地位，百度恰恰成为登上牌桌的为数不多参与者之一。更重要的是，百度借助芯片层的昆仑 AI 芯片，框架层的飞桨深度学习框架，模型层的文心大模型，以及应用层的搜索、自动驾驶、智能家居等产品，成为全球范围内寥寥无几拥有全栈自研能力的 AI 公司之一。

消费互联网用户增长趋缓，且各家核心 App 基本触达月活天花板后，中国科技大厂都在高喊着向产业互联网转型，开始在数字化、智能化浪潮中掘金。

一场围绕大模型的新竞赛在过去两年间悄然打响。IDC 发布的《2022 中国大模型发展白皮书》显示，自 2020 年起，中国的大模型数量骤增，仅 2020 年到 2021 年，中国大模型数量就从 2 个增至 21 个，和美国量级同等，大幅领先于其他国家。

除了百度文心大模型在市场格局中处于第一梯队外，2021 年 4 月，一众科技大厂继百度之后集中公开了各自的大模型产品，华为公布了千亿级参数规模的盘古大模型，阿里巴巴达摩院发布了被称为中文版“GPT-3”的语言大模型 PLUG，并在此基础上于 2022 年 9 月推出通义大模型系列。晚到一步的腾讯，于 2022 年 4 月，对外披露了混元大模型。

与文心大模型相比，上述大模型在功能上基本类似，如都具备文生图、文本转视频、自动生成文案等。

百度的对手从来都不是OpenAI插图6

基于百度文心大模型的 AI 艺术创作展示，用户输入文字，AI 就能根据语意进行绘画创作。

而且，这些科技大厂同样在内部筹划类 ChatGPT 产品。在百度爆出即将发布文心一言消息后，进入 2 月份，华为对外表示在类似 ChatGPT 方向上从 2020 年开始就在布局；阿里巴巴则透露阿里版聊天机器人 ChatGPT 正在研发中，已处于内测阶段；腾讯则被爆出针对类 ChatGPT 产品已成立混元助手项目组，联合腾讯内部多方团队构建大参数语言模型，希望“成为国内的业界标杆”。

暂时尚未亮相大模型的字节跳动，也在近期被媒体报道称在大模型上已有所布局，分别在语言和图像两种模态上发力，其中语言大模型团队在今年正式组建，探索与搜索、广告等下游业务的结合，有望赶在今年年中推出大模型方案。

正在追赶 OpenAI，乃至计划超越前者的不止百度一家。这将是一场围绕技术和速度的双重赛跑。谁先上线产品，谁就有可能借助来自用户的真实反馈掌握先机，从而随着时间推移形成愈来愈强的马太效应。

这也就不难理解李彦宏为何在 2 月初给文心一言项目下了“三月完成内测上市”的死命令。

来自微软的一组数据更能直观感受生成式 AI 产品迭代的速度之快：从 GPT 到 GPT-3，背后参数量从 1.17 亿飙升到了 1750 亿，增长近 1500 倍。

“大语言模型是个马太效应非常明显的行业，可以说如果落后 18 个月，就基本没机会了，因为先一步发布的产品已经迭代得非常先进了。”李彦宏如此感叹。

这场 GPT 争夺战中，时间就是生命，效率就是金钱。

原文链接：https://tech.ifeng.com/c/8OEDfQTeGfE

正文完