不完美的发布会，不断进步的文心一言

文 / 黄海峰的通信生活

千呼万唤始出来！

自从 ChatGPT 发布以来，AIGC（AI 生成内容）受到了行业内外的关注，人们在惊叹 AI 能力迎来飞跃式升级之余，抛出疑问：我们什么时候能拥有优秀的“国产 ChatGPT”？

在此背景下，百度率先出手。 3 月 16 日，百度举办“百度文心一言新闻发布会”，正式发布旗下预训练生成式大语言模型产品——文心一言。

文心一言有何能力，能否对标 ChatGPT？百度为何选择在这个时间节点发布？《海峰看科技》为您解读。

五大能力亮相

发布会上，百度创始人、董事长兼首席执行官李彦宏表示，在全球的大厂当中，百度是第一个发布类 ChatGPT 产品的公司，并结合演示，介绍了 文心一言的五大能力：文学创作、商业文案创作、数理推算、中文理解、多模态生成。

在文学创作方面，文心一言不仅回答了如“《三体》的作者是谁？”、“电视剧《三体》的演员都有谁？”等具有绝对正确答案的事实性问题，做到答案没有谬误，同时还回答了“从哲学角度续写《三体》”等需要逻辑推理能力、创造性的问题，展现了文心一言对语义理解、逻辑推理、内容整合生成的能力。

据李彦宏介绍，文心一言采用了知识增强和检索增强，有 5,500 亿事实知识作为训练数据，因此可以保证有关事实性问题的答复比较准确。

在商业文案创作方面，发布会现场带来了文心一言给公司起名、编写 slogan（公司宣传语）、撰写新闻稿的演示。中肯地讲，文心一言给出的答案达到了人类的平均水准。

在数理推算方面，文心一言解答了一道经典小学数学题——鸡兔同笼，面对一道无解的错误题目（第一问会算出鸡有 - 2 只），文心一言并没有生成式 AI 胡说八道的通病，而是直接指出题目错误。

数理推算一直是生成式 AI 饱受诟病的一项能力，此前就有大量网友吐槽 ChatGPT 计算能力不如计算器，基础计算都会出错。对此，李彦宏也坦言，尽管当前文新一言不能做到此类问题 100% 正确，但在过去一个多月的内测中，文心一言在不断进步。

（生成式 AI 传统艺能：胡说八道）

在中文理解方面，发布会通过写藏头诗、解释成语等方式，展示了文心一言的“文学底蕴”。李彦宏认为，百度根植于中国市场，理应在中文理解和对中国文化了解上，超出世界上任何一个预训练大模型。

谈及文心一言的英语能力，李彦宏承认其对英文的理解和处理能力尚不及中文，是因为英文训练数据量不足，未来将逐步提高外语能力，以及跨语种翻译推理能力。

在多模态生成能力方面，文心一言展示了它在文字、图片、视频生成方面的能力。无独有偶，昨天凌晨（3 月 15 日），ChatGPT 迎来升级，OpenAI 推出多模态预训练大模型 GPT-4，支持文体 + 图片输入。与之相比，文心一言胜在多了一项视频生成功能，但可惜的是，由于受算力限制，视频功能还没有对用户开放。

不完美的发布会，不断进步的文心一言

尽管上述五大能力，全方位秀出了文心一言的“肌肉”，但美中不足的是，发布会现场并没有实时调用文心一言，而是播放提前录制好的展示小样。此举让发布会整体略显平淡，少了些惊艳。

更让人遗憾的是，当前文心一言并不能像 ChatGPT 一样，人人都可体验。只有拥有邀请测试码的首批用户，才能在文心一言官网体验该产品。另外，发布会后百度智能云面向企业客户开放了文心一言 API 接口调用服务。据媒体报道，发布会后一小时内，排队申请文心一言企业版 API 调用服务测试的企业用户已达 3 万多家，申请产品测试网页多次被挤爆，百度智能云官网流量飙升百倍。

发布会的不尽人意和文心一言“可远观不可亵玩”的架势，迅速得到市场反馈。百度集团港股股价在下午迎来直线下挫，跌幅一度达到 9.81%。

有人说，百度着急发布文心一言，是被 ChatGPT“赶鸭子上架”，逼急了。其实不然，正如李彦宏在发布会所讲：“无论是什么样的公司都不可能在几个月的时间里，靠突击做出来大模型，文心一言是靠百度十几年超大规模研发投入慢慢的积累出来的。”

根据百度 2022 年财报数据显示，百度 2022 年营收 1236.75 亿元，净利润 206.8 亿元，其中研发投入达 214.16 亿元，占百度核心收入比例达 22.4%。

十年磨一剑，文心一言的诞生是基于百度在人工智能领域多年的深耕。百度认为，进入 AI 时代，IT 领域的技术栈由原先的“芯片 - 操作系统 - 应用”三层，升级为“芯片 - 框架 - 模型 - 应用”四层，百度则在全栈均有布局。

芯片层有百度自研的昆仑芯 AI 芯片，其 2 代 AI 芯片的通用计算核心算力提升了 2 - 3 倍，昆仑芯科技战略负责人宋春晓曾表示，昆仑芯 2 代已在百度文心大模型的应用中广泛落地。

框架层有百度飞桨平台，据悉，百度飞桨平台在 2022 年底已凝聚 535 万开发者，基于飞桨创建了 67 万个模型，服务 20 万家企事业单位，依托飞将平台培养了 300 多万 AI 人才。

模型层有我们熟知的文心一言。早在 2019 年，百度就推出了文心大模型 ERNIE 1.0，发展至今，ERNIE 3.0 时代下，百度每天接受 10 亿次检索请求，使能文心一言不断提升、进化。百度首席技术官王海峰介绍，基于文心一言基础模型，百度与行业伙伴发合作，发布多款行业大模型，如与国家电网合作，推出能源行业模型“国网百度文心”；与浦发银行合作，推出金融领域模型“浦发百度文心”。

应用层则是将 AI 技术与场景融合，赋能千行百业。截至目前，已有 650 家企业宣布加入文心一言生态圈。未来，百度还将把搜索、智能云、Apollo 自动驾驶、小度智能设备等多项主流业务与“文心一言”整合。

上述四层架构之间可实现端到端的相互协同，不断优化，降低开发成本，构筑更高效的大模型，这是百度独有的优势。

可以确定的是，随着生成式大模型的问世与成熟，将为企业带来生产方式的变革。李彦宏预测，生成式大模型将带来三大产业机会：机会一，云计算商业模式将从 IaaS 变转为 MaaS（模型即服务）；机会二，行业结合大模型形成行业模型精调，创造全新商业机会；机会三，基于大模型的应用开发商，或将成为互联网时代的微信、淘宝、抖音，打造出现象级、杀手级产品。

总结：让文心一言飞一会儿

文心一言的发布备受关注，坦白讲，有很大程度是因为我们期望它能够和 GPT 一较高下。或许是产品尚未成熟，亦或许是受困于商业化程度，要考虑成本，文心一言的发布没有达到笔者预期。

其实李彦宏在发布会也很坦诚地讲，文心一言的能力，不能称之为完美。但另一方面，笔者看到了百度在 AI 领域大展宏图的决心。无论是大模型训练的积极投入，还是在四层 IT 技术栈的坚持创新，以及夯实 AI 基础设施，构建百度阳泉智算中心。百度在 AI 的路上一直前行。

让人感到振奋的是，行业积极呼应国产生成式大模型建设，多家企业与百度展开合作，或是加入文心一言生态圈。这说明企业们认识到大模型及 AI 是不容错过的机会，全新的生产力工具将带来改变；也意识到只有产业合力，五指紧握，才能挥出最强一拳。

文心一言到底有几把刷子？目前还无法给出肯定的答案，还需等待文心一言全面开放，大家亲自体验过后才可知晓。让文心一言飞一会儿，人工智能彻底改变千行百业的未来，或许不远了。

举报 / 反馈

原文链接：https://baijiahao.baidu.com/s?id=1760575506267752389&wfr=spider&for=pc