文 / 黄海峰的通信生活
千呼万唤始出来!
自从 ChatGPT 发布以来,AIGC(AI 生成内容)受到了行业内外的关注,人们在惊叹 AI 能力迎来飞跃式升级之余,抛出疑问:我们什么时候能拥有优秀的“国产 ChatGPT”?
在此背景下,百度率先出手。 3 月 16 日,百度举办“百度文心一言新闻发布会”,正式发布旗下预训练生成式大语言模型产品——文心一言。
文心一言有何能力,能否对标 ChatGPT?百度为何选择在这个时间节点发布?《海峰看科技》为您解读。
五大能力亮相
发布会上,百度创始人、董事长兼首席执行官李彦宏表示,在全球的大厂当中,百度是第一个发布类 ChatGPT 产品的公司,并结合演示,介绍了 文心一言的五大能力:文学创作、商业文案创作、数理推算、中文理解、多模态生成。
在文学创作方面,文心一言不仅回答了如“《三体》的作者是谁?”、“电视剧《三体》的演员都有谁?”等具有绝对正确答案的事实性问题,做到答案没有谬误,同时还回答了“从哲学角度续写《三体》”等需要逻辑推理能力、创造性的问题,展现了文心一言对语义理解、逻辑推理、内容整合生成的能力。
据李彦宏介绍,文心一言采用了知识增强和检索增强,有 5,500 亿事实知识作为训练数据,因此可以保证有关事实性问题的答复比较准确。
在商业文案创作方面,发布会现场带来了文心一言给公司起名、编写 slogan(公司宣传语)、撰写新闻稿的演示。中肯地讲,文心一言给出的答案达到了人类的平均水准。
在数理推算方面,文心一言解答了一道经典小学数学题——鸡兔同笼,面对一道无解的错误题目(第一问会算出鸡有 - 2 只),文心一言并没有生成式 AI 胡说八道的通病,而是直接指出题目错误。
数理推算一直是生成式 AI 饱受诟病的一项能力,此前就有大量网友吐槽 ChatGPT 计算能力不如计算器,基础计算都会出错。对此,李彦宏也坦言,尽管当前文新一言不能做到此类问题 100% 正确,但在过去一个多月的内测中,文心一言在不断进步。
(生成式 AI 传统艺能:胡说八道)
在中文理解方面,发布会通过写藏头诗、解释成语等方式,展示了文心一言的“文学底蕴”。李彦宏认为,百度根植于中国市场,理应在中文理解和对中国文化了解上,超出世界上任何一个预训练大模型。
谈及文心一言的英语能力,李彦宏承认其对英文的理解和处理能力尚不及中文,是因为英文训练数据量不足,未来将逐步提高外语能力,以及跨语种翻译推理能力。
在多模态生成能力方面,文心一言展示了它在文字、图片、视频生成方面的能力。无独有偶,昨天凌晨(3 月 15 日),ChatGPT 迎来升级,OpenAI 推出多模态预训练大模型 GPT-4,支持文体 + 图片输入。与之相比,文心一言胜在多了一项视频生成功能,但可惜的是,由于受算力限制,视频功能还没有对用户开放。
不完美的发布会,不断进步的文心一言
尽管上述五大能力,全方位秀出了文心一言的“肌肉”,但美中不足的是,发布会现场并没有实时调用文心一言,而是播放提前录制好的展示小样。此举让发布会整体略显平淡,少了些惊艳。
更让人遗憾的是,当前文心一言并不能像 ChatGPT 一样,人人都可体验。只有拥有 邀请测试码的首批用户,才能在文心一言官网体验该产品。另外,发布会后百度智能云面向企业客户开放了文心一言 API 接口调用服务。据媒 体报道,发布会后一小时内,排队申请文心一言企业版 API 调用服务测试的企业用户已达 3 万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。
发布会的不尽人意和文心一言“可远观不可亵玩”的架势,迅速得到市场反馈。百度集团港股股价在下午迎来直线下挫,跌幅一度达到 9.81%。
有人说,百度着急发布文心一言,是被 ChatGPT“赶鸭子上架”,逼急了。其实不然,正如李彦宏在发布会所讲:“无论是什么样的公司都不可能在几个月的时间里,靠突击做出来大模型,文心一言是靠百度十几年超大规模研发投入慢慢的积累出来的。”
根据百度 2022 年财报数据显示,百度 2022 年营收 1236.75 亿元,净利润 206.8 亿元,其中研发投入达 214.16 亿元,占百度核心收入比例达 22.4%。
十年磨一剑,文心一言的诞生是基于百度在人工智能领域多年的深耕。百度认为,进入 AI 时代,IT 领域的技术栈由原先的“芯片 - 操作系统 - 应用”三层,升级为“芯片 - 框架 - 模型 - 应用”四层,百度则在全栈均有布局。
芯片层有百度自研的昆仑芯 AI 芯片,其 2 代 AI 芯片的通用计算核心算力提升了 2 - 3 倍,昆仑芯科技战略负责人宋春晓曾表示,昆仑芯 2 代已在百度文心大模型的应用中广泛落地。
框架层有百度飞桨平台,据悉,百度飞桨平台在 2022 年底已凝聚 535 万开发者,基于飞桨创建了 67 万个模型,服务 20 万家企事业单位,依托飞将平台培养了 300 多万 AI 人才。
模型层有我们熟知的文心一言。早在 2019 年,百度就推出了文心大模型 ERNIE 1.0,发展至今,ERNIE 3.0 时代下,百度每天接受 10 亿次检索请求,使能文心一言不断提升、进化。百度首席技术官王海峰介绍,基于文心一言基础模型,百度与行业伙伴发合作,发布多款行业大模型,如与国家电网合作,推出能源行业模型“国网百度文心”;与浦发银行合作,推出金融领域模型“浦发百度文心”。
应用层则是将 AI 技术与场景融合,赋能千行百业。截至目前,已有 650 家企业宣布加入文心一言生态圈。未来,百度还将把搜索、智能云、Apollo 自动驾驶、小度智能设备等多项主流业务与“文心一言”整合。
上述四层架构之间可实现端到端的相互协同,不断优化,降低开发成本,构筑更高效的大模型,这是百度独有的优势。
可以确定的是,随着生成式大模型的问世与成熟,将为企业带来生产方式的变革。李彦宏预测,生成式大模型将带来三大产业机会:机会一,云计算商业模式将从 IaaS 变转为 MaaS(模型即服务);机会二,行业结合大模型形成行业模型精调,创造全新商业机会;机会三,基于大模型的应用开发商,或将成为互联网时代的微信、淘宝、抖音,打造出现象级、杀手级产品。
总结:让文心一言飞一会儿
文心一言的发布备受关注,坦白讲,有很大程度是因为我们期望它能够和 GPT 一较高下。或许是产品尚未成熟,亦或许是受困于商业化程度,要考虑成本,文心一言的发布没有达到笔者预期。
其实李彦宏在发布会也很坦诚地讲,文心一言的能力,不能称之为完美。但另一方面,笔者看到了百度在 AI 领域大展宏图的决心。无论是大模型训练的积极投入,还是在四层 IT 技术栈的坚持创新,以及夯实 AI 基础设施,构建百度阳泉智算中心。百度在 AI 的路上一直前行。
让人感到振奋的是,行业积极呼应国产生成式大模型建设,多家企业与百度展开合作,或是加入文心一言生态圈。这说明企业们认识到大模型及 AI 是不容错过的机会,全新的生产力工具将带来改变;也意识到只有产业合力,五指紧握,才能挥出最强一拳。
文心一言到底有几把刷子?目前还无法给出肯定的答案,还需等待文心一言全面开放,大家亲自体验过后才可知晓。让文心一言飞一会儿,人工智能彻底改变千行百业的未来,或许不远了。
举报 / 反馈
原文链接:https://baijiahao.baidu.com/s?id=1760575506267752389&wfr=spider&for=pc