对于大部分创业者和企业来说,新的机会在于基于新的技术平台开发新应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和 iOS,而是基于安卓和 iOS 开发的微信、淘宝、抖音等各种超级应用
图 / 视觉中国
文|《财经》记者 刘以秦 顾翎羽
编辑|谢丽容
2023 年 3 月 16 日,百度启动生成式对话产品“文心一言”邀请测试。这是国内第一款对标 ChatGPT 的生成式对话产品。当天,百度创始人李彦宏说,大家对它的期望值是对标 ChatGPT,甚至要对标 GPT-4,这个门槛还是很高的。
3 月 16 日,百度新闻发布会后,百度港股股价单日跌幅 6.4%。3 月 17 日,股价回弹,单日上涨 13%。
李彦宏在现场接受《财经》记者的采访时表示,内测中“文心一言”并不完美, 之所以现在目前这个节点发布邀请测试,主要两大原因: 一是去年开始全球人工智能技术发展从过去的判别式 AI(数据库比对)转为生成式 AI(生成新内容),百度加快研发脚步,近半年市场验证了这个判断;二是更多的机会出现在了生成式 AI 这些方面,无论是百度内部产品还是合作伙伴都有强烈需求。
全球最先在生成式对话领域掀起风浪的是微软投资的美国创业公司 OpenAI。该公司在去年 12 月推出的基于 GPT-3.5 大模型的 ChatGPT 火爆全球,3 月 15 日 OpenAI 进一步推出新升级的 GPT- 4 大模型,相比前一代有了不小的提升;3 月 17 日,微软在发布会上宣布,将 GPT- 4 的能力融入 Office 系列产品。AI 大模型的特点是能够在更宽泛、更大规模的数据上进行训练,效率更高,学习能力更强,但耗费资源更大。
ChatGPT 火爆后,多家公司宣布也在研发类似产品,百度是目前中国头部科技公司中第一个落地产品的。文心一言基于文心大模型技术。2019 年,百度推出文心大模型 ERNIE1.0,2022 年 11 月,该模型进化成 3.0 版本。李彦宏称,文心大模型每天接受数十亿次用户搜索请求,这也为文心一言提供了庞大的数据池。
生成式对话产品并非一个全新形态的产品。它的典型同类产品是对话式 AI 产品,包括各类语音助手、聊天工具等。第三方数据机构 IDC 数据显示,2022 年,对话式 AI 市场规模达到 54.6 亿元,市场渗透率已经饱和。但此前的产品并未引入大模型,新一代产品的出现,将重新激活市场。
文心一言除了能够生成文字内容,还能生成图片、音频和视频内容,由于成本原因,文心一言的视频生成内容暂未对外开放。
无论是 ChatGPT 还是文心一言,目前都是比较初级的产品,且尚未找到清晰的商业模式,这也是目前行业里最关心的话题。ChatGPT 是面向 C 端用户收费,但依然严重亏损,2022 年全年预计亏损 5.4 亿美元,且用户量越大,亏损越严重。百度目前对文心一言的定位更偏向 B 端,李彦宏称,文心一言的定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,创造商业价值。
李彦宏的判断是,生成式 AI 代表了一个新的技术范式,是一个每家企业都不可以错过的巨大的机会。AI 市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。
据百度官方数据,截至 3 月 17 日上午 10 点,申请文心一言 API 服务测试的企业已达 7.6 万家。
某中国 AI 创业公司 CEO 向《财经》记者评价,中国需要有自己的大模型产品,从算力、数据、人才储备等方面,百度在中国市场优势明显,尽管目前和美国还有差距,但“必须要有勇气走出第一步”。
有差距也有亮点
新闻发布会现场,李彦宏展示了文心一言的 5 个场景,分别是:文学创作、商业文案创作、数理推算、中文理解、多模态生成。
《财经》记者对比文心一言和 GPT- 4 针对同一问题的回答,发现文心一言对于中文的理解,在某些时候是优于 GPT- 4 的,例如当问题是病句或容易造成歧义的表述时,文心一言能够理解提问者的意思,GPT- 4 的回答会有所偏离。同时,它们都存在“胡说八道”的情况,不过,新版 Bing 中的 GPT- 4 会附上内容来源链接,便于用户二次确认。
文心大模型训练使用的数据以中文为主,因此文心一言能够更好理解中文,甚至能生成不同方言的音频。文心一言也支持英文互动,但效果相对较差,其他语种目前还不支持。
此外,文心一言会选择性回答问题,若问题中涉及敏感词,它会说“我无法回答这个问题”。李彦宏提到,整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的问题,进步空间很大。
大模型训练成本高昂,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。 百度拥有全栈式 AI 能力,从芯片(昆仑芯),到深度学习框架(飞桨),再到预训练大模型(文心),到搜索、智能云、自动驾驶、小度等应用,各个层面都有自研技术。
李彦宏表示,全栈式布局可以大幅提升效率,显著降低成本。另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断优化迭代。
新商业机会
马斯克是 OpenAI 最早的创始人之一,后期退出。今年 2 月,他在社交平台上公开批评 OpenAI“最初是作为一家开源的非营利性公司而创建的,这也是为什么我把它命名为 OpenAI,旨在抗衡谷歌,但现在它已经成一家闭源的营利性公司,并由微软控制……这完全不是我的本意”。
由于 OpenAI 选择了封闭,只对接微软全系产品,外界将它类比为苹果的 iOS 操作系统。百度的文心大模型走的是开源模式,类似于谷歌的安卓操作系统。
百度对文心一言的定位是“一个通用的赋能平台”,金融、能源、媒体、政务等行业,都可以基于这个平台来做智能化改造,实现效率提升。
除此之外,按照规划,文心一言也将全面嵌入现有业务中,包括搜索、智能音箱、百度智能云、智能驾驶等。
在搜索场景中,文心一言可以补充、升级搜索体验,类似目前 Bing 中集成了 GPT- 4 的体验。搜索引擎能以此形成新的流量入口,获得新的数据。在智能驾驶场景中,可以与百度阿波罗自动驾驶舱、车路协调做融合,提升无人驾驶的可靠性。
李彦宏提到,大模型时代将产生三大产业机会:
第一类是新型云计算公司。 之前企业选择云厂商更多看算力、存储等基础云服务。未来,框架、模型的质量,以及模型、框架、芯片、应用这四层之间的协同能力,会变得更重要。微软已经将 ChatGPT 的能力融入 Azure 云服务,多位业内人士提到,这将有助于 Azure 提高市场份额,也是微软投资 OpenAI 的商业回报之一。
在中国市场,目前百度云的市场份额低于阿里云、华为云和腾讯云。不过,智能云是目前百度增速最快的业务,2022 年营收同比增长 23%,这一增速也高于另外三家云厂商。文心一言的出现,或许能够帮助百度云拿下更多市场份额。
第二类是通过调用大模型能力,为行业提供解决方案的公司。 目前文心大模型已经在电力、金融、媒体等领域,发布了 10 多个行业大模型,在各行各业都可能创造机会。
第三类是基于大模型底座开发应用的公司,即应用服务提供商。 李彦宏说,“今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。”
中国 AI 大模型进展
基于大模型的生成式 AI 已经成为新一轮市场热点。数据服务商 Dealroom 报告显示,全球生成式 AI 企业估值已达 480 亿美元,在过去 2 年里翻了 6 倍。
中国投资人和创业者们也已经入局。前美团联合创始人王慧文成立 AI 公司“光年之外”,多家知名投资机构立即跟进,天使轮估值已经达到 2 亿美元。一家在几年前就开始做大模型的 AI 创业公司,一度无人问津,近期该公司创始人告诉《财经》记者,几乎每天都有不少投资机构来询问是否接受融资。
目前,中国初创公司中,能够做出真正有影响力产品的还很少。 多位投资人表示,短期内能够看到实际应用效果的,可能是抖音、快手这类视频平台。目前,字节跳动和快手均有布局 AI 大模型和生产式 AI。
其他头部科技公司中,腾讯、阿里巴巴、华为也在行动。2022 年 4 月,腾讯对外披露“混元”大模型,协同了腾讯预训练研发力量,覆盖 NLP(自然语言处理)大模型、CV(机器视觉)大模型、多模态大模型及多个领域任务模型。
2022 年 9 月,阿里巴巴在世界人工智能大会上,发布“通义”大模型系列,并宣布相关核心模型向全球开发者开源。华为云团队于 2021 年 4 月发布“盘古”大模型,2022 年 11 月,在华为全联接大会 2022 中国站上,华为云发布盘古大模型的新技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古 OCR 大模型三项新服务。
ChatGPT 火了之后,中国不少公司都在尝试研发类似产品。但这件事成本极高。OpenAI 每年的研发费用高达几十亿美元,GPT-3.5 语言大模型包含 1750 亿个参数,微软为 ChatGPT 构建了超过 1 万枚英伟达 A100GPU 芯片的 AI 计算集群。GPT- 4 的参数值在此基础上又大幅提高。谷歌 3 月 6 日推出的多模态大模型 PalM-E,参数值达到了 5620 亿。
一位长期关注 AI 的投资人告诉《财经》记者,中国的创业公司从零去做类似产品,非常不划算,也很难追赶进度,应该将重心放在行业应用上。
另一位投资人提到,由于监管因素,文心一言为代表的国产替代产品未来才是主流。
文心一言的出现,或许能够帮助中国公司更好地理清思路。李彦宏称,对于大部分创业者和企业来说,新的机会在于基于通用大语言模型,抢先开发重要的应用服务。“就像移动互联网时代,最成功的商业产品不见得是安卓和 iOS,而是基于安卓和 iOS 开发的微信、淘宝、抖音等各种超级应用。”
原文链接:https://new.qq.com/rain/a/20230317A0785B00