探秘文心一言,内测近俩月发生了什么

123次阅读

原创 任晓宁 经济观察报

文心一言的演进过程,可以看作国内大模型行业一个缩影。

作者:任晓宁

封图:图虫创意

一众互联网企业中,百度是国内最早推出大模型产品内测的公司。目前有 15 万家企业申请接入百度的大模型产品文心一言,合作的外部公司数量也最多。文心一言的演进过程,可以看作国内大模型行业一个缩影。

3 月 16 日,百度文心一言公开邀测,现在已有近 2 个月时间。这段时间,百度的大模型有哪些改变,做了哪些落地?与其他大模型有哪些不同进展?5 月 9 日,经济观察网记者就此采访了百度集团副总裁侯震宇。

成本大规模下降

提到大模型,很多人第一反应是贵,比如投身大模型赛道的创业者王慧文等人,需要自带 5000 万美元入局。外部流传的数据是,大模型训练一次需要花 3 个月时间,需要花近 1000 万美元。

不过侯震宇告诉记者,大模型真不像很多人想象的那么贵。“做大模型有点贵,用大模型没那么贵,”尤其是使用大模型的企业,做再训练或是微调,所处理的数据、算力规模,与从零开始训练千亿大模型的规模,完全不在一个量级。

当下推出大模型的公司数十家,谁能成为最终胜利者?侯震宇认为,效果和成本,将是决定大模型能不能成的关键因素。

3 月 16 日以来,百度文心一言已内测近两个月,完成了 4 次技术版本升级。推理成本降到了十分之一,推理性能提升近 10 倍。

“当别人刚刚思考如何进行训练的时候,我们已经在推理上冲出了很远。”5 月 4 日,李彦宏在百度内部大会上这样说。

侯震宇告诉记者,接下来,文心一言还会有大规模成本下降。包括模型微调、模型再训练、模型使用等,“价格不会成为大家使用或者拥抱大模型的瓶颈。”

当前,国外大模型公司亏损正在增加中。近期国外媒体 The Information 报道称,大模型鼻祖去年 OpenAI 亏损额翻倍,达到 5.4 亿美元。侯震宇提到,百度不会这样,因为百度一开始就非常注重在成本和性能上的优化。“大模型对于百度来说,是一定要做的。而且我们也可以让成本更低。”

对比国外,国内大模型公司的成本会较低。“我们的电更便宜,云服务也更便宜。微软云的毛利大概有 60%,国内没有几家云厂商能有这样的利润。”侯震宇认为,OpenAI 的亏损,是国外特定场景,也是先驱者的探路成本,国内大模型平台不会一样。

当然,国内大模型产品目前都没有公开测试,这也是成本相对可控的原因之一。

从科幻落地现实

对于百度,文心一言内测前后是一个分水岭。用侯震宇的话说,内测前也有客户找上门,当时他们聊的,就像是科幻片里的题材。

3 月份来到百度的客户,主要由各个公司一把手、CEO 带队。他们都很兴奋,觉得大模型什么都能做,想法天马行空。但现在看,大模型并不是万能的,它需要几个要素:接收到更多的知识,并且真正在实际场景落地。

3 月份文心一言刚内测时,人们流行问它一些刁难古怪的问题,或是让它写一篇小作文,考几道数学题。现在不一样了,侯震宇前几天见了一个机器人公司,他们考虑的是,怎样通过文心一言,让自己的机器人变得更智能。

最近找到文心一言的人,职级比三月份有所降低,不再是公司一把手,而是各个公司业务或技术负责人。但侯震宇很高兴,因为这说明文心一言已经开始真正落地了。

有一个客服公司,接入文心一言后,同样产出文字回复的成本,每万字从 100 元降低到 1 元。这家公司成本因为使用大模型而降低,是他们愿意尝试这个新鲜事物的原因。

金山办公近期也在与文心一言联合测试。金山办公助理总裁田然称,百度大模型的迭代速度很快,并在多个方面取得了优势。目前在意图理解、PPT 大纲生成、范文书写、待办列表生成、文生图等多模态生成方面,金山办公与文心一言正联合测试。

近两个月内,文心一言在生物医药、汽车、芯片等领域也有落地。和百图生科联合构建了生物超算平台,训练超千亿级的多模态大模型,进行创新药物的研发。和长安汽车构建了人工智能基础设施平台,双方基于文心一言联合研发了一款新的人工智能产品。

侯震宇承认,这项新技术距离大规模落地还有很远的距离,但相比 3 月份,现在已经变得更实际了。

文心一言诞生后,对于百度还产生另一个好处,就是 AI 业务变得简单了。此前,百度一直主打 AI,想把 AI 与各行各业结合,但实际做起来很难。

比如之前有个客户,要做 AI 业务,百度工作人员需要拿着各种各样的数据,去为客户单独训练一个 AI 模型出来。现在在一个已经训练好的预训练大模型基础上,可以用比较低的门槛做出细分模型。作为 AI 从业者,侯震宇认为,这是一个很大的福音。

“黄金”时代的资本去向

高铁上挨打后还手,法律为什么处罚

股权财政能替代 9 万亿土地财政吗

原标题:《探秘文心一言,内测近俩月发生了什么》

原文链接:https://www.thepaper.cn/newsDetail_forward_23053474

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-28发表,共计1926字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。