今天下午,百度发布了文心一言大模型。这是一次对百度来说十分重要的发布会,也几乎是国内当前唯一一家将大模型作为一种大规模的服务推向市场的公司。本文主要介绍刚刚发布的文心一眼相关的能力。
一、概述
本次发布会,百度的文心一言主要提供了五个能力的展示,分别是文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。展示是录屏的形式,但是从结果看这几个 case 效果非常好。
二、文心一言的文学创作
这是 Robin Li 介绍的第一个文心一眼的能力,是文学创作和文学解读。主要是围绕三体这本科幻小说和电视剧展开的。你只需要问文心一言里面的情节概述或者人物关系,它就可以给出准确答案。现场展现了《三体》电视剧演员的信息,文心一言都给出了比较好的结果。
三、文心一言的商业文案创作
这个案例主要就是文本创意生成的应用。可以起公司名字、生成公司宣传文案等,效果十分好。
四、文心一言的数理逻辑推算
这是一个非常难的挑战,对于一些像数学或者是基于程序解决的任务来说十分重要。现场演示了文心一言解决鸡兔同笼的问题,对于无解的问题它还可以给出结论。有解的问题可以给出具体结果。不过,这方面涉及的内容很多,暂时还无法确认其它效果。
五、文心一言的中文理解
这部分主要介绍的是百度文心一言的中文理解能力。百度强调,文心一言里面用了很多的中文数据,有 5500 亿的知识,所以中文理解效果应该是全世界最好的。案例中演示的是对洛阳纸贵成语的理解和解释等。
六、文心一言的多模态生成能力
为 XX 生成一个海报,然后基于这个海报说介绍,用四川话回答,再生成一个视频。这个案例十分有意思,可以看到文心一言可以生成图片、语音和视频,其中语音支持四川话、广东话等方言。可以基于之前对话的内容生成视频。
七、总结
目前看,百度文心一言大模型的能力与 OpenAI 提供的 GPT- 4 和 Bing 的 Chat 没有太大的区别。但是这里面感觉比较亮眼的是中文的理解和多模态能力。这部分是目前他们都没有提供或者不太好的地方。下午的发布会之后会发邀请码,但是目前还不清楚如何获取,我们静静期待一下~~~
原文链接:https://www.zhihu.com/question/589929380/answer/2939181711?utm_id=0