在全世界人民都仍处于 GPT- 4 的震惊中时,百度终于发布了自己的同类产品——文心一言。蓝鲸财经记者在第一时间拿到了内测名额,为大家实测这款新一代大语言模型、生成式 AI 产品 文心一言。
由于是精通中文语境,所以我们首先拿前不久一道给 chat GPT 做过的题给它做
显然,文心一言准确地识别了问题中的人物,并且精准回答了其中暗藏的 ” 玄机 ”。
但这种喜悦似乎并没有持续多久,当我希望文心一言为我推荐一些礼物备选时,它的回答真的是靠谱中夹杂着各种不靠谱。
请问哪里可以用 500 块买到 iPhone 13 Pro Max 手机,我出双倍买!
文心一言像一个听话的工具,让干啥干啥,但似乎缺乏一些判断力,比如我让它帮我撰写一段诺贝尔数学奖的领奖词,这也是写得头头是道,完全没考虑到这奖项根本不存在……
可见文心一言虽然有基础的文案撰写能力,但是对于问题并没有基础的纠错能力,同时文案本身也缺乏创意,基本是一些片儿汤话。
在见识过水平能上哈佛的 GPT- 4 后,大家对文心一言不太满意在所难免。因此也有博主将其比作 AI 界的马保国。
或许文心一言和你对于马保国武术水平的评价并不一致,但是并不能因此否定它作为一款大语言模型、生成式 AI 产品的能力。
比如我们体验了它的 AI 绘画功能,虽然某些细节有出入,但是基本要素是具备的:
在 chat GPT 横空出世之后,不少人都产生了 ”AI 焦虑 ” 担心自己的工作被 AI 取代,那文心一言会取代我们的工作吗?
身先士卒,我请文心一言帮助处理了一些工作中的常见数据收集与整理问题:
但仔细校对会发现根据国家电影局数据,2021 年春节档电影票房达 78.22 亿元,这个数据并不准确,除此之外,” 近五年 ” 的指令似乎也没有很好的执行,中间有不少遗漏。看来如果把这类工作都交给文心一言,还是很有风险的。
听说编剧也是有可能被 AI 取代的高危职业,于是我邀请文心一言续写了今年大热的电影《流浪地球 2》,希望能为李彦宏的阳泉老乡刘慈欣省点心:
文心一言对于信息的覆盖面和掌握程度无需多言,并且在分析的时候很有逻辑:
比如最近爆红的《乌梅子酱》它也能点评一二,并且像模像样:
但从整个回答也能看得出,文心一言呈现的内容比较片面,缺乏更全面的观点,与此同时缺乏更加深刻的点评,换句话说,如果把回答中的 李荣浩 换成周杰伦应该也是完全可以的,虽然 周杰伦 的粉丝可能不同意……
虽然截至目前,文心一言的表现都显得比较 AI,没有人情味,但是我发现它有些时候还是会展示一些 ” 人性特质 ” 的,比如面对感情问题,它也会表现得像个 ” 情感导师 ”
面对深刻的爱与死亡话题也能给出这样的回答:
比如下面这种情况:
截至目前,我们对于文心一言的体验暂告一段落。
虽然这场万众瞩目的发布会被各界唱衰,甚至百度的股价都应声下跌,但真正体验过之后发现,作为近期国内首款大模型,文心一言从回答速度到对话效果整体不错,虽然这其中有很多令人啼笑皆非的 bug。但敢于发布文心一言,敢于发布大模型放在公众舆论之下,本身就需要勇气,就像李彦宏自己在会上说的:” 这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异 ”,openAI 也是在不断自我迭代过程中成长为 ” 大魔王 ” 的,文心一言刚刚迈出自己的第一步。
原文链接:https://m.163.com/dy/article/I017GUU505198R91.html