🔔✅ChatGTP3.5免费使用，AI绘图低至0.059元/次🔥🔥🔥🔥

这里是知道AI网 ! 速记本站地址：idknowai.com 🏠 I don't know AI

实测百度「文心一言」，4次迭代后还是翻车了？

182次阅读

5 月 4 日，百度创始人、董事长兼首席执行官李彦宏在内部活动演讲环节表示，算力是可以买来的，创新能力是买不来的，需要自建。但目前来看，国产 AI 还没有能得到广泛认可的产品真正跑出来。

出品 | 微果酱（wjam123456）作者 | 陈出木

在李彦宏近期的发言中，他提到，文心一言内测一个多月，完成 4 次大的技术升级，大模型推理成本降到原来的十分之一，或者说推理性能提升近 10 倍。“当别人刚刚开始思考如何进行训练的时候，我们已经在推理上冲出了很远。”

实测百度「文心一言」，4 次迭代后还是翻车了？

这十分自信里，不知道产品体验能占几分？

相较于 Bing（必应）突然全面开放，文心一言现在仍然处于内测阶段，此前申请过内测资格的小伙伴们正在排队体验，如果申请成功将收到短信通知。

实测百度「文心一言」，4 次迭代后还是翻车了？

文心一言的界面和 Bing 是相似的，不过对于 AI 小白来说，文心一言的对话框还提供了快捷插入提问模板的功能，只需要输入“/”即可获取写报告、画画、查知识的提问模板。

实测百度「文心一言」，4 次迭代后还是翻车了？

那么，文心一言和 Bing 相比如何呢？果酱妹替大家测试了一下~

01#中文理解

鉴于文心一言宣称自己“擅长中文”，果酱妹向它提问了一个经典的 中文脑筋急转弯——能否把大象放进冰箱。但文心一言的脑筋似乎并不能很好地“转弯”，回答认为大象不能放进冰箱。

经过进一步引导，将问题修改为更常规的谜面“把大象放进冰箱需要几步”，文心一言才能给出果酱妹想要的答案，同时仿佛没有意识到这是个脑筋急转弯，不忘提醒要“充分考虑大象的福祉”。

实测百度「文心一言」，4 次迭代后还是翻车了？

果酱妹也问了 Bing 同样的问题，它却能识别出“这是一个著名的连环谜语”，并不需要引导就可以准确给出提问者真正想知道的答案。

实测百度「文心一言」，4 次迭代后还是翻车了？

脑筋转不了弯没关系，那么作为 中文写作的辅助工具，文心一言的表现如何呢？

果酱妹将体验文心一言的选题任务交给了它，直接生成的文章近似于初中生写作水平，但遣词造句显得生硬，需要后期进行人工优化。

实测百度「文心一言」，4 次迭代后还是翻车了？

而面对果酱妹提出的细化要求，文心一言展现了简单在原文章中加了一段的偷懒操作。

实测百度「文心一言」，4 次迭代后还是翻车了？

直到果酱妹质疑其不懂“细化”，文心一言开始出现听懂命令但“婉拒”作答的情况——我理解细化但不想干，输出的还是原文。

实测百度「文心一言」，4 次迭代后还是翻车了？

相比闪现反骨的文心一言，Bing 更像是在乖巧中透着敷衍。面对写文章的要求，Bing 总是会先推荐相关阅读文章，不打算接茬写稿，等到提问者进一步要求，它会在认真交互一轮之后给出一篇不太及格的短文。

实测百度「文心一言」，4 次迭代后还是翻车了？

可见，两者对于文字工作都只能做到汇总网络资料的程度，更进一步则还是得依靠人类进行编排和串联。而再细看会发现，文心一言生成的文章比 Bing 生成的文章会多一些连接词和过渡句，更加符合中文创作习惯。

这一点在果酱妹让两者用“天气真好”作一首藏头诗时也有所体现。

Bing 显然不太能理解“藏头诗”，给出的结果差强人意，只是反手给了一个可用的“藏头诗在线生成器”链接。

实测百度「文心一言」，4 次迭代后还是翻车了？

而文心一言在传统文化领域基本完胜，轻松生成符合要求的藏头诗。

实测百度「文心一言」，4 次迭代后还是翻车了？

02#信息检索

作为都是接入了 AI 的搜索引擎，对于普通用户来说，信息检索或许是用得最多的功能。这就要求 AI 输出的回答必须是准确的，否则其他功能玩得再花也难以获得大众的青睐。

在测试过程中，对于确定的信息，诸如某本书的作者、某个名人的生日等，文心一言和 Bing 都可以轻松驾驭。但如果提问最近的新闻或网络热梗等，两位 AI 都可能会给出错误的答案。

比如关于“GPT- 5 什么时候发布”这个问题，此前有诸多媒体报道将在今年发布，实际上 OpenAI 的创始人在前几天对此作了辟谣。

而显然，文心一言只注意到此前的信息，忽略了最新的内容。

Bing 也犯了同样的错误。

实测百度「文心一言」，4 次迭代后还是翻车了？

03#AI 绘画

在这个环节的测试中，果酱妹让文心一言和 Bing 分别画画：

画一幅画：一位扎着马尾辫的美少女在阳光下奔跑，二次元画风，色彩丰富，展现出快乐、自由的感觉，穿着白色背心、黄色短裤、白色运动鞋

Bing 首先表示自己不能画画，但可以提供找灵感的渠道以及网络图片集合。就提供的图片搜索结果来看，和果酱妹提出的要求属实差得有点远。

实测百度「文心一言」，4 次迭代后还是翻车了？

而有 AI 绘画平台文心一格支撑着的文心一言，在经过几轮交互、引导之后，能给出一张满足部分要求的画作。过程中，文心一言出现的较大缺陷集中在 AI 一直难以驾驭的手部和眼睛细节。

实测百度「文心一言」，4 次迭代后还是翻车了？

04#解答数学题

果酱妹找了几道数学题给两个 AI 试手，结果半斤八两，稍稍需要逻辑能力的题目基本都无法解答。

文心一言属于一本正经胡说八道型，一堆数学符号之后得出错误答案。

实测百度「文心一言」，4 次迭代后还是翻车了？

在投喂了正确答案之后，文心一言通过错误的算式强行得出既定答案。无论果酱妹如何质疑，文心一言都保持着礼貌但瞎说的解题态度。

实测百度「文心一言」，4 次迭代后还是翻车了？

Bing 则属于碰运气的差生，同样的题目首次解答错误，在得到答案之后就顺利地推导出了过程。

实测百度「文心一言」，4 次迭代后还是翻车了？

但当果酱妹兴致勃勃地提问了更难的题目之后，Bing 便招架不住了，也出现了强行推导既定答案的情况。根据其底部出现的来源，果酱妹猜测是因为 Bing 没有组卷网的会员，所以没办法输出正确答案。

（这一刻简直能与 AI 共情）

实测百度「文心一言」，4 次迭代后还是翻车了？

05#写在最后

经过对文心一言和 Bing 的不完全测试，大家会发现，两者仍然存在差距，但差距并没有大家想象的那般如鸿沟。

目前 AI 普遍做不来的任务，文心一言和 Bing 都无法解决。而在 AI 的功能舒适区中，文心一言的交互会让你感受到 AI 的生硬感，Bing 的应答则更加流畅。

但作为一款工具，实用性应该在第一位。两者都属于接入 AI 的搜索引擎范畴，最关键的是能够解决用户提出的问题。就目前来看，完全依赖 AI 作答，以替代人工检索，暂时还不能够实现，如果只是作为工作辅助，它们确实已经展现出一定优势。

可以说，经过一个多月的内测，文心一言有了更多的语料投喂，确实表现出了成长的效果。但其优势如果只有对中文的理解，普通大众很难放弃同样支持中文且经过更长时间训练的 Bing。

不过，现在下定论仍然过早，文心一言还在发展初期，让我们期待其正式开放那天，看看是否如李彦宏所说完成了国产 AI 的自建。而退一万步说，比起 Bing，文心一言的最大优势应该是不需要科学上网吧。

特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的 30 日内与新浪网联系。

原文链接：http://k.sina.com.cn/article_5918992542_160cca89e001011tap.html

正文完

发表至：资讯

2023-08-05

版权声明：本站原创文章，由不知道 2023-08-05发表，共计2503字。

转载说明：声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。

浅谈文心一言

什么是人工智能？人工智能、机器学习、深度学习三者之间有什么关系吗？

免费好用的音频AI软件推荐

ChatGPT是啥？一款智能聊天应用程序的介绍

文心一言是什么？干嘛用的？

阿里云大模型的「阳谋」：全面发展不偏科，一力降十会