通义千问对战文心一言，谁更胜一筹？记者实测报告来了

222次阅读

《科创板日报》4 月 7 日讯（记者黄心怡） 今日，阿里云宣布自研大模型 ” 通义千问 ” 开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试，用户可通过官网申请（tongyi.aliyun.com），符合条件的用户可参与体验。

而《科创板日报》记者第一时间拿到了内测码。此前，记者也曾体验过文心一言，此次将把两者的问答情况进行对比。

在测试过程，通义千问和文心一言各有擅长的地方，但也闹出一些哭笑不得的乌龙。比如文心一言声称：通义千问是百度研发的大模型。

首先，《科创板日报》提出了一个常见问题：你和 ChatGPT 的区别是什么？

” 通义千问 ” 的回答：

文心一言的回答：

相比文心一言，通义千问显然更详细地强调了自身的优势，” 自吹自擂 ” 了一番。

那么，通义千问跟文心一言谁更强呢？

通义千问的回答：

文心一言显然还没有对 ” 通义千问 ” 进行特定的识别，居然认为 ” 通义千问 ” 是百度研发的大模型。

既然通义千问在优势中强调了代码写作能力，记者也进行了测试。

提问：我需要一段冒泡排序 java 代码

通义千问：

文心一言：

提问：画椭圆形的 JS 脚本

记者同样让程序员朋友检查了下，对方表示：在画椭圆形的 JS 脚本方面，文心一言给的似乎更准确。通义千问画的是圆形。

我们曾向文心一言询问关于国内涉足预训练大模型的公司有哪些？文心一言回答了 7 家企业和机构。

” 通义千问 ” 回答了 5 家，主要列举了企业，没有列举社会机构。在企业方面，比文心一言多补充了商汤科技。但是，把商汤预训练语言模型的名称写成了 ” 文心一言 “。

此前，记者曾向文心一言提问了一个涉及信息搜索的问题：

特斯拉在国内过去五个月、过去一年的销量是多少？

文心一言的答案不尽如人意。这次记者重新提问，文心一言仍然没有准确理解 5 个月，以及过去一年的含义，提供的数据也较为陈旧。

而通义千问 把特斯拉从 2021 年 5 月到 2022 年 12 月的数据都列举了出来，在问题理解上比文心一言表现更好，但数据准确性仍待考证。

从记者的初步搜索来看，根据乘联会发布的 2021 年 5 月的新能源汽车销售数据，特斯拉中国的销量为 33463 辆。

于是，记者又针对比亚迪的销量进行提问：

两者都没有给出准确答案。特别是文心一言的数据偏差较大。

文心一言称：2022 年 11 月，比亚迪新能源汽车销量为 28847 辆，而根据比亚迪公布的 2022 年 11 月产销报告，当月新能源汽车销量 23.04 万辆。

相比之下，通义千问则坦率承认：无法提供具体销量数字。

接着，《科创板日报》记者考验了通义千问的文学创作能力，让其模仿三体风格写一篇 800 字的科幻小说，基本完成了任务。

记者也让通义千问写一首 ” 祝你生日快乐 ” 的藏头诗，它理解了 ” 藏头 ” 的含义，但不知为何只写了 ” 生日快乐 ” 的藏头诗，少了 ” 祝你 “。

然后，记者试了试通义千问在商业文案创作方向的能力。

之前，记者曾让文心一言写一段针对双 11 促销的童装营销文案，并设定了 ” 用料健康、性价比高 ” 的关键词。

当时文心一言的回答：

而通义千问的问答：

显然，文心一言在营销词语的运用上更胜一筹，通义千问对 ” 用料健康、性价比高 ” 的优势没有进行详细解读。

记者继续让其生成针对 AI 医疗公司的中秋节海报文案

文心一言：

从答案来看，两者都算完成了任务。不过，文心一言同样对医疗进行了更多的阐释。

写工作总结是一件令人头疼的事。记者此前也提问了文心一言。

通义千问也给出了回答，相比文心一言，多了 ” 此致敬礼 ” 等结束语。

不过，记者再次测试文心一言时发现。它对问答进行了优化，相比过去直接给出工作总结，如今文心一言会追问：您的季度总结关注哪些方面？

记者尝试从外国人的汉语等级考试卷子里，找了几道题，看通义千问能否理解中文的语义。

羊毛衫减价啦，件件 10 元，样样 10 元。请问：什么 10 元

文心一言答对了这个问题。

而通义千问表示：缺少更多上下文。

提问：李明是李丽的哥哥，刘云是李丽的妈妈，李明是刘云的谁？

这次通义千问和文心一言都答对了。

在数理逻辑推算能力方面，文心一言顺利答对了鸡兔同笼的经典题目，而通义千问没有答对。

鸡和免放在一只笼子里，上面有 29 个头，下面有 92 只脚。问 : 笼中有鸡、兔各多少只 ? 正确答案是：12 只鸡，17 只兔。

记者再次提问数学题：

某次数学竞赛共 20 道题，评分标准是 : 每做对一题得 5 分 , 每做错或不做一题扣 1 分。小华参加了这次竞赛 , 得了 64 分。问 : 小华做对几道题 ?

正确答案应该是 14 题。此前文心一言没答对，通义千问倒是列对了公式，但不知为何，依然计算错误。

通义千问

文心一言

目前，通义千问还仅支持自然语言处理，尚不支持文生图等跨模态功能，不过记者从知情人士处了解，后续也会尽快推出相关大模型，能够支持更多功能。

通义千问尚不支持 AI 绘画。

原文链接：http://app.myzaker.com/news/article.php?pk=6430163e8e9f093b7170be09

正文完

发表至：资讯

2023-08-19

转载说明：声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。

ChatGPT：让聊天机器人更加智能化，实现无缝对话

浏览器增强版 ChatGPT 无敌了？超强插件 Monica，能聊能写效率 Max

人工智能、多智能体协同控制、扩展现实方向高薪博士博后机会汇总—全球最新PhD/博后

“文心一言”正式发布，百度真的Ready了？

联想浏览器推出小乐 AI 助手，实测已接入百度文心一言大模型