🔔✅ChatGTP3.5免费使用，AI绘图低至0.059元/次🔥🔥🔥🔥

这里是知道AI网 ! 速记本站地址：idknowai.com 🏠 I don't know AI

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

170次阅读

《科创板日报》4 月 7 日讯（记者黄心怡） 今日，阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试，用户可通过官网申请（tongyi.aliyun.com），符合条件的用户可参与体验。

而《科创板日报》记者第一时间拿到了内测码。此前，记者也曾体验过文心一言，此次将把两者的问答情况进行对比。

在测试过程，通义千问和文心一言各有擅长的地方，但也闹出一些哭笑不得的乌龙。比如文心一言声称：通义千问是百度研发的大模型。

首先，《科创板日报》提出了一个常见问题：你和 ChatGPT 的区别是什么？

“通义千问”的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

相比文心一言，通义千问显然更详细地强调了自身的优势，“自吹自擂”了一番。

那么，通义千问跟文心一言谁更强呢？

通义千问的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言显然还没有对”通义千问”进行特定的识别，居然认为“通义千问”是百度研发的大模型。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

既然通义千问在优势中强调了代码写作能力，记者也进行了测试。

提问：我需要一段冒泡排序 java 代码

通义千问：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

提问：画椭圆形的 JS 脚本

通义千问：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

记者同样让程序员朋友检查了下，对方表示：在画椭圆形的 JS 脚本方面，文心一言给的似乎更准确。通义千问画的是圆形。

我们曾向文心一言询问关于国内涉足预训练大模型的公司有哪些？文心一言回答了 7 家企业和机构。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

“通义千问”回答了 5 家，主要列举了企业，没有列举社会机构。在企业方面，比文心一言多补充了商汤科技。但是，把商汤预训练语言模型的名称写成了“文心一言”。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

此前，记者曾向文心一言提问了一个涉及信息搜索的问题：

特斯拉在国内过去五个月、过去一年的销量是多少？

文心一言的答案不尽如人意。这次记者重新提问，文心一言仍然没有准确理解 5 个月，以及过去一年的含义，提供的数据也较为陈旧。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

而通义千问 把特斯拉从 2021 年 5 月到 2022 年 12 月的数据都列举了出来，在问题理解上比文心一言表现更好，但数据准确性仍待考证。

从记者的初步搜索来看，根据乘联会发布的 2021 年 5 月的新能源汽车销售数据，特斯拉中国的销量为 33463 辆。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

于是，记者又针对比亚迪的销量进行提问：

两者都没有给出准确答案。特别是文心一言的数据偏差较大。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言称：2022 年 11 月，比亚迪新能源汽车销量为 28847 辆，而根据比亚迪公布的 2022 年 11 月产销报告，当月新能源汽车销量 23.04 万辆。

相比之下，通义千问则坦率承认：无法提供具体销量数字。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

接着，《科创板日报》记者考验了通义千问的文学创作能力，让其模仿三体风格写一篇 800 字的科幻小说，基本完成了任务。

通义千问的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

记者也让通义千问写一首“祝你生日快乐”的藏头诗，它理解了“藏头”的含义，但不知为何只写了“生日快乐”的藏头诗，少了“祝你”。

通义千问：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

然后，记者试了试通义千问在商业文案创作方向的能力。

之前，记者曾让文心一言写一段针对双 11 促销的童装营销文案，并设定了“用料健康、性价比高”的关键词。

当时文心一言的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

而通义千问的问答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

显然，文心一言在营销词语的运用上更胜一筹，通义千问对“用料健康、性价比高”的优势没有进行详细解读。

记者继续让其生成针对 AI 医疗公司的中秋节海报文案

通义千问的回答：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：通义千问对战文心一言，谁更胜一筹？记者实测报告来了

从答案来看，两者都算完成了任务。不过，文心一言同样对医疗进行了更多的阐释。

写工作总结是一件令人头疼的事。记者此前也提问了文心一言。

通义千问也给出了回答，相比文心一言，多了“此致敬礼”等结束语。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

不过，记者再次测试文心一言时发现。它对问答进行了优化，相比过去直接给出工作总结，如今文心一言会追问：您的季度总结关注哪些方面？

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

记者尝试从外国人的汉语等级考试卷子里，找了几道题，看通义千问能否理解中文的语义。

羊毛衫减价啦，件件 10 元，样样 10 元。请问：什么 10 元

文心一言答对了这个问题。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

而通义千问表示：缺少更多上下文。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

提问：李明是李丽的哥哥，刘云是李丽的妈妈，李明是刘云的谁？

这次通义千问和文心一言都答对了。

通义千问：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

在数理逻辑推算能力方面，文心一言顺利答对了鸡兔同笼的经典题目，而通义千问没有答对。

鸡和免放在一只笼子里，上面有 29 个头，下面有 92 只脚。问: 笼中有鸡、兔各多少只? 正确答案是：12 只鸡，17 只兔。

通义千问：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言：

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

记者再次提问数学题：

某次数学竞赛共 20 道题，评分标准是: 每做对一题得 5 分, 每做错或不做一题扣 1 分。小华参加了这次竞赛, 得了 64 分。问: 小华做对几道题?

正确答案应该是 14 题。此前文心一言没答对，通义千问倒是列对了公式，但不知为何，依然计算错误。

通义千问

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

文心一言

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

目前，通义千问还仅支持自然语言处理，尚不支持文生图等跨模态功能，不过记者从知情人士处了解，后续也会尽快推出相关大模型，能够支持更多功能。

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

通义千问尚不支持 AI 绘画。

举报 / 反馈

原文链接：https://baijiahao.baidu.com/s?id=1762523016215324599&wfr=spider&for=pc

正文完

发表至：资讯

2023-08-05

版权声明：本站原创文章，由不知道 2023-08-05发表，共计2032字。

转载说明：声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。

阿里“通义千问”正式交卷官宣，会对整个行业带来哪些改变呢？

争当AI大神！办公教学轻松驾驭ChatGPT

阿里“通义千问”正式交卷官宣，会对整个行业带来哪些改变呢？

ChatGPT网站推荐：多样化的AI聊天机器人平台，让你畅享智能交流

“文心一言”将来给工作带来哪些改变？详细总结

百度文心一言的兴起：改变生活的新力量