在聊天机器人 ChatGPT、谷歌 Bard 和百度“文心一言”之后,阿里云也发布人工智能大模型“通义千问”。
4 月 7 日,阿里云推出自研大模型“通义千问”,并开始邀请用户测试体验。阿里云称,现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件后可参与体验。
来源:通义千问
在官网中,通义千问被定义为“专门响应人类指令的大模型”。用户若想体验测试,需要进行预约报名。填写手机、邮箱、主体和用途等信息。
7 日下午,澎湃新闻记者成功登录并访问通义千问,其页面正中央具有一个对话框,显示输入上限为 1000 字。对话框的下方展示了通义千问具备的部分功能,包括电影脚本、职场助理、撰写短文、写封邮件。
来源:通义千问
此外,页面的最下方还具有名为“百宝袋”的通道,展示了通义千问搭载的 9 种应用,这些应用被分为 3 类,分别为效率类、生活类和娱乐类。
来源:通义千问
通义千问是国内第二款类 ChatGPT 产品。此前 3 月 16 日,百度正式发布聊天机器人“文心一言”,并宣布其具有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五大能力。
为测试通义千问的能力,记者同时向它和文心一言进行提问,对比二者生成的回复有何不同。
通义千问自称训练数据来自 2021 年,难以获取实时信息
首先,记者向两款聊天机器人询问通识性问题,请它介绍作家莫言及其文学作品。
通义千问能够准确地介绍莫言的原名、出生日期、身份等信息,并强调莫言是第一个获得诺贝尔文学奖的中国作家。此外,它列举了莫言的三部代表作,不仅附上了发表时间,还对作品进行了简要概括。
来源:通义千问
文心一言同样提到了莫言本人的基础信息和作品,此外还列出了莫言获得的多项奖项。不过它并没有指出莫言是首位中国籍诺贝尔文学奖获得者。
来源:文心一言
随后,记者尝试向两款机器人提问最新发生的事件。遗憾的是,它们似乎都无法获取实时信息。
在被问及 2023 年的奥斯卡获奖影片时,通义千问表示“无法预测未来的奥斯卡获奖影片……建议您关注官方的奥斯卡奖项公告,以获取最新的信息。”
来源:通义千问
文心一言则“一本正经”地给出了错误的回答,称 2023 年的奥斯卡获奖影片为《寄生虫》。但事实上,《寄生虫》于 2019 年上映,并于 2020 年获得奥斯卡最佳影片、最佳国际影片、最佳原创剧本和最佳导演四项大奖。
来源:文心一言
无法获取最新信息,或意味着训练数据有限。通义千问告诉记者,自己的训练数据来自 2021 年,因此无法获取有关未来的信息。文心一言则表示,没有明确的数据截止日期。
相比之下,聊天机器人 ChatGPT 的数据库更新至 2021 年,上个月刚刚推出的多模态模型 GPT- 4 的训练数据可追踪到 2021 年 9 月。
来源:通义千问
可写邮件、列提纲、提供菜谱
除了允许用户随机提问,通义千问还提供了多种应用功能。
记者首先进入“写封邮件”应用,要求其为刚毕业的大学生撰写一封求职邮件。通义千问所撰写的邮件格式较为标准,在开篇进行自我介绍并说明求职目的,还表达了对公司的向往和认同。
来源:通义千问
文心一言提供的邮件也较为标准。此外,它在回复中特别指出这是一个“符合规范的样例,你可以参考一下进行修改和调整”,还在名字落款处提醒用户要写自己的名字。
来源:文心一言
在“效率类”类应用中,通义千问具有写提纲、SWOT、商品描述生成三种功能。
记者首先测试了商品描述生成功能,分别要求通义千问和文心一言帮手机店给最新上市的折叠手机写一篇宣传文案,限制字数在 100 字以内,希望能突出折叠手机的优势和特点,吸引顾客购买。
这两款机器人均抓住了关键词“折叠手机”。通义千问突出了折叠手机在空间利用率方面的优势,写到“相比传统的直板手机,它可以有效地减少屏幕占用空间,方便携带”。文心一言则指出“它采用最新的折叠技术,可以在一款手机中实现智能手机和平板电脑的双重功能”。
但是,这两款机器人都未满足“100 字以内”这一要求,字数远远超标。
来源:通义千问
来源:文心一言
随后,记者又测试了通义千问的“写提纲”应用。在被要求撰写一份关于“煤矿污染文章”的提纲时,它从煤矿污染的概念和影响、历史和现状、造成污染的原因、探讨对环境和人类的危害、治理方法和保护措施、总结及展望等方面的内容,较为全面。
来源:通义千问
在“效率类”类应用中,通义千问具有彩虹屁专家、写情书、为你写诗三种应用功能。
记者要求两款机器人分别以“春雨、落花、伤感”为关键词作一首诗。通义千问撰写了一首七言诗,结尾较为押韵。
来源:通义千问
文心一言所写的诗较长,它在第一句里直接将关键词“春雨、落花、伤感”拼接在了一起,且其后的每一段中,不停地让关键词重复出现。
来源:文心一言
通义千问写的诗马马虎虎,它写的情书靠谱吗?记者尝试随机输入姓名,得到了一封略显浮夸的情书,这样看来情书还是本人亲自撰写更有诚意。
来源:通义千问
不会夸人怎么办,通义千问具有“吹彩虹屁”的功能。记者尝试让它夸奖别人文章写得好,通义千问再次浮夸了起来,“你的文章简直是天赐之作,如同一缕春风,轻轻拂过我的心灵。”
来源:通义千问
如果让通义千问自夸,它更是极尽赞美之词,“让我们一起来赞美通义千问,赞美它所传达的智慧之光,赞美它所传承的文化精髓!”
来源:通义千问
在生活类应用中,通义千问能够提供菜谱、写小学生作文、续写故事。记者测试了最实用的菜谱功能,向其询问蔓越莓曲奇的做法。通义千问提供了所需的材料,并详细介绍了操作步骤。
来源:通义千问
在测试的过程中记者注意到,通义千问的回复页面显示“仅展示最近 10 条对话”。在页面的最下方,还有一条关于回复内容的说明,“测试生成的所有内容均由人工智能模型生成,其生成内容的准确性和完整性无法保证,不代表我们的态度或观点。”
此外,记者发现如果离开通义千问一段时间后再次返回,页面会出现一条弹窗,提示用户太久没有操作,需要刷新页面重新开始。如果离开的时间更久,它还会自动返回登录页面,要求用户重新登录账号。
来源:通义千问
在最后,记者要求通义千问和文心一言互相进行评价,并指出对方的优点和不足。
通义千问表示,百度推出的聊天机器人“文心一言”(英文名:ERNIE Bot)是一款能够与人类进行自然语言对话的人工智能聊天机器人,其语言理解能力强、可以与用户进行多样化的交互、支持自然语言生成;但其对话深度有限、难以处理多义性和模糊性且可能存在 bug 和安全风险。
有意思的是,在此前的回复中,通义千问表示自己的训练数据来自 2021 年,而文心一言于 2023 年才问世,它却能够准确地说出文心一言的英文名以及优缺点等信息。
来源:通义千问
文心一言则表示,阿里推出的聊天机器人“通义千问”是一种新型的人工智能聊天助手,它可以通过自然语言处理技术和深度学习算法来理解和回答用户的问题和提问。它指出通义千问在智能化、多语言支持和自动回答;不足之处在于其语言理解能力、知识库有限以及技术存在限制。
来源:文心一言
原文链接:https://www.thepaper.cn/newsDetail_forward_22609061