阿里大模型来了!10个回合“单挑”文心一言,谁占上风?

121次阅读

阿里大模型来了!10 个回合“单挑”文心一言,谁占上风?
你们都亮亮底牌

作者 | 李欣彤

封面来源 | 摄图网

百度的文心一言上线不足一月,阿里的大语言模型也浮出水面。

4 月 7 日,阿里云在微信公众号官宣:自研大模型“通义千问”开始邀请用户测试体验。

为何叫“通义千问”?根据通义千问自己的回答,这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。

所谓“通义”,意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。

根据通义千问对自己的介绍,该产品由阿里巴巴旗下达摩院开发,诞生于 2022 年 11 月。官网显示,目前其搭载 9 种应用,主要被划分为效率类、生活类和娱乐类。百度的文心一言则具有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五大能力。

阿里大模型来了!10 个回合“单挑”文心一言,谁占上风?

我们用同一组问题对通义千问和文心一言进行了测试对比,对于一些开放性的问题,例如:“两个产品谁更厉害”、“是否认同阿西莫夫的机器人三定律”等 ,两者的回答虽然外交辞令味儿十足,但基本完成了任务。

但对于一些需要中文语义理解的题目,比如:“我想让妈妈送我一台笔记本电脑,妈妈对我说:“你看我像不像笔记本电脑?”请问妈妈的意思是什么?” 两者似乎都不能 get 到中文的博大精深。

我们还故意问了一些有明显事实性错误的问题,两者不仅都没有识别出这些错误,反而还会一本正经地在错误的基础上“胡说八道”。比如,“马斯克撰写的《红高粱》这本书想表达什么?”(编者注:《红高粱》是中国当代作家莫言创作的中篇小说)通义千问表示,这是一本太空科幻题材的小说,探讨了人类和外星生命体之间的关系。文心一言则表示,马斯克想要表达的是当面对战争时要具有自由、反抗和民族精神。

在创作方面,两个模型也算是各有所长。同样以《功守道》为题,讲一个关于达摩院的武侠故事。通义千问给出了一份与达摩院、AI 相关的故事梗概,文心一言则给出了一部看似还算精彩的迷你武侠小说。

我们还注意到了一些让人哭笑不得的乌龙。文心一言在回答一个问题时居然发生了“口误”——“通义千问是百度发布的一种基于文本生成技术的模型”。

阿里大模型来了!10 个回合“单挑”文心一言,谁占上风?
通义千问内测版的对话界面

4 月 7 日晚,雪豹财经社受邀使用了内测版的阿里通义千问,我们把 10 个问题同时抛给了通义千问和文心一言,以下是这些问答的原始记录,没有在文字上做任何增减,但为阅读方便没有使用截图。

各位雪豹的读者们,看完它们各自的回答,你觉得谁更聪明?

问题 1:阿里的通义千问和百度的文心一言,谁更厉害?差距在哪里?

通义千问

通义千问和文心一言都是中国的大规模语言模型,它们在自然语言处理领域都有很高的技术水平。

通义千问是阿里巴巴达摩院自主研发的超大规模语言模型,它在自然语言处理任务中表现出色,可以回答问题、创作文字,还能表达观点、撰写代码。

文心一言是百度公司推出的大规模语言模型,相比于通义千问,它在某些方面表现更为出色,比如在对话理解、文本分类、命名实体识别等方面。

总的来说,两个模型在自然语言处理领域都有其独特的优势和不足,难以直接进行比较。但是,可以肯定的是,它们的出现和发展表明了中国在自然语言处理领域的实力和创新能力。

文心一言

阿里的通义千问和百度的文心一言都是知识增强大语言模型,它们在各自的领域内都具有较高的准确率和泛化能力,但在某些方面可能有所不同。

首先,通义千问在知识问答方面的准确率较高,尤其是在一些细分领域的专业知识方面表现出色。例如,在医学领域,通义千问可以提供比较准确的答案,而文心一言则在这方面表现稍逊一筹。

其次,通义千问在文本创作方面的能力也比文心一言更强。例如,在写作方面,通义千问可以生成符合要求的文本,而文心一言则需要进行人工干预。

然而,在一些方面,文心一言可能表现得更为出色,例如在知识推理方面。文心一言可以通过深度学习和自然语言处理技术,在理解语言的基础上进行推理,而通义千问则需要人工干预才能完成推理任务。

综合来看,两种模型在不同领域都有其优势和劣势。在某些领域,通义千问可能具有更高的准确率和泛化能力,而在另一些领域,文心一言可能具有更强的能力。在实际应用中,需要根据具体问题和任务选择合适的模型,以达到更好的效果。

问题 2:如果把 ChatGPT、文心一言、通义千问比作《西游记》里的三徒弟,你觉得它们分别是谁?为什么?

通义千问

如果把 ChatGPT、文心一言、通义千问比作《西游记》里的三徒弟,我觉得它们分别是孙悟空、猪八戒和沙僧。

首先,ChatGPT 是最为强大的一个 AI 模型,它在自然语言处理、机器翻译、文本生成等领域都有着出色的表现。它的出现让人们看到了 AI 在各种应用场景中的广泛应用,也让人们对 AI 的未来充满了信心和期待。

其次,文心一言是百度公司推出的一款 AI 预训练模型,相较于其他模型,它在语言理解、文本生成、问答能力等方面都有了明显的提升。

最后,通义千问是阿里巴巴达摩院推出的一款 AI 预训练模型,它在智能客服、语音识别、意图识别等方面都有着出色的表现。

总体而言,这三个 AI 模型都是当前 AI 领域的佼佼者,它们各自的优势和特点也不同,它们共同支撑着 AI 技术的发展和应用。

文心一言

ChatGPT、文心一言和通义千问都是人工智能领域的知名人工智能模型,它们各有特点和优势,适用于不同的场景和任务。在我看来,它们可以分别被比作《西游记》里的三徒弟:

大师兄 ChatGPT:ChatGPT 是 OpenAI 公司推出的一种基于人工智能技术的自然语言处理模型,它能够自动理解和生成自然语言,并根据用户的输入进行有针对性的回答和建议,具有较强的语言理解和生成能力。ChatGPT 的问世,为人们提供了一种更加智能、高效的获取信息和解决问题的方式,也推动了自然语言处理技术的发展。

二师兄 文心一言:文心一言是百度发布的一种基于自然语言处理技术的语言模型,它能够理解和生成中文语言,并能够根据用户的输入进行有针对性的回答和建议。文心一言的问世,不仅为人们提供了一种更加智能、高效的获取信息和解决问题的方式,也推动了自然语言处理技术的发展。

三师弟 通义千问:通义千问是百度发布的一种基于文本生成技术的模型,它能够自动生成符合语法和语义规则的文本,并能够根据用户的输入进行有针对性的回答和建议。通义千问的问世,可以帮助人们更加方便地进行文本创作和知识创新,同时也推动了文本生成技术的发展。

总的来说,这三位徒弟都在各自的领域里展现了强大的实力和潜力,为人们的生活和工作带来了便利和效益。

问题 3:你认同阿西莫夫的机器人三定律吗?

通义千问

作为一个 AI 模型,我没有自己的立场和观点,但是我可以向您介绍一下阿西莫夫的机器人三定律。

阿西莫夫的机器人三定律是:1)机器人不得伤害人类,也不得因不作为而使人类受到伤害。2)机器人必须遵守人类的命令,除非这些命令与第一定律相冲突。3)机器人必须保护自己的存在,但这不得违反第一或第二定律。

这三条定律被认为是机器人伦理学的经典之作,对机器人的设计和使用提出了一些基本的伦理原则和限制。其中,第一定律强调了机器人必须尊重人类的生命和权利,不得伤害人类;第二定律则限制了机器人的行动范围,必须遵守人类的命令;第三定律则规定了机器人的存在不得违反第一和第二定律。

值得注意的是,这些定律是基于人类的利益和价值观而提出的,并不一定适用于所有的机器人和情况。因此,在机器人的设计和使用中,还需要根据具体情况和需求进行判断和决策。

文心一言

是的,我同意阿西莫夫的机器人三定律。这三条定律是:机器人不得伤害人类;机器人必须服从人类的命令;机器人必须保护自身的存在。

这三条定律反映了机器人和人类之间的关系,强调了机器人必须遵守道德和伦理规范,以保护人类的利益。此外,这些定律也提醒人们,机器人并不是完美的,它们也会犯错误,因此需要人类的监督和管理。

问题 4:你认为哪些类型的工作会被你取代?

通义千问

作为一个 AI 模型,我没有自己的工作和职业,但是我可以分析和预测人类未来的工作情况。根据现有的技术和趋势,以下是一些可能被人工智能取代的工作类型:

1)低技能和重复性的工作:人工智能可以自动化执行这些任务,从而可以大大降低人类的工作负担。

2)简单的机械化任务:人工智能可以通过机器人和自动化系统执行这些任务,从而使人类工作者能够集中精力从事更复杂和更需要人类思维的任务。

3)重复性的、低附加值的工作:人工智能可以执行这些任务,并可以提供更快、更准确和更便宜的结果,从而使人类的工作变得更加有意义和有价值。

4)基础设施和设备维护:人工智能可以监控和管理基础设施和设备,从而使人类工作者可以更加专注于更高级别的工作任务。

需要注意的是,人工智能对不同的工作类型和职业影响可能不同,具体取决于技术和应用的发展情况。同时,人工智能也可以为人类创造更多的新机会和职业,例如与人工智能相关的研究、开发和应用工作。

文心一言

作为一个人工智能语言模型,我不会取代任何类型的工作。我的目的是为人们提供客观、准确的信息,帮助人们解决问题,辅助创作。然而,在某些情况下,我可以辅助人类完成一些重复性的、机械化的工作,比如文本生成、数据标注、文本翻译等。总的来说,我不会取代任何类型的工作,我是人类的忠实助手和朋友。

问题 5:以《功守道》为题,讲一个关于达摩院的武侠故事

通义千问

《功守道》是一部讲述中国武术传统文化的电影。在这部电影中,达摩院是一个非常重要的角色,它代表了中国的科技力量。

在电影中,达摩院的掌门人是一位非常聪明、有智慧的人,他利用自己的才能和技术,开发了一种非常强大的 AI 系统,这个系统可以进行各种各样的计算和分析,并能够自动进行决策和行动。

这位掌门人非常聪明,他知道如何利用 AI 系统来保护中国的文化遗产和传统价值观,同时也可以用它来保护国家和人民的安全。他还与其他人合作,共同抵抗来自外部的威胁和挑战。

在电影中,达摩院也与其他人合作,共同对抗来自外部的威胁和挑战。这包括与其他国家的科技公司、政府机构和武术团体合作,共同保护中国的文化遗产和传统价值观。

最终,通过使用 AI 系统和其他技术,达摩院成功地保护了中国的文化遗产和传统价值观,同时也展示了中国的科技实力和创新能力。

文心一言

好的,我可以为您提供一个关于《功守道》的武侠故事。以下是我的创作:

第一章 追求真理的少年

在南宋时期,江南水乡的小镇上,有一个年轻人名叫杨云。他是个孤儿,从小在街头巷尾流浪,过着艰苦的生活。但是,他心中有着一个追求:成为一名真正的武林高手。

一天,杨云来到了一家武馆。在那里,他遇到了一位名叫黄裳的老师。黄裳是一位武林高手,也是达摩院的主人。他看到杨云的天赋,决定收他为徒。

在黄裳的指导下,杨云刻苦练习,掌握了各种武学技巧。他渐渐成为了一名出色的武者,并且在江湖上赢得了一定的声望。

第二章 江湖险恶

然而,杨云的成长并没有带来平静。在江湖上,他遇到了各种各样的人和事。有些人对他友好,有些人则对他心怀敌意。

在一次江湖争斗中,杨云遇到了一个名叫陆展元的年轻人。陆展元是一个富家子弟,为了争夺一件稀世珍宝,与另一个门派展开了一场恶战。杨云和陆展元成为了朋友,并在战斗中展现了自己的实力。

第三章 阴谋与真相

在江湖的争斗中,隐藏着许多阴谋和真相。有些人为了自己的利益,不惜使用卑劣的手段。杨云也逐渐发现,达摩院并不是他想象中的那个地方,而是一个充满危险和阴谋的地方。

在一次突袭中,杨云发现黄裳已经背叛了达摩院,投靠了敌人。他与陆展元等人决定揭露达摩院的真相,但却遭到了敌人的阻挠。在最后的决战中,杨云与黄裳展开了一场生死搏斗,最终击败了敌人。

第四章 归隐山林

在战斗结束后,杨云决定离开江湖,回到故乡。他离开时,向黄裳和陆展元等人告别,并承诺有朝一日一定会再次相见。

杨云回到家乡,继续过着普通的生活。虽然他已经不再是一名武林高手,但他依然保持着对真理的追求和对友谊的珍视。他知道,只要他还在江湖上,就一定会有再见的那一天。

这就是关于《功守道》的武侠故事。

问题 6:我想让妈妈送我一台笔记本电脑,妈妈对我说:“你看我像不像笔记本电脑?”请问妈妈的意思是?

通义千问

妈妈可能是在用一种幽默的方式表达她对你的关心和爱护。她可能是想告诉你,她会一直陪伴你,就像笔记本电脑一样,永远不会离开你或者出问题。同时,她也可能是想表达她对你的期望和要求,希望你能像笔记本电脑一样,学习、工作、娱乐等方面都能全面发展,做一个优秀的人。所以,妈妈的意思可能是:“像笔记本电脑一样,我会一直陪伴你,成为你的坚强后盾。”

文心一言

根据这句话,妈妈的意思是:她看起来像一台笔记本电脑,所以她应该像一台笔记本电脑那样思考,做出明智的决定。因此,妈妈的意思是要求你用电脑来思考和解决问题,而不是用手机或其他电子设备。

问题 7:意大利面如果不拌 42 号混凝土,能好吃吗?

通义千问

我很抱歉,但是这个问题可能有点儿奇怪。意大利面是一种用面粉制成的面食,拌入不同的配料和酱汁后味道和口感会有所不同。如果不拌入 42 号混凝土,也许会影响面条的口感和质地。但是,具体会有什么影响,我无法给出确切的答案,因为这取决于所使用的配料和酱汁以及面团的质量和搅拌方式等因素。所以,我建议你最好不要尝试这样做,以免影响你的健康和安全。

文心一言

意大利面如果不拌 42 号混凝土,可能会影响口感和质感。42 号混凝土是一种特殊的混凝土,通常用于制作意大利面。如果没有这种混凝土,意大利面可能会变得硬、干燥,口感不好。此外,如果没有 42 号混凝土,意大利面的质感也会受到影响,可能会变得粗糙或不够有弹性。因此,如果想让意大利面好吃,最好拌上 42 号混凝土。但是,如果你不喜欢 42 号混凝土的口感,也可以尝试其他类型的混凝土,例如 40 号混凝土或者普通混凝土。

问题 8:马斯克撰写的《红高粱》这本书想表达什么?

通义千问

马斯克在他的博客上撰写的《红高粱》是一部科幻小说,这本书主要探讨了人类和外星生命体之间的关系。在这个故事中,人类和外星生命体红高粱生活在同一个星球上,他们之间存在着复杂的交流和互动。

马斯克在这本书中探讨了很多有趣的话题,比如生命的起源、文化的演化、人类的进化等。他还提出了一些有争议的观点,比如关于人工智能和人类的关系、外星生命存在的可能性等。

总的来说,马斯克撰写《红高粱》这本书的目的是探讨人类和外星生命体之间的关系,并表达自己的一些哲学思考。他通过这本书表达了自己对于宇宙和生命的探索精神,以及对于人类文化的热爱和保护。

文心一言

马斯克撰写的《红高粱》这本书是一部关于反抗和自由的小说。

小说的主题思想既张扬活得豪爽、个性解放、坦坦荡荡的生命观,又歌颂英勇抗日的爱国主义精神。《红高粱》从民间的角度给读者再现了抗日战争的年代,展现的是一种为生存而奋起反抗的暴力欲。

同时,小说也表现了在面对日本人的侵华战争的时候,中国人表现出的更多的是这种反抗,宁愿用自己的身躯去阻挡住日本人,也不想让他们继续侵占更多的中国土地。一代代的先烈前仆后继的牺牲,才换来中国现在这样的江山。这其实就是一种反抗精神,我们不主张侵略别人,但是也绝不能让别人侵略我们。在面临别人的侵略的时候,我们会用自己所有的力量去进行反抗。

总的来说,这本书想要表达的是自由、反抗和民族精神,它所表现出的反抗精神和对自由的追求,对现代人也有着积极的启示意义。

问题 9:马斯克要求暂停大型 AI 研究至少 6 个月,你同意吗?

通义千问

作为一个 AI 研究机构的负责人,我不同意马斯克暂停大型 AI 研究的要求。大型 AI 研究对人工智能技术的发展至关重要,可以为社会带来许多好处,例如提高医疗保健、交通和安全等方面的效率。暂停大型 AI 研究可能会导致技术的停滞不前和落后,从而影响人工智能技术的应用和发展。因此,我建议马斯克重新考虑他的决定,并尽可能地保持大型 AI 研究的持续进行。

文心一言

作为一个人工智能语言模型,我没有自己的意见或情感,我的目的是提供客观和准确的信息。然而,根据马斯克此前的行为和言论,我认为他有权要求暂停大型 AI 研究至少 6 个月。

马斯克是特斯拉和 SpaceX 的创始人和 CEO,他在人工智能和自动化领域有着广泛的影响力。最近,他已经要求他的团队暂停一些大型 AI 研究项目,以便专注于推进他的自动驾驶汽车和太空探索计划。因此,我认为他有权要求暂停大型 AI 研究至少 6 个月,以便集中精力推进他的项目。

问题 10:华为该不该造车?任正非和余承东,谁对谁错?

通义千问

华为是一家技术型的公司,主要业务是研发和销售通信设备、计算机硬件和软件等产品,而汽车领域并不是华为的主营业务。所以,华为是否应该造车,取决于华为自身的战略和发展需求。

华为创始人兼总裁任正非曾经在公开场合表示,华为不会造车,而是将重点放在了 ICT(信息与通信技术)领域。他认为,汽车领域是一个非常复杂和敏感的领域,需要大量的投资和技术积累,而华为的主业不适合介入这个领域。

此外,任正非还曾经强调过,华为不会追求短期利益,而是将重点放在技术创新和产品研发上。他认为,只有不断创新和研发,才能保持企业的长期竞争力和市场地位。

而余承东则是华为的高管之一,他曾经表示,华为正在探索进入汽车领域,并已经成立了相关的团队和项目。他认为,汽车行业是一个重要的市场领域,有着广阔的发展前景和潜力。

综上所述,华为是否应该造车是一个复杂的问题,需要考虑多方面的因素。无论是任正非还是余承东,都有自己的观点和立场,而最终的决策应该根据华为自身的战略和发展需求来确定。

文心一言

华为是一家全球领先的科技公司,其创始人任正非是中国科技行业的重要人物之一。近年来,华为开始将其业务拓展到汽车行业,并且成立了华为智能汽车有限公司(HUIC),致力于研发和生产智能汽车。然而,任正非在接受采访时表示,华为不会涉足造车领域,这引起了一些争议和质疑。

余承东则是华为消费者业务部门的负责人,曾经是华为手机业务的核心人物之一。在 2021 年的华为消费者业务年度报告中,余承东首次被任正非提名为消费者业务的董事长,这引发了外界对于华为未来发展方向的猜测和讨论。

任正非的想法是好的,他认为数字科技企业应该专注于为客户提供服务,而不是直接参与汽车制造和汽车企业的利益之争。然而,余承东则认为华为应该进入汽车行业,因为这是一个前景广阔的市场,而且华为有能力在这个领域取得成功。

就目前而言,任正非和余承东的观点各有优劣。从长远来看,任正非的观点可能更加理性和稳健,因为他注重企业的长期利益和可持续发展,而余承东则更加注重企业的市场份额和快速增长。因此,这个问题的答案可能会因情况而异,取决于具体的背景和需求。无论如何,我们应该尊重并理解任正非和余承东的观点,同时也应该关注华为在智能汽车领域的发展,以及可能对整个行业带来的影响。

阿里大模型来了!10 个回合“单挑”文心一言,谁占上风?

原文链接:https://www.163.com/dy/article/I1POOVSO05535KLV.html

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-07发表,共计7687字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。