GPT-3.5不香了！GPT-4重磅登场

228次阅读

点击上方 ” 三维设计师 ”

INTRODUCTION

美国当地时间 3 月 14 日，OpenAI 重磅官宣 GPT- 4 大型多模态模型正式发布，他是 OpenAI 公司史上最强大的人工智能系统，拥有更广泛的常识和 更精准 解决复杂问题的能力！且看下文小编为大家作一些案例介绍 ……

文章信息

本文由 e -works 祖哥原创报道。文中所用视频、图片素材均源于 OpenAI 官网，仅用作编辑用途。

官方重磅宣布 GPT- 4 发布

美国当地时间 3 月 14 日，OpenAI CEO Sam Altman 以及总裁和联合创始人 Greg Brockman 共同发推，宣布 GPT- 4 发布——一个大型多模态模型（图像和文本输入，文本输出），它在功能和一致性方面都有显著进步。

并在 OpenAI 官网

配套了一个 3 分钟的视频介绍

小编进行了翻译，供大家参考

辗轧 GPT-3.5，GPT- 4 到底更新了什么？

没想到，刚过一个月，就把 GPT- 4 给“丢”出来了！

随后 OpenAI 总裁兼联合创始人 Greg Brockman 就在 Youtube 上 进行了 GPT- 4 的开发者直播，第一件事就是拿来和 GPT-3.5 进行对比。所以就以这段为引子，为大家介绍 GPT- 4 所更新的功能以及限制！

GPT-3.5-turbo 结果演示

他把 OpenAI 官网的一篇介绍 GPT- 4 的博文（博文地址供参考：https://openai.com/research/gpt-4）复制到了描述栏，并选择 GPT-3.5-turbo 模型，要求其把这篇博文进行一句话总结，并且每一个词都要用字母“G”开头，GPT-3.5 给出了这样的结果：

GPT-4, a large multimodal model, exhibits human-level performance, generally outperforming GPT-3.5, and is being released via ChatGPT and API, while OpenAI Evals is open-sourced to guide further improvements.

小编简评：显然 3.5 给出的答案差强人意，压根没有按照主人的意图进行尝试解答，绝大部分单词都不是“G”开头的。可以说绝大部分场景下，GPT-3.5 的理解能力达不到这一步，他放弃了任务的执行。

GPT- 4 结果演示

于是，Greg Brockman把模型选到 GPT-4，再次执行相同的任务，来看看这次的结果如何：

GPT-4 generates groundbreaking, grandiose gains, greatly galvanizing generalized AI goals.（GPT- 4 创造了开创性的、宏伟的成果，极大地激励了通用 AI 的目标。）

小编简评：显然 GPT- 4 的答案完美地贴合了主人的用意，每个单词全部以“G”开头，且是一句对文章总结通顺的话。这一点直接把 3.5 按在地上摩擦！

这还没完，接着盘他！让他每个单词以“A”开头再执行这个任务：

GPT-4 achieves advanced advancements, amplifying artificial aptitude astoundingly.（GPT- 4 取得了先进的进步，惊人地提高了人工智能的能力。）

GPT-4：你以为换成“A”就难倒我了吗，小 Case！

好吧，再换成“Q”把这篇文章总结成一句话：

GPT-4 quintessentially quickens quality quantifications, quelling questionable quandaries.（GPT- 4 从本质上加快了质量的量化，消除了有争议的困境。）

——这句话的意思是，GPT- 4 是一种能够有效地评估和提高生成内容的质量的 AI 系统，它可以解决一些复杂和不确定的问题。它可以在各种领域和任务上进行精确和可靠的量化分析，如机器翻译，自然语言理解等。它是一种能够提高 AI 性能和可信度的系统。

掌声在哪里？

没有小看的意思，我想在座的各位恐怕 90% 以上的同学都无法在短时间内迅速把一句话的所有单词以某一个相同的字母开头，来总结一篇文章吧！

以上只是一个案例简介 GPT- 4 增强的地方，下面小编把一些 具体的方面，图文并茂的按顺序罗列出来：

① 可接受图像输入并生成说明、分类和分析。

小编需要预先说明的是：本次的图像输入功能并没有开放，还在进行准备阶段。但是他是具备以下能力的：

输入图像，告诉他如果绳子剪断会怎么样？他会回复：气球将飞走。

输入图片，告诉它可以用这些食材来做什么？回复如下：

② 创意性和协作性

本段第一部分就是最好的例子，GPT-4 比以往任何时候都更具创造性和协作性。它可以生成、编辑并与用户一起完成创意和技术写作任务，例如创作歌曲、编写剧本或学习用户的写作风格。

再一个示例：用一个句子描述《灰姑娘》中的情节，其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头，不重复任何字母。

看看这个回答（Output），着实有点惊人，每个单词的首字母居然按照字母表 A - Z 给回答了出来！

③ 更强的处理长文本的能力

GPT-4 能够处理超过 25,000 个单词的文本，允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

示例：主人直接贴了一个歌手蕾哈娜的维基百科链接（这个百科页面的介绍非常长），让 GPT- 4 读取链接内容，描述一下她在超级碗上的表现以及它的特别之处。

看看这回答：

回答中文翻译：出于多种原因，蕾哈娜 (Rihanna) 的超级碗 LVII 中场秀表演很特别。首先，这是她五年多来的第一次现场表演，也是她第一次登上超级碗中场秀的头条新闻。此外，她还创造了历史，成为第一个在怀孕期间在超级碗上表演的人。该节目本身广受好评，许多人称赞她充满活力的表演和令人印象深刻的歌声。它还获得了巨大的收视率，成为历史上收视率第二高的中场秀。

④ GPT- 4 在高级推理能力方面超越 ChatGPT

这个案例很有意思，大家看好了：

问题——

◉ 安德鲁从上午 11 点到下午 3 点有空

◉ 乔安妮从中午到下午 2 点或下午 3：30 到下午 5 点是自由时间

◉ 汉娜在中午半小时可用，然后下午 4 点到 6 点有空。

对于安德鲁、汉娜和乔安妮来说，一个 30 分钟会议的开始时间有哪些选择？

我们来看 ChatGPT 给出的答案：

先是把每个人的可用时间列出来，然后推理出来的是：下午 4 点开会。这个显然不对，因为 Andrew 没有空啊。

再看 GPT- 4 的答案：

更精准的数字列出了每个人的可用时间，给出了正确也是唯一的答案：中午 12 点到 12 点半进行半小时的会议。

⑤ GPT- 4 更会考试

GPT- 4 在统一律师考试中 获得了前 10% 的成绩，而 ChatGPT 则是倒数的 10%。

而在生物奥林匹克竞赛中，GPT- 4 更是离谱的获得了超过 99% 人的成绩，辗轧 ChatGPT。GPT- 4 在各种专业和学术基准上表现已经达到甚至超越了人类的表现。

⑥ 更安全，更具事实性

OpenAI 是一家致力于创建和推广人类友好的 AI 的公司，OpenAI 花了 6 个月的时间让 GPT- 4 更安全、更符合人类价值观。在内部评估中，GPT- 4 回应不允许的内容的可能性比 GPT-3.5 低了 82%，产生事实性回应的可能性比 GPT-3.5 高了 40%。通过对安全和事实性的改进，使其更能符合人类的利益和期望。

这一点应该说非常重要。在之前 ChatGPT 的体验中，常常会感觉到他词不达意，或者太过中庸，说些正确的废话。但是随着 GPT- 4 事实性的显著增强，他所给出的答案将更加精确。

⑦ GPT- 4 的使用限制

虽然 GPT- 4 很强大，它还有很多已知的局限性，OpenAI 正在努力解决，比如社会偏见、幻觉和对抗性的提示。其鼓励并促进透明度、用户教育和更广泛的人工智能素养，随着社会采用这些模型。OpenAI 也致力于扩大人们在塑造模型方面的输入渠道。

GPT-4 与早期的 GPT 模型具有相似的局限性。最重要的是，它仍然不完全可靠，不要完全相信甚至依赖他，尤其是在一些重大的事情上。GPT-4 普遍缺乏 2021 年 9 月之后的数据，所以也会犯简单的推理错误。不要以为他是一个高版本的 GPT，就一股脑的相信，最多多相信他 40% 而已。

GPT- 4 和后续模型有可能以有益和有害的方式对社会产生重大影响。OpenAI 正在与外部研究人员合作，以改进其理解和评估潜在影响的方式，以及对未来系统中可能出现的危险功能进行评估。

怎么用上 GPT-4？

根据 OpenAI 的官网说明，目前提供在 ChatGPT Plus 版本上可用，或者以 API 的形式提供给开发者来搭建应用和服务，需要申请加入 API 等候列表：

而加入 ChatGPT Plus 计划是需要每个月 20 美元，也就人民币 138 块钱，也就相当于一个电信的套餐费差不多了。大家觉得贵吗？

Plus 版本的后台是这样的，能够选择 GPT- 4 的模型，每种模型的推理、速度以及简洁性都有差异。

那到底还有没有别的方法来白嫖 GPT- 4 呢？

这个时候微软给出了答案。小编此前一直就有个疑问，微软的 New Bing Chat 到底是搭载的 GPT-3.5 呢还是 GPT-4？因为它确实在某些方面比 ChatGPT 更精确，更聪明。

3 月 14 日，微软给出了官方的回复，最新发布的 New Bing 确实是在 GPT- 4 上运行，专门为浏览器搜索定制的。

既然 New Bing 是 GPT-4，我就还是按照上面的那道题盘一下他 ！我打开聊天界面，输入以下提示：（上文第二条：用一个句子解释《灰姑娘》中的情节，其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头，不重复任何字母。）

New Bing Chat 回答如下（又是一个完美的从 A 到 Z 啊）：

That’s a very creative request. Here is one possible sentence that follows your rules:

Abandoned by cruel dad, enslaved for girls’housework, invited joyfully king’s lavish masquerade, noticed only prince, quickly ran, shoeless, time’s up, vanished; wedded (x)traordinarily: youngest’s zeal.（被残忍的父亲遗弃，被迫成为女孩家务的奴隶，欣然受邀参加国王盛大的化妆舞会，只被王子注意到，匆匆逃跑，赤脚，时间已到，消失不见；非凡地结婚：最年轻的热情。）

I hope you enjoyed it.

截图如下：

实不相瞒，这篇文章的撰写过程，也得到了 ChatGPT 以及 GPT- 4 的大力支持，尤其是文中诸多的需要通俗翻译的部分，很多都是搭载 GPT- 4 的 New Bing 来完成的。

GPT- 4 已来，而且进化的速度如此之快。更高版本的模型还在后面，憧憬一下未来吧！

中国制造业 MES 应用春季论坛

3 月 29 日 · 南京市

原文链接：https://c.m.163.com/news/a/I04QRDKS0511UEFK.html

正文完