GPT-4,你若安好 ,那还得了!

147次阅读

一觉醒来,GPT- 4 刷屏了,这个场面怎么说呢,有点混乱。吃瓜群众一边津津乐道,一边瑟瑟发抖。

津津乐道的是那些革命性的新功能,瑟瑟发抖的是硅基人距离取代碳基人又前进了一步。

那么,相比上一代模型,GPT- 4 都有哪些变化呢?

早上已经刷屏很多了,我们就简单概括几点↓

GPT-4,你若安好,那还得了!

❶ 它能看图说话啦

GPT 的前序版本,只是 NLP(自然语言处理)模型,只能处理文本信息。

而 GPT- 4 是一个多模态模型(multimodal model),不仅可以接受文本,现在也可以接受图片输入了,然后输出文本结果。

比如,我们可以甩一张图给它,让它叨逼一下这个图的梗儿在哪儿。

因为目前还没有实测的入口,所以只能看官方的例子↓

看懂没?用户给了一张“VGA 苹果手机充电线”的组合图,让 GPT- 4 逐条指出“笑点”,很明显 GPT- 4 回答的不错,它真看懂了。

如果是我做测试 demo,我就让 GPT- 4 来玩「找不同」,那岂不是更加直观。

其实这还没什么,更牛啤的是官方发布的开发者 Demo 视频↓

你可以在纸上画一个非常简陋的网站 UI 草图,就像下面这样。

Demo 中的指令是:Write brief HTML/JS to turn this mock-up into a colorful website。

比如,这是某次我无聊让 ChatGPT 干的事,其实并没有啥技术含量↓

在这种状况下,如果我们需要让 ChatGPT 辅助我们真正完成一件工作,需要非常详细的一步步写出“Prompt”,其实这很考量提问者的专业能力和技巧。

可是现在,如果 GPT- 4 真正具备了识图、读图能力,那真是太可怕了↓

给它一张 UI 草图,帮你生成前端代码…

给它一张网络拓扑图,帮你生成配置命令行…

给它一张解决方案架构图,帮你把方案文字编出来…

虽然 GPT- 4 的识图能力还有待检验,但这一天看起来并不遥远。

GPT-4,你若安好,那还得了!

❷ 它是加州小镇做题家

官方给了一组 GPT- 4 刷题的成绩,虽然说它是超级学霸还为时尚早,但某些科目的成绩已经相当逆天了。

看这成绩,最牛掰的是生物奥林匹克竞赛考试和 GRE 考试,都击败了 99% 的参考者。

律考也很厉害(Uniform Bar Exam),排位能达到前 10%。而 GPT-3.5 参加律考,只能排到倒数 10%。

刷其他题也不含糊,比如 SAT 数学,可以考到 700 分(相当于 92% 分位),而 GPT-3.5 的水平是 590 分(大约相当于 70% 分位)。

结合上一项识图能力,我觉得更加终极的考试场景是↓

你拍一张“黄冈密卷”给它,它就直接把答案给你写出来了

GPT-4,你若安好,那还得了!

❸ 它比以前更难忽悠了

以前在使用 ChatGPT(基于 GPT-3.5)的时候,经常会得到一些让人啼笑皆非的答案,甚至是与事实相悖的。

或者你可以通过给它“洗脑”,让他给出错误的答案。

比如下面这个问题,第一次回答就有明显错误,你可以进一步忽悠它。

接下来,我把 ChatGPT 的模型换成 GPT-4,再问同样的问题,这次答案看着靠谱了许多,看来做了不少功课。

但是如你继续忽悠它,还是能把它忽悠瘸。

根据官方的介绍,GPT- 4 相比 GPT-3.5,针对 9 个大类的问题,事实准确率 还是有了极大的提升。

以前的版本,普遍低于 60%。

当然,目前的缺陷仍然比较明显,也就是说,我们针对 ChatGPT/GPT 给出的答案,还需要进行细致的人工审核。

比如下面这个,就非常荒唐了。我信你个鬼!

GPT-4,你若安好,那还得了!

❹ 它比以前更贵了

GPT-3.5 版本,API 的价格是 0.2 美分 /1000 字(token),而到了 4.0 版本,价格暴涨,变成:6 美分 /1000 字(token)

可能训练个模型成本太高吧,而推理的成本也不会滴,不过相信这个价格后面会逐步降低的。

另外,GPT- 4 支持的输入文本长度大大提升了,最高可以到 32000(token)。

这个还是很有用的,你想让它帮忙校对一篇文章,或者帮你检查一段代码中的 bug,以前可能要分成很多段来输入输出。

现在,夸张一点,Ctrl+A/Ctrl+C/Ctrl+V,就可以等结果了。

GPT-4,你若安好,那还得了!

❺ ChatGPT Plus 用户有福利

这一次,对于 ChatGPT Plus 用户来说,每月 20 刀的订阅费没有白花。可以抢先试用 GPT- 4 模型,登录以后,可以在 3 种模型之间灵活选择切换。

而且,官方也非常直观地给出了三种模型的差别:

默认的付费版 GPT-3.5,响应速度 5 星,推理逻辑性 3 星,简洁性 2 星

GPT- 4 体验版,响应速度 2 星,推理逻辑性 5 星,简洁性 4 星

我在 ChatGPT 里试了一下 GPT- 4 模式,确实有点卡,而为了防止广大热心吃瓜群众过多请求,官方还做了限制:每四个小时,最多响应 100 条信息。

而且因为图片输入的模式只是预览,所以 ChatGPT 的 GPT- 4 模式也只能输入文本。

GPT- 4 模式还有个问题:它的训练数据集跟 GPT-3.5 一样,还是截止到 2021 年 9 月。

也就是说,GPT- 4 有个更聪明的脑子,脑回路更清晰,但是它的知识结构还是跟以前一样的。书读的不多,还是那些陈芝麻烂谷子。

好了 GPT- 4 的瓜,我们就先吃到这里吧。

总体感受是,现在说人工智能的奇点已到,还为时尚早,但大家太需要一个突破口了,所以才会“全民练模型,人人 GPT”。

但我们真的需要那么多大模型吗?

大模型太多,客户场景有点不够用了

原文链接:https://m.163.com/dy/article/I018E6OK0511U9HQ.html

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-29发表,共计2134字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。