GPT-4,是人类的落日么?

113次阅读

这次 GPT- 4 发布有个令人担忧的点,就是只出了一个技术文档,但没有公开论文,也没有任何的技术细节。只告诉你我有多强大,但对如何实现的 know how 只字不提。OpenAI,已经且必然会变成 CloseAI,毕竟没人和钱过不去。

2023 年 3 月 14,圆周率日的一个平淡无奇的下午,Open AI 发布了最新的大语言模型 GPT-4。初看起来这次更新没有 ChatGPT 那么酷炫:文本输入长度(token)拓展到 3 万以上,支持多模态模型输入(但没有之前期待的图像和视频输出),更强的数理推理能力(终于学会高考数学了)。

所以,更大,更快,更强,但这意味着什么呢?

GPT-4,是人类的落日么?插图

任何指数增长的曲线初期,拉近了看都不过是一个平淡的缓坡。但只有回顾整个历史的时候,我们才会知道这条曲线最终会加速到怎样的高度。正在凑近了看 GPT- 4 的人类,并不知道接下来将要面对的,是何种惊涛骇浪。

把“努力”交给 GPT,拼天赋的时代到来

有一句曾经很有道理的说法:“以大多数人的努力程度之低,根本轮不到拼天赋”,这确实是事实。很多人也被这句话刺痛而奋发图强,想努力一把,摸到拼天赋的门槛线上。

但现在似乎没必要了,因为 大多数人努力一辈子也不会比 GPT- 4 的知识储备和执行能力更强。

GPT- 4 是天生的做题家,可以自己读题自己分析然后组织文字输出。在 OpenAI 展现的第一个案例中,GPT- 4 对一道包含图像的物理题进行了解答,它理解了 PDF 格式下的图像和文字,一步步推理并得到正确答案。顺便提一嘴,这道题来自著名的巴黎综合理工大学,后者以其变态的数理难度而闻名。

GPT- 4 在美国律师资格考试(BAR)上达到了前 10%,在美国高考语文(SAT Reading and Writing)上达到了前 7%,而在生物学奥赛试题上更是达到了前 1%,可以拿国际金牌。不客气地说,这个水平已经远远超过了大部分人智力巅峰——高考前一天的水平,轻轻松松上 985。

GPT-4,是人类的落日么?插图1

但是,对于能接入 GPT- 4 的人群而言,事情并没有因此变得更轻松。因为 不好意思,从现在起你们就只能拼天赋啦!

而以大多数人的平均天赋水平,从第一天开始就连努力的机会都没了。在那个让全世界前端程序员虎躯一震的展示里,OpenAI 员工随手画了一个网站样式的草稿和文字描述,手机拍照发给 GPT-4,然后马上就生成了网站的 HTML 代码,效果立刻可以预览。

这一刻,产品经理露出了灿烂的笑容,想着明天就把“这个需求做不了”的“程序猿”给开了?

身在咨询业的我则悲喜交加,在上一篇文章里(https://mp.weixin.qq.com/s/xc7uFByTvV_TZFZJshwNVw)我还为实习生的未来感到担忧,现在已经快进到初级顾问灭绝计划了。是不是以后只需要合伙人在外面承揽业务,然后一股脑丢给我一个人承做就可以了?

我可以用 GPT 列提纲,打印出来手绘草稿,拍照丢给 GPT 画 PPT;不知道的信息让 New Bing 帮我找,没看过的文章让 ChatGPT 读了并总结,分析的模型用 ChatExcel 帮我搭,一手调研也可以让 GPT 做问卷,甚至配合 Whisper AI(语音理解模型)和讯飞配音,让他替我访谈专家并整理洞见。

实现上述的前提有两个:

第一,我知道为了完成项目要实现的目标;

第二,我要问出正确的问题。

GPT-4,是人类的落日么?插图2

“问正确的问题”才是最难的事情,这需要经验,灵感,理性和直觉的终极组合,而如果 GPT 把实习生和初级顾问都干掉了,我确实有点担心咨询这门手艺后继无人。

但肯定的一点是,在同样拥有 GPT 的情况下,人和人之间能力的差别可以被拉大到匪夷所思的地步。对于最聪明最大胆、富有激情,脑子转得比手快几百倍的那种人,他们的生产力会迅速爆棚。从前那些被“有限时间”和“低效沟通”所限制的产品、服务,如今可以快速成为现实。

不过,供给端爆炸也同样意味着,只需要寥寥数个工作狂就可以满足许多许多需求,其他人做的所谓“工作”只能算自娱自乐。

而如果那时我还没有被干掉,大概率是因为老板们想每天多睡几个小时。不然他更愿意直接指挥 GPT 模型,而不是常常“不解人意”的真人。

这不仅仅是平均的终结,这实际上是 99% 的终结。所以你觉得自己能成为 1%,还是 99% 呢?

在 GPT 面前,科技大厂黯然失色

这次 GPT- 4 发布还有个令人担忧的点,就是只出了一个技术文档(Technical Report),但没有公开论文,也没有任何的技术细节。只告诉你我有多强大,但对如何实现的 know how 只字不提。

OpenAI,已经且必然会变成 CloseAI,毕竟没人和钱过不去。

而这次提到的专属 Azure 训练集群,则意味着 CloseAI 已经和微软实现了深度融合,同时在模型规模和硬件算力上建立起深不可测的护城河。

对于今天发布的文心一言,我感到由衷地同情,类似于看到波兰骑兵冲锋德国坦克时的那种同情。但不只是百度,在 GPT- 4 面前,无论是 Google、Meta,还是任何一家大厂目前都黯淡无光。尤其当你发现 GPT- 4 的训练时间居然是去年的 8 月——那么显然,此刻跑在 1 万张 NVIDIA A100 芯片上的只会是尚未发布的 GPT- 5 了。

而下一代的 GPT- 5 会有多强大,没人知道。

很赞同作家和菜头说的这段比喻:“就像是在学校留堂,做完作业才能回家。那个最好的学生想出了办法,解决了最后一道题,然后不发一言起身回家。教室里剩下的学生,就都留在了一道看不见的障壁之后,他们知道能够穿越,他们看到有人穿越,但是他们不知道自己如何才能穿越。”

OpenAI 至少领先了半年,在指数增长的情景下,即便路径完全一样,先发者和追赶者的距离也会变得越来越大。甚至可能因为先发者对硬件算力,数据生成和用户反馈三位一体的循环虹吸,追赶者最终被彻底拉爆。

99% 的终结,对个人如此,对 AI 赛道的企业则更为残酷。

需要人的场景越来越少,AI 也可以做消费者

很多人都对 GPT- 4 的多模态模型感到惊奇,因为这并不是一个简单的 OCR,实际上 GPT- 4 是对整个图像的像素序列进行了理解、并进行了深度推理,能够发现不合理之处,甚至看懂梗图。

看起来这没有 Stable diffusion 这样的图片生成功能酷炫,但这是目前 GPT- 4 对我产生的最大的震撼。

GPT-4,是人类的落日么?插图3

| GPT- 4 可以看懂上图的幽默之处(来源:OpenAI 官网)

GPT- 4 对该图分析如下:

图片展示了一个“闪电线”适配器包装,包括三个面板。

面板 1:一部智能手机,其充电口连接了一个 VGA 接口(通常用于计算机显示器的大型、蓝色、15 针接口)。

面板 2:带有 VGA 接口图片的“闪电线”适配器包装。

面板 3:VGA 接口的特写,末端带有一个小型的闪电接口(用于为 iPhone 和其他 Apple 设备充电)。

这幅图片中的幽默来自于将大型、过时的 VGA 接口插入小型、现代智能手机充电口的荒谬之处。

这种多模态理解能力的影响是极为深刻的。

我曾设想过“无人电影”的模式,主题要素是通过流媒体的播放大数据生成的,剧本是 GPT 模型自己根据主题要素写的,画面是根据剧本自动生成的视频流,后期是通过 stable diffusion 合成的,配音是照着剧本里的台词合成的语音,宣发海报也是 stable diffusion 画的,通过 SNS 机器人自动投放,机器人水军照着剧本情节写豆瓣评论。

质量糟糕没关系,同时生成 1000 部定向投放,A/B test,每天进行迭代,必能产出神作。

但这个循环里还是有人的,那就是观众。人被投食内容、人来理解内容、表达欣赏以及做出反馈。这种反馈,一定是人才能做吗?GPT- 4 提醒我,观众也可以是 AI。

AI 模型也可以看懂电影,也可以理解微妙之处,表达欣赏,并很清楚地反馈出来。而消费的本质,是对外界信号刺激的理解和欣赏。无论这个信号是视觉信号,还是语音频率,或是舌头和皮肤的神经传感电信号。

对于 GPT,它们都不过是多模态输入的某种类型。那么 AI 其实也是能够消费内容的,甚至可能是比任何人类都更好,更具品位的消费者。

AI 对供给端的极大提升,最终可能要靠 AI 自己去消费,而不是靠着渐失生殖欲望的人类。

正如 AI 导师 Geoffrey Hinton 的推特所说,人类用千年的语言编码了整个世界,凝聚成 GPT- 4 破茧成蝶。而在完成引导程序的使命后,我们也将卸下这副碳基的躯壳。

所以,这是人类的落日吗?

我相信,明天太阳还会升起。

原创 刘正 来自风声 OPINION

原文链接:https://new.qq.com/rain/a/20230320A02S0J00

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-28发表,共计3392字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。