GPT-4，是人类的落日么？

180次阅读

这次 GPT- 4 发布有个令人担忧的点，就是只出了一个技术文档，但没有公开论文，也没有任何的技术细节。只告诉你我有多强大，但对如何实现的 know how 只字不提。OpenAI，已经且必然会变成 CloseAI，毕竟没人和钱过不去。

2023 年 3 月 14，圆周率日的一个平淡无奇的下午，Open AI 发布了最新的大语言模型 GPT-4。初看起来这次更新没有 ChatGPT 那么酷炫：文本输入长度（token）拓展到 3 万以上，支持多模态模型输入（但没有之前期待的图像和视频输出），更强的数理推理能力（终于学会高考数学了）。

所以，更大，更快，更强，但这意味着什么呢？

GPT-4，是人类的落日么？插图

任何指数增长的曲线初期，拉近了看都不过是一个平淡的缓坡。但只有回顾整个历史的时候，我们才会知道这条曲线最终会加速到怎样的高度。正在凑近了看 GPT- 4 的人类，并不知道接下来将要面对的，是何种惊涛骇浪。

把“努力”交给 GPT，拼天赋的时代到来

有一句曾经很有道理的说法：“以大多数人的努力程度之低，根本轮不到拼天赋”，这确实是事实。很多人也被这句话刺痛而奋发图强，想努力一把，摸到拼天赋的门槛线上。

但现在似乎没必要了，因为 大多数人努力一辈子也不会比 GPT- 4 的知识储备和执行能力更强。

GPT- 4 是天生的做题家，可以自己读题自己分析然后组织文字输出。在 OpenAI 展现的第一个案例中，GPT- 4 对一道包含图像的物理题进行了解答，它理解了 PDF 格式下的图像和文字，一步步推理并得到正确答案。顺便提一嘴，这道题来自著名的巴黎综合理工大学，后者以其变态的数理难度而闻名。

GPT- 4 在美国律师资格考试（BAR）上达到了前 10%，在美国高考语文（SAT Reading and Writing）上达到了前 7%，而在生物学奥赛试题上更是达到了前 1%，可以拿国际金牌。不客气地说，这个水平已经远远超过了大部分人智力巅峰——高考前一天的水平，轻轻松松上 985。

GPT-4，是人类的落日么？插图1

但是，对于能接入 GPT- 4 的人群而言，事情并没有因此变得更轻松。因为 不好意思，从现在起你们就只能拼天赋啦！

而以大多数人的平均天赋水平，从第一天开始就连努力的机会都没了。在那个让全世界前端程序员虎躯一震的展示里，OpenAI 员工随手画了一个网站样式的草稿和文字描述，手机拍照发给 GPT-4，然后马上就生成了网站的 HTML 代码，效果立刻可以预览。

这一刻，产品经理露出了灿烂的笑容，想着明天就把“这个需求做不了”的“程序猿”给开了？

身在咨询业的我则悲喜交加，在上一篇文章里（https://mp.weixin.qq.com/s/xc7uFByTvV_TZFZJshwNVw）我还为实习生的未来感到担忧，现在已经快进到初级顾问灭绝计划了。是不是以后只需要合伙人在外面承揽业务，然后一股脑丢给我一个人承做就可以了？

我可以用 GPT 列提纲，打印出来手绘草稿，拍照丢给 GPT 画 PPT；不知道的信息让 New Bing 帮我找，没看过的文章让 ChatGPT 读了并总结，分析的模型用 ChatExcel 帮我搭，一手调研也可以让 GPT 做问卷，甚至配合 Whisper AI（语音理解模型）和讯飞配音，让他替我访谈专家并整理洞见。

实现上述的前提有两个：

第一，我知道为了完成项目要实现的目标；

第二，我要问出正确的问题。

GPT-4，是人类的落日么？插图2

“问正确的问题”才是最难的事情，这需要经验，灵感，理性和直觉的终极组合，而如果 GPT 把实习生和初级顾问都干掉了，我确实有点担心咨询这门手艺后继无人。

但肯定的一点是，在同样拥有 GPT 的情况下，人和人之间能力的差别可以被拉大到匪夷所思的地步。对于最聪明最大胆、富有激情，脑子转得比手快几百倍的那种人，他们的生产力会迅速爆棚。从前那些被“有限时间”和“低效沟通”所限制的产品、服务，如今可以快速成为现实。

不过，供给端爆炸也同样意味着，只需要寥寥数个工作狂就可以满足许多许多需求，其他人做的所谓“工作”只能算自娱自乐。

而如果那时我还没有被干掉，大概率是因为老板们想每天多睡几个小时。不然他更愿意直接指挥 GPT 模型，而不是常常“不解人意”的真人。

这不仅仅是平均的终结，这实际上是 99% 的终结。所以你觉得自己能成为 1%，还是 99% 呢？

在 GPT 面前，科技大厂黯然失色

这次 GPT- 4 发布还有个令人担忧的点，就是只出了一个技术文档（Technical Report），但没有公开论文，也没有任何的技术细节。只告诉你我有多强大，但对如何实现的 know how 只字不提。

OpenAI，已经且必然会变成 CloseAI，毕竟没人和钱过不去。

而这次提到的专属 Azure 训练集群，则意味着 CloseAI 已经和微软实现了深度融合，同时在模型规模和硬件算力上建立起深不可测的护城河。

对于今天发布的文心一言，我感到由衷地同情，类似于看到波兰骑兵冲锋德国坦克时的那种同情。但不只是百度，在 GPT- 4 面前，无论是 Google、Meta，还是任何一家大厂目前都黯淡无光。尤其当你发现 GPT- 4 的训练时间居然是去年的 8 月——那么显然，此刻跑在 1 万张 NVIDIA A100 芯片上的只会是尚未发布的 GPT- 5 了。

而下一代的 GPT- 5 会有多强大，没人知道。

很赞同作家和菜头说的这段比喻：“就像是在学校留堂，做完作业才能回家。那个最好的学生想出了办法，解决了最后一道题，然后不发一言起身回家。教室里剩下的学生，就都留在了一道看不见的障壁之后，他们知道能够穿越，他们看到有人穿越，但是他们不知道自己如何才能穿越。”

OpenAI 至少领先了半年，在指数增长的情景下，即便路径完全一样，先发者和追赶者的距离也会变得越来越大。甚至可能因为先发者对硬件算力，数据生成和用户反馈三位一体的循环虹吸，追赶者最终被彻底拉爆。

99% 的终结，对个人如此，对 AI 赛道的企业则更为残酷。

需要人的场景越来越少，AI 也可以做消费者

很多人都对 GPT- 4 的多模态模型感到惊奇，因为这并不是一个简单的 OCR，实际上 GPT- 4 是对整个图像的像素序列进行了理解、并进行了深度推理，能够发现不合理之处，甚至看懂梗图。

看起来这没有 Stable diffusion 这样的图片生成功能酷炫，但这是目前 GPT- 4 对我产生的最大的震撼。

GPT-4，是人类的落日么？插图3

| GPT- 4 可以看懂上图的幽默之处（来源：OpenAI 官网）

GPT- 4 对该图分析如下：

图片展示了一个“闪电线”适配器包装，包括三个面板。

面板 1：一部智能手机，其充电口连接了一个 VGA 接口（通常用于计算机显示器的大型、蓝色、15 针接口）。

面板 2：带有 VGA 接口图片的“闪电线”适配器包装。

面板 3：VGA 接口的特写，末端带有一个小型的闪电接口（用于为 iPhone 和其他 Apple 设备充电）。

这幅图片中的幽默来自于将大型、过时的 VGA 接口插入小型、现代智能手机充电口的荒谬之处。

这种多模态理解能力的影响是极为深刻的。

我曾设想过“无人电影”的模式，主题要素是通过流媒体的播放大数据生成的，剧本是 GPT 模型自己根据主题要素写的，画面是根据剧本自动生成的视频流，后期是通过 stable diffusion 合成的，配音是照着剧本里的台词合成的语音，宣发海报也是 stable diffusion 画的，通过 SNS 机器人自动投放，机器人水军照着剧本情节写豆瓣评论。

质量糟糕没关系，同时生成 1000 部定向投放，A/B test，每天进行迭代，必能产出神作。

但这个循环里还是有人的，那就是观众。人被投食内容、人来理解内容、表达欣赏以及做出反馈。这种反馈，一定是人才能做吗？GPT- 4 提醒我，观众也可以是 AI。

AI 模型也可以看懂电影，也可以理解微妙之处，表达欣赏，并很清楚地反馈出来。而消费的本质，是对外界信号刺激的理解和欣赏。无论这个信号是视觉信号，还是语音频率，或是舌头和皮肤的神经传感电信号。

对于 GPT，它们都不过是多模态输入的某种类型。那么 AI 其实也是能够消费内容的，甚至可能是比任何人类都更好，更具品位的消费者。

AI 对供给端的极大提升，最终可能要靠 AI 自己去消费，而不是靠着渐失生殖欲望的人类。

正如 AI 导师 Geoffrey Hinton 的推特所说，人类用千年的语言编码了整个世界，凝聚成 GPT- 4 破茧成蝶。而在完成引导程序的使命后，我们也将卸下这副碳基的躯壳。

所以，这是人类的落日吗？

我相信，明天太阳还会升起。

原创刘正来自风声 OPINION

原文链接：https://new.qq.com/rain/a/20230320A02S0J00

正文完