ChatGPT那人那事

214次阅读

转自：中国经济导报

从 2022 年 11 月发布到之后差不多半年的时间，ChatGPT 所引起的关注、产生的影响，可能已经超越了信息技术历史上的几乎所有热点。

它的用户数 2 天达到 100 万，两个月达到 1 亿，打破了 TikTok 之前的记录，而在 2023 年 5 月它上架苹果应用商店后，也毫无悬念地冲上了免费 App 榜榜首。

许多人平生第一次接触如此高智能、知错能改的对话系统。虽然它很多时候会非常自信、“一本正经地胡说八道”，甚至连简单的加减法也算不对，但如果你提示它错了，或者让它一步步地来，它就会很“灵”地变得非常靠谱，有条不紊地列出做事情的步骤，然后得出正确答案。对于一些复杂的任务，你正等着看它的笑话呢，它却会不紧不慢地给你言之成理的回答，让你大吃一惊。

众多业界专家也被它征服：原本不看好它甚至在 2019 年微软投资 OpenAI 的决策中投了反对票的盖茨，现在将 ChatGPT 与 PC、互联网等相提并论；英伟达 CEO 黄仁勋称它带来了 AI 的“iPhone 时刻”；OpenAI 的山姆·阿尔特曼（Sam Altman）将它比作印刷机；谷歌 CEO 孙达尔·皮柴（Sundar Pichai）说它是“火和电”……这些说法都与腾讯创始人马化腾认为 ChatGPT“几百年不遇”的观点不谋而合，总之都是说它开启了新时代。阿里巴巴 CEO 张勇的看法是：“所有行业、应用、软件、服务，都值得基于大模型能力重做一遍。”以马斯克为代表的很多专家更是因为 ChatGPT 的突破性能力可能对人类产生威胁，呼吁应该暂停强大 AI 模型的开发。

2015 年，30 岁的山姆·阿尔特曼和 28 岁的格雷格·布罗克曼（Greg Brockman）与马斯克联手，召集了 30 岁的苏茨克维等多位 AI 顶级人才，共同创立 OpenAI，希望在谷歌、Facebook 等诸多巨头之外，建立中立的 AI 前沿科研阵地，并且雄心勃勃地把构建与人类水平相当的人工智能作为自己的目标。那时候，媒体报道基本上都以马斯克支持成立了一家非营利 AI 机构为标题，并没有多少人看好 OpenAI。甚至连苏茨克维这样的灵魂人物，在加入前也经历了一番思想斗争。

前 3 年，他们在强化学习、机器人、多智能体、AI 安全等方面多线出击，的确没有取得特别有说服力的成果。以至于主要赞助人马斯克对进展不满意，动了要来直接管理的念头。在被理事会拒绝后，他选择了离开。2019 年 3 月，山姆·阿尔特曼开始担任 OpenAI 的 CEO，并在几个月内完成了组建商业公司、获得微软 10 亿美元投资等动作，为后续发展做好了准备。

2020 年，GPT- 3 横空出世，NLP（Natural Language Processing，自然语言处理）小圈子里的一些有识之士开始意识到 OpenAI 技术路线的巨大潜力。在中国，北京智源人工智能研究院联合清华大学等高校推出了 GLM、CPM 等模型，并积极在国内学术界推广大模型理念。

2020 年底，OpenAI 的两位副总达里奥·阿莫迪（Dario Amodei）和丹妮拉·阿莫迪（Daniela Amodei）（同时也是兄妹）带领 GPT- 3 和安全团队的多位同事离开，创办了 An-thropic。达里奥·阿莫迪在 OpenAI 的地位非同一般：他是伊尔亚·苏茨克维之外，技术路线图的另一个制作者，也是 GPT- 2 和 GPT- 3 项目以及安全方向的总负责人，而随他离开的，有 GPT- 3 和规模定律论文的多位核心人员。

一年后，Anthropic 发表论文“A General Language Assistant as a Lab-oratory for Alignment”，开始用聊天助手研究对齐问题，此后逐渐演变为 Claude 这个智能聊天产品。

2022 年 6 月，论文“Emergent Abilities of Large Language Models”发表，第一作者是仅从达特茅斯学院本科毕业两年的谷歌研究员 Jason Wei（今年 2 月，他在谷歌的“精英跳槽潮”中去了 OpenAI）。他在论文中研究了大模型的涌现能力，这类能力在小模型中不存在，只有模型规模扩大到一定量级才会出现——也就是我们熟悉的“量变会导致质变”。

当年 11 月中旬，本来一直在研发 GPT- 4 的 OpenAI 员工收到管理层的指令：所有工作暂停，全力推出一款聊天工具，原因是有竞争。两周后，ChatGPT 诞生。这之后的事情已经载入史册。

业界推测，OpenAI 管理层应该是得知了 Anthropic Claude 的进展，意识到这一产品的巨大潜力，决定先下手为强。这展现出核心人员超强的战略判断力。要知道，即使是 ChatGPT 的核心研发人员也不知道为什么该产品推出后会这么火（我爸妈终于知道我在干什么了），他们在自己试用时完全没有惊艳的感觉。

2023 年 3 月，在长达半年的“评估、对抗性测试和对模型及系统级缓解措施的迭代改进”之后，GPT- 4 发布。微软研究院对其内部版本（能力超出公开发布的线上版本）研究的结论是：“在所有这些任务中，GPT- 4 的表现与人类水平接近得惊人……鉴于 GPT- 4 的广度和深度，我们认为它可以合理地被视为 AGI 系统早期（但仍然不完整）的版本。”

很多人会问：为什么中国没有产生 ChatGPT？其实正确的问题应该是：为什么全世界只有 OpenAI 能做出 ChatGPT？他们成功的原因是什么？

对此的思考，到今天仍有意义。（作者系图灵公司联合创始人、总编，文章摘自《这就是 ChatGPT》有删减）

原文链接：http://finance.sina.com.cn/jjxw/2023-07-27/doc-imzeaizc7872778.shtml

正文完