转自:中国经济导报
从 2022 年 11 月发布到之后差不多半年的时间,ChatGPT 所引起的关注、产生的影响,可能已经超越了信息技术历史上的几乎所有热点。
它的用户数 2 天达到 100 万,两个月达到 1 亿,打破了 TikTok 之前的记录,而在 2023 年 5 月它上架苹果应用商店后,也毫无悬念地冲上了免费 App 榜榜首。
许多人平生第一次接触如此高智能、知错能改的对话系统。虽然它很多时候会非常自信、“一本正经地胡说八道”,甚至连简单的加减法也算不对,但如果你提示它错了,或者让它一步步地来,它就会很“灵”地变得非常靠谱,有条不紊地列出做事情的步骤,然后得出正确答案。对于一些复杂的任务,你正等着看它的笑话呢,它却会不紧不慢地给你言之成理的回答,让你大吃一惊。
众多业界专家也被它征服:原本不看好它甚至在 2019 年微软投资 OpenAI 的决策中投了反对票的盖茨,现在将 ChatGPT 与 PC、互联网等相提并论;英伟达 CEO 黄仁勋称它带来了 AI 的“iPhone 时刻”;OpenAI 的山姆·阿尔特 曼(Sam Altman)将它比作印刷机;谷歌 CEO 孙达尔·皮柴(Sundar Pichai)说它是“火和电”……这些说法都与腾讯创始人马化腾认为 ChatGPT“几百年不遇”的观点不谋而合,总之都是说它开启了新时代。阿里巴巴 CEO 张勇的看法是:“所有行业、应用、软件、服务,都值得基于大模型能力重做一遍。”以马斯克为代表的很多专家更是因为 ChatGPT 的突破性能力可能对人类产生威胁,呼吁应该暂停强大 AI 模型的开发。
2015 年,30 岁的山姆·阿尔特曼和 28 岁的格雷格·布罗克曼(Greg Brockman)与马斯克联手,召集了 30 岁的苏茨克维等多位 AI 顶级人才,共同创立 OpenAI,希望在谷歌、Facebook 等诸多巨头之外,建立中立的 AI 前沿科研阵地,并且雄心勃勃地把构建与人类水平相当的人工智能作为自己的目标。那时候,媒体报道基本上都以马斯克支持成立了一家非营利 AI 机构为标题,并没有多少人看好 OpenAI。甚至连苏茨克维这样的灵魂人物,在加入前也经历了一番思想斗争。
前 3 年,他们在强化学习、机器人、多智能体、AI 安全等方面多线出击,的确没有取得特别有说服力的成果。以至于主要赞助人马斯克对进展不满意,动了要来直接管理的念头。在被理事会拒绝后,他选择了离开。2019 年 3 月,山姆·阿尔特曼开始担任 OpenAI 的 CEO,并在几个月内完成了组建商业公司、获得微软 10 亿美元投资等动作,为后续发展做好了准备。
2020 年,GPT- 3 横空出世,NLP(Natural Language Processing,自然语言处理)小圈子里的一些有识之士开始意识到 OpenAI 技术路线的巨大潜力。在中国,北京智源人工智能研究院联合清华大学等高校推出了 GLM、CPM 等模型,并积极在国内学术界推广大模型理念。
2020 年底,OpenAI 的两位副总达里奥·阿莫迪(Dario Amodei)和丹妮拉·阿莫迪(Daniela Amodei)(同时也是兄妹)带领 GPT- 3 和安全团队的多位同事离开,创办了 An-thropic。达里奥·阿莫迪在 OpenAI 的地位非同一般:他是伊尔亚·苏茨克维之外,技术路线图的另一个制作者,也是 GPT- 2 和 GPT- 3 项目以及安全方向的总负责人,而随他离开的,有 GPT- 3 和规模定律论文的多位核心人员。
一年后,Anthropic 发表论文“A General Language Assistant as a Lab-oratory for Alignment”,开始用聊天助手研究对齐问题,此后逐渐演变为 Claude 这个智能聊天产品。
2022 年 6 月,论文“Emergent Abilities of Large Language Models”发表,第一作者是仅从达特茅斯学院本科毕业两年的谷歌研究员 Jason Wei(今年 2 月,他在谷歌的“精英跳槽潮”中去了 OpenAI)。他在论文中研究了大模型的涌现能力,这类能力在小模型中不存在,只有模型规模扩大到一定量级才会出现——也就是我们熟悉的“量变会导致质变”。
当年 11 月中旬,本来一直在研发 GPT- 4 的 OpenAI 员工收到管理层的指令:所有工作暂停,全力推出一款聊天工具,原因是有竞争。两周后,ChatGPT 诞生。这之后的事情已经载入史册。
业界推测,OpenAI 管理层应该是得知了 Anthropic Claude 的进展,意识到这一产品的巨大潜力,决定先下手为强。这展现出核心人员超强的战略判断力。要知道,即使是 ChatGPT 的核心研发人员也不知道为什么该产品推出后会这么火(我爸妈终于知道我在干什么了),他们在自己试用时完全没有惊艳的感觉。
2023 年 3 月,在长达半年的“评估、对抗性测试和对模型及系统级缓解措施的迭代改进”之后,GPT- 4 发布。微软研究院对其内部版本(能力超出公开发布的线上版本)研究的结论是:“在所有这些任务中,GPT- 4 的表现与人类水平接近得惊人……鉴于 GPT- 4 的广度和深度,我们认为它可以合理地被视为 AGI 系统早期(但仍然不完整)的版本。”
很多人会问:为什么中国没有产生 ChatGPT?其实正确的问题应该是:为什么全世界只有 OpenAI 能做出 ChatGPT?他们成功的原因是什么?
对此的思考,到今天仍有意义。(作者系图灵公司联合创始人、总编,文章摘自《这就是 ChatGPT》有删减)
原文链接:http://finance.sina.com.cn/jjxw/2023-07-27/doc-imzeaizc7872778.shtml