GPT-3:是富人的游戏,还是未来的电力?

115次阅读
GPT-3:是富人的游戏,还是未来的电力?

人工智能将是未来核心生产力,这一观点在科技届几乎无人会反对。

因此创造一个类人甚至超人的 AI 产品迷人且充满了想象力,吸引着各个行业都在尝试使用 AI 来帮助产业向智能化转型,资本和创业者也在其中沉浮向前。

2020 年 6 月,在训练约 2000 亿个单词、烧掉几千万美元后,史上最强大 AI 模型 GPT- 3 一炮而红。写小说、编剧本、敲代码……GPT- 3 的无所不能吸引了全球数以万计的开发人员正在基于该平台开发,目前 300 多种应用程序在使用 GPT-3,每天生产 45 亿个字符。

随着其应用场景的不断扩大,GPT-3 真的能取代人类吗?

一、GPT- 3 到底有多厉害?

之所以笔者今天想聊聊这个看似遥不可及的底层技术,是因为最近看了一部电视剧《你好,安怡》。在剧中,安怡是一位来自 2035 年的 AI 机器人,与当前生活中不一样的是,目前技术下的智能机器人虽然能帮忙做一些任务,但似乎只能干一件事。医院里的智能导诊机器人不会写代码,送餐的机器人也写不了小说,它们更像是一个个工具而非智能体。

GPT-3:是富人的游戏,还是未来的电力?

一个真正的 AI 机器人应该什么样呢?电视剧里的安怡似乎给出了方向,她拥有自己的独立意识,不仅能搞定家务、带孩子,还能通过修改程序帮助主人解决工作危机,甚至还想做这个家庭的女主人。

想让 AI 机器人能够像人一样交流,就要用优异的 NLP(自然语言处理)能力。 而今天探讨的主角 GPT- 3 就是 NLP 领域的佼佼者,达到了万能选手一般的能力,也因此被人为是 AI 领域一个出人意料的进步。

本质上 GPT-3 是一个语言模型,而语言是智慧的工具,人能成为万物之灵是能够借助语言去获得知识。如果 AI 掌握了语言,并且理解还能预测人类语言,那么拥有 GPT- 3 语言的 AI 机器人就很有可能成为安怡这样的通才。

GPT-3:是富人的游戏,还是未来的电力?

这里就不得不提一下 GPT- 3 的背景,GPT- 3 是由人工智能组织 OpenAI 开发的语言。该组织成立于 2015 年成立,其联合创始人包括特斯拉 CEO 马斯克、著名孵化器 Y Combinator 前 CEO 山姆·奥特曼以及著名投资人彼得·蒂尔等。

值得一提的是,此前 NLP(自然语言处理)并不是 Open AI 最为关注的领域,但自然语言处理方面成果是业内一直关注的重点。

2020 年,美国查普曼大学的学生利用基于 Transformer 的 GPT- 3 模型,创作了影片剧本《律师》,走红社交网络。

2021 年,OpenAI 又基于 GPT- 3 发布了 DALL·E 这个连接文本与图像的神经网络,能通过自然语言操纵视觉概念,比如,你输入“一把牛油果造型的扶手椅”,它们就能通过图像合成出一系列的目标图像。

GPT-3:是富人的游戏,还是未来的电力?

人们所惊叹的创造力,让 GPT- 3 产生了巨大的商业价值。

越多越多的企业家、科研人员甚至艺术家都开始探索这个领域,对他们来说,GPT - 3 意味着一种新的工具的诞生。

ZeroCrater 的创始人甚至在一篇博客文章中表示,GPT - 3 比他尝试过的任何 AI 语言系统都更加连贯。确实 GPT-3 可扩展性非常强大,甚至可以用在无代码开发领域,只要对它输入你想要什么样的网页或者 app,它就能帮你直接生成。因此,之前业内也传出过基层码农将会被 AI 干掉的言论。

从技术的角度,GPT- 3 是有史以来功能最强大的语言模型。 从初代 GPT 到 GPT-3,算法模型基本没有变化,但通过堆人、堆算力来进行训练后的结果就是 GPT- 3 有希望去胜任所有智力任务。

GPT-3:是富人的游戏,还是未来的电力?

数据显示,GPT 训练数据量从 1 代到目前的 3 代一直在高速增长,GPT- 3 的参数量已经达到 1750 亿,而算力费也已经是千万级别。

可见,GPT- 3 靠的是通过规模化现有算法模型,来实现算力的增长。回顾 GPT-3 的技术思路,可以发现 AI 领域的一个明显趋势是: 要训练一个有颠覆性进步的模型,最终比拼的是算力规模。

二、算力,一场富人的游戏?

神经网络之父 Geoffrey Hinton 在 GPT- 3 出现后,曾这样感慨:“生命、宇宙和万物的答案,其实只是 4.398 万亿个参数而已。”

算力是 AI 发展始终绕不开的问题。

GPT-3:是富人的游戏,还是未来的电力?

罗氏、辉瑞、诺华、默沙东等等著名药企,都瞄准 AI 完成药物筛选,加速新药研发进程;谷歌的 AI 程序 AlphaFold 2,去年成功解决了蛋白质折叠的问题,相当于突破了生物学 50 年的重大难题……这些科技成果背后离不开计算机的发展,计算机算力已经成为基础科研、前沿研究的重要工具。GPT- 3 的参数量已经达到千亿级别,规模接近人类神经元的总量,就是最好的例子。

但强大的算力往往靠的是财力的支持。 其实 GPT- 3 不仅训练成本高,此前微软还为训练它特地建设了一个 5 亿美元的超算中心。微软这个超算中心装载了一万张英伟达 GPU,训练 GPT- 3 消耗了它 355 个 GPU 年的算力。

因此算力带来的经济成本也成为了国内 AI 研发的壁垒。 一方面,国内 AI 大厂拥有的软硬件虽然多,但是不够开放,闲置的算力资源被散落在各个平台。

GPT-3:是富人的游戏,还是未来的电力? 中国拥有全球超算 Top500 中的 226 台

另一方面,中国很少有企业能够像微软一般财大气粗组件算力中心。因为即使是比 GPT- 3 规模更小的 AI 模型,动辄耗费几十乃至上百张 AI 加速卡,对很多企业来说也是“不能承受之重”。

三、谁能打造国内的 AI 发电厂?

那么在中国,如果打造成出一个比 GPT- 3 更强,甚至像安怡一般超出想象力的人工智能呢?

目前看来市面上有两种路径可以走,一种是开发出更加强大的算法,更高效地利用算力,节省费用;另一种是就是在现有算法基础上进行规模化训练,让更多 AI 模型获得丰富的训练参数,从而达到优质模型的开放。但当下,走通两条路的前提都是拥有强大的算力。据估计,未来人工智能将占据 80% 以上的计算需求,需要有开放的 AI 算力中心承载这种需求。

GPT-3:是富人的游戏,还是未来的电力?

还记得去年国家发改委明确划定“新基建”的概念范围时,指出“人工智能作为信息基础设施板块中的新技术基础设施,因其对传统产业的创新和重塑能力,更被誉为是数字经济时代的‘新电能’”。

因此当 AI 被誉为数字经济时代的“新电能”时,谁先搭建开放的算力中心,谁将成为国内的 AI 发电厂。

开源这件事,在过去的手机行业取得了巨大的成功,凭借软件开放、硬件整合的能力,普通消费者短短十年内享受到了智能手机普及的福利。

因此 AI 产业若能完成算力的软件与硬件的开源,就能让 AI 行业迅速发展。

GPT-3:是富人的游戏,还是未来的电力?

因为开源可以高效统筹散落的闲置算力资源,达到提高算力的结果,从而低成本实现整个产业的共赢。

2011 年,Facebook 牵头发起了 OCP 开放计算项目,4 年时间内 OCP 就为 Facebook 节省了 20 亿美元的成本,数据中心电费降低了 20%。

还有英特尔、微软、谷歌都在以开放的姿态融合更多新的 AI 硬件,把更强大的算力贡献给产业。

反观国内,阿里拥有突出的云计算能力,为超过一半的 A 股上市公司、80%中国科技创新企业提供服务;商汤做为中国知名的 AI 算法提供商,已公开的全球专利资产近 2000 件,覆盖 20 个国家和地区;浪潮智算中心与 5G 结合,提供了云端训练、边缘推理的新应用场景……这些前言 AI 企业都能把算力供给全行业使用,就能推动 AI 的产业化,以国内庞大市场,也一定能催生更强大 AI 模型的诞生。

GPT-3:是富人的游戏,还是未来的电力?

四、未来价值

知名风投机构 A16Z 合伙人 Frank Chen 关于 CPT- 3 的观点是,GPT- 3 让使用者避开了培训数据以及建立 AI 业务的部分经济成本,这使得 NLP(自然语言处理)成为 AI 研发最有前途的领域之一。因为有了 GPT-3,很多 AI 初创公司的软件都内置了最新的 NLP 技术。

这意味着,开放 API 的 GPT- 3 已经对 AI 创业公司产生正向的影响。随着算力的开放,AI 时代拥有更多低廉的算力资源,更多像 GPT- 3 一样的 AI 模型就会低成本出现,从而推动 AI 的产业化。

GPT-3:是富人的游戏,还是未来的电力?

但新兴的技术往往面临高速发展与低速商业化的困局,因此新旧技术之间的交替也非常考验资本与企业的耐心。但不能偏于一隅的仅仅讨论商业应用价值,因为它代表着未来的竞争力。

几十年前,柯达说,你负责按快门,剩下的交给我们。

在未来,AI 或许也会表明心态,人类什么都不用干,剩下的交给它。

作者:可达怡

编辑:安吉拉

举报 / 反馈

原文链接:https://baijiahao.baidu.com/s?id=1697439333312484355&wfr=spider&for=pc

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-27发表,共计3288字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。