GPT4发布在即堪比人脑,多位圈内大佬坐不住了!

69次阅读

100 万亿,这个数字究竟有多大?假如你拥有每天都能中 500 万彩票的超能力,那么在不吃不喝存下所有钱的情况下,你还需要拥有约 5500 年的寿命,才能够攒下 100 万亿的财产。然而,今天想要和大家聊的这 100 万亿,背后并不是“RMB”、“Dollor”这些令人垂涎的单位。这里的 100 万亿,指的是由众多硅谷科技大亨共同创立的人工智能研究公司 OpenAI 即将发布的第四代生成式预训练 Transformer——GPT- 4 所拥有的参数量。

为了方便大家更加直观的理解这个数据,我们可以用人脑与 GPT- 4 进行对比。一般情况下,一个正常人类的大脑约有 800—1000 亿个神经元,以及约 100 万亿个突触。而这些神经元与突触,几乎直接控制着一个人百年人生中的所有思想、判断及行为,而 GPT- 4 拥有与人脑突触一样多的参数。那么,如此庞大规模的密集神经网络究竟具备着怎样的潜力;GPT- 4 的出现将会给我们的带来哪些惊喜;我们又是否已经真的具备制造人脑的能力了呢?

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

在探索这些令人兴奋的问题之前,我们不妨先来了解一下 GPT- 4 几位“前辈”的发展历史。

GPT:不鸣则已,一鸣惊人

首个 GPT 系列模型 GPT- 1 诞生于 2018 年,也就是我们常说的 NLP 预训练模型元年。GPT- 1 作为第一个基于 Transformer 的预训练模型,采取了预训练 +FineTuning 两个阶段,以 Transformer 的 decoder 作为特征抽取器,共堆叠 12 层,拥有 1.1 亿参数,预训练阶段则采用“单向语言模型”作为训练任务。

性能方面,GPT- 1 有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务中。其常用任务包括:

  • 自然语言推理:判断两个句子的关系(包含、矛盾、中立)

  • 问答与常识推理:输入文章及若干答案,输出答案的准确率

  • 语义相似度识别:判断两个句子语义是否相关

  • 分类:判断输入文本是指定的哪个类别

虽然 GPT- 1 在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此 GPT- 1 只能算得上一个还算不错的语言理解工具而非对话式 AI。

在 GPT- 1 问世一年之后,GPT- 2 也于 2019 年如期而至。相比于老大哥 GPT-1,GPT- 2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计 48 层,参数量达 15 亿,学习目标则使用无监督预训练模型做有监督任务。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

图源:推特

在性能方面,OpenAI 的大力似乎真的带来了一些奇迹。除了理解能力外,GPT- 2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上扮演他人通通不在话下。在“变得更大”之后,GPT- 2 的确展现出了一些列普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。也难怪当时 OpenAI 曾表示“GPT-2 was too dangerous to release”。

自 GPT- 2 取得成功以来,OpenAI 对“大力神教”的信仰愈发坚定,2020 年放出的 GPT- 3 继续沿用微创新、猛扩大的发展思路。除了 GPT- 3 中的 Transformer 应用了 Sparse 结构外,GPT- 3 与 GPT- 2 的结构几乎没有区别。而在“大力”方面,GPT- 3 的模型上到了 96 层,训练参数则是达到了 1750 亿个(GPT- 2 的 10 倍以上)。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

而 GPT- 3 也再次证明了 OpenAI 的眼光,由于 GPT- 3 更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的 GPT-2。作为目前最大的密集型神经网络,GPT- 3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且 GPT- 3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说 GPT- 3 似乎已经满足了我们对于语言专家的一切想象。

全面通过图灵测试,学习和商用门槛降低

说到这里,相信大家一定会有一个相同的疑问——GPT- 3 已经非常强大了,那么 GPT- 4 还有哪些值得我们期待的地方呢?

众所周知,测试一个 AI 系统智能性的最核心方式便是图灵测试,在我们还无法用科学的可量化标准对人类智慧这一概念进行定义时,图灵测试是目前为数不多的、可行的、能够确定对方是否具备人类智慧的测试方法。用一句谚语来说:如果一个东西长的像鸭子,走路像鸭子,叫起来像鸭子,那它就是鸭子。因此,如果 AI 系统能够顺利通过图灵测试,那么就意味着这个系统已具备人类思维并有可能在某些方面替代人类。而根据韩国 IT 媒体报道,自 11 月中开始,业界已经传出了 GPT- 4 全面通过了图灵测试的说法。韩国 Vodier AI 公司高层南世东在日前接受韩国《经济新闻》采访时表示:“虽然 GPT- 4 通过图灵测试的消息尚未正式确认,但这个消息应该相当可信。”

技术人出身,现任 OpenAI CEO 的 Sam Altman 似乎也在其 Twitter 中证实了这个信息。Altman 在 11 月 10 日模仿电影《星球大战》中角色达斯维德的经典台词,发出了一条推文:“不要为你制造的这种技术恐慌感到骄傲。通过图灵测试的能力在‘原力’面前也无能为力”。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

图源:推特

一位 AI 初创公司的高管分析称“如果 GPT- 4 真的完美通过了图灵测试,那么它的影响足以在 AI 界引发‘技术恐慌’,因此 Altman 才会借由达斯维德的角色来公布这个信息”。

如果 GPT- 4 在没有任何限制的情况下通过图灵测试,这的确将会创造历史。虽然此前一些 AI 模型也曾声称通过图灵测试,但都未曾得到过 AI 业界的一致认可。这是由于图灵测试的标准和规则并不明确,因此许多模型都在测试中巧妙地利用了一些“盲点”。英国雷丁大学在 2014 年推出的 AI 模型“尤金”就是一个典型的例子,当时雷丁大学对评委声称,该模型是一位 13 岁的乌克兰男孩,因此当算法无法给出很好的答案时,评委会认为这是由于被测试者是外国儿童的缘故。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

图源:网络

虽然图灵测试并不是 AI 技术的绝对参考点,但作为迄今为止最久远、最广为人知的 AI 技术测试,图灵测试仍然有着很大的象征意义。如果 GPT- 4 真的正式且肯定的通过了图灵测试,那么它将极有可能创造迄今为止 AI 界最大的一座里程碑。

除此之外,与 GPT- 3 不同的是,GPT- 4 将很有可能不仅只是一个语言模型。OpenAI 首席科学家 Ilya Sutskever 曾在其撰写的多模态相关文章中暗示过这一点——“文字本身即可表达关于这个世界的大量信息,但毕竟是不完整的,因为我们也生活在视觉世界之中。”因此,业界部分专家认为 GPT- 4 将会是多模态的,可以接受音频、文本、图像甚至是视频输入,并预测 OpenAI 的 Whisper 的音频数据集将用于创建 GPT- 4 所需的文本数据。这也意味着 GPT- 4 对于外界信息的接收与处理将不会再有任何局限性。

而工业界关注 GPT- 4 的原因,则很有可能是由于 GPT- 4 的实际商用门槛将比传统 GPT- 3 更低。此前由于巨额费用和基础设施原因而未能使用相关技术的企业也将有望使用 GPT-4。目前 GPT- 4 已进入上市的最后阶段,将于今年 12 月至明年 2 月期间发布。剑桥 AI 研究公司分析师 Alberto Garcia 通发表了博客并预测:“GPT- 4 将更专注于优化数据处理,因此 GPT- 4 的学习成本预计将低于 GPT-3。GPT- 4 的每集学习成本将可能由 GPT- 3 的数百万美元将至 100 万美元左右”。

殊途同归:模拟人脑或来得更快

如果以上信息全部属实,那么此刻我们可以预见,随着 GPT- 4 的发布,明年深度学习研究领域将迎来一轮新的热潮;各个行业中将可能出现大量更加高级、更加自然且几乎无法辨别其身份真伪的聊天服务机器人;在此基础上,也将会有更多高质量的个性化 AI 服务从不同的传统业务中诞生;我们也将极有可能第一次实现与认知智能的无障碍交流。

再说回开篇提到的制造人脑或者说模拟人脑的问题。据 MIT 的一项研究显示,虽然 GPT- 3 中的神经网络并没有试图直接模仿人类大脑,但 GPT- 3 所呈现出的语言处理方式与人类大脑进化过程所得到的解决方案存在一定的相似性,当向模型输入与测试人脑相同的刺激时,模型获得了与人脑同类型的激活,且在 40 余种语言模型测试中,GPT- 3 几乎做出了完美的推断,这些模型的基本功能的确类似于人类大脑语言处理中心的功能。对此,斯坦福大学心理学和计算机科学助理教授 Daniel Yamins 也表示:“人工智能网络并没有直接模仿大脑,但最终看起来却像大脑一样,这在某种意义上表明,人工智能和自然之间似乎发生了某种趋同演化”。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

图源:网络

由此可见,虽然 GPT 系列模型并没有直接采用蓝脑计划项目中的模拟大脑结构的设计思路,但其呈现出的效果似乎比蓝脑计划项目更加接近我们的期望。因此,如果这一研究方向真的切实可行,且 GPT- 4 能够在 GPT- 3 的基础上实现某些方面的跨越性突破,那么我们距离模拟人脑的部分功能的目标将更进一大步。

最后,我想引用 OpenAI CEO Sam Altman 近期在 Twitter 上发表的一段文字作为结尾,而这段话也得到了“硅谷钢铁侠”Elon Musk 的认可——“通用人工智能的建立会比大多数人想象的更快,并且它会通过很长的时间来‘改变’大多数人想象中的一切”。

GPT4 发布在即堪比人脑,多位圈内大佬坐不住了!

图源:推特

举报 / 反馈

原文链接:https://baijiahao.baidu.com/s?id=1750432340416488942&wfr=spider&for=pc

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-30发表,共计3804字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。