ChatGPT 到底是个啥 – 它甚至会和狗说话
一、阅读须知
本文并非标题党,与狗对话 是一个很有意思的使用案例,会在后文中揭示。最近 ChatGPT 可以说是火爆出圈了,和身边的人聊起这个话题都会饶有兴趣的和你说上几句。但是看了国内一些评论和弹幕,对它的了解可谓参差不齐,所以想来还是写一篇文章来和大家一起交流。
1. 文章写作背景
笔者出国攻读第二硕士学位毕业后,就继续从事软件开发、大数据、人工智能、电子数码领域。在 ChatGPT 诞生之前,笔者就已经在使用 OpenAI 平台了,所以在 ChatGPT 大火之时曾一度的反复确认,这是不是就是大家所说的 ChatGPT,直到看了一些截图和视频之后才最后确定,这确实是自己已经使用了很久的产品。
因为已经在 OpenAI 平台上使用了一段时间,因此可以更为细致的为大家介绍它的 发展历程 、 主要作用 以及平台中与之相关的 其它功能模块 。目前 ChatGPT 已经推出了订阅服务,可以更快的响应,每月 20 刀,笔者也是第一时间入手。 目前国内还不能很方便的访问,看了有很多类似 镜像网站 或者 API 接入 教程,但目前看都 不能 和官网提供的服务完全等同,这其中有几个关键点,后文中会详细介绍。
2. 你会收获什么
你会了解到 ChatGPT 到底是什么,我会使用通俗易懂的例子进行解释,对于模型的具体细节,本篇文章 不会涉及 。我平时的工作只是停留在 AI 应用整合这一层,所以模型具体怎么训练出来的,我不需要去关心,也不知道,所以也不会乱说。 不要拿一些公众号对话的截图来问我为什么它这么智障或者鸡肋,正如前文中说的,你所使用到的可能并不是 ChatGPT 本身,而只是基于 GPT-3 或Codex模型实现的交互,因为目前 ChatGPT 并未提供单独的 API 接口,是一个正在以较高频率不断更新的单独模型。
同时也看到很多人在用各种问题在和它对话,其实也就是玩耍一下,但是当你更加了解它是什么以后,你就会更加知道如何发问,以及如何让它发挥更大的作用。文中也整理了一些世界范围内有趣的案例来帮助大家了解,同时也会解释到底为什么有些问题它不能回答。目前 AI 绘图同样也十分火爆,同时伴随着 ChatGPT 迅速诞生了很多 浏览器插件 以及 整合产品,同样也会在文中为大家介绍。这里就不阐述如何在国内使用了,网络上已经有很多的教程了,看完本文后,你就知道如何去选择和使用了。
二、ChatGPT 介绍
这一部分会直接从使用者的视角来进行介绍,直接省去枯燥无用的百科内容,但是会为大家介绍一下孕育 ChatGPT 的 OpenAI 平台,可以帮助大家对 ChatGPT 有一个更好的了解。
1. 模型发展历程
由于我们不讨论模型的具体细节,于是这个问题让它自己回答一下就行了,想了解细节的小伙伴可以去查看官方文档:https://platform.openai.com/docs/introduction
这基本是把模型训练和使用的标准答案列了一遍,毕竟哪家模型都是这样构建的。。。不过没有关系,下面的内容会用各种案例让大家认识到它的独特之处。【知识截止日期:2021 年 9 月】
2. OpenAI 平台
在 OpenAI 平台上,其实提供了很多实用的功能模块,简单的介绍几个,你可以理解为 ChatGPT【指产品本身】是一个将 NLP(自然语言处理)、 训练模型 、 用户交互 整合到一起的产品。
在平台上,这些功能模块被分为了 7 个类别,但是不同的功能可能所属多个类别,这里我们只介绍其中四个:Conversation、Generation、Translation、Transformation。
-
Conversion【对话】:以问答形式进行交互,并且能够根据不同语境给出不同的答案
-
Generation【创建】:根据少量的描述信息或指令,根据已有知识创造符合不同场景和标准要求的内容
-
Translation【翻译】:在不同语言之间进行自然语义理解的有效翻译
-
Transformation【转化】:根据提供的已有内容提取摘要,二次创作等
以上这些功能模块都已经提供了相关的 API,都可以单独拿来玩耍,当然也可以组合使用,大胆尝试,也许你就能封装出一个新的产品。
3. 应该如何认知
文章的核心部分从此开始,看了很多小伙伴的分享:
-
有些人在说:为什么连天气都不能查?
-
还有的在说:答案是网络上查的吧?
-
有弹幕在说:这玩意是不联网的
于是呼。。。最后讨论的重点就变成了它到底连不连网😓好吧,这是我没有想到的。我想从这些问题切入是一个不错的选择,首先来说说查天气的问题,如果你问它天气怎么样,它会这样回复:
于是就有人说:这是个智障吧,我笑死。。。如果要直接把这个问题说的很清楚,需要解释很多,我首先举一个相同场景的例子:假设我们手里有一台装了很多软件的笔记本电脑,功能强大,但是我却用它顶在头顶来挡雨,嘴上还不停的抱怨:还不如一把雨伞好用!那么,这是谁的问题呢?到这里,问题已经解答了一半,它能不能增加一个联网功能来获取实时的数据呢?当然能,就好比一个检测电脑自身硬件指标的小工具,在不需要网络的状态下就可以工作的很好,现在你希望它有一个查询天气的功能,能不能加呢?当然能,只要有一个稳定的数据源,查询一下又有何难,但是这个功能和它原本的作用是不相关的,就像早期的诺基亚手机的强度堪比板砖,甚至可以用来防身,但是用手机与歹徒进行搏斗并不是它的必须属性。接下来我们从专业的角度来回答问题的另一半,既然 ChatGPT 是根据已有的知识来进行回答的,那我用它查询历史数据和天气预测总行了吧?尝试之后发现结果是这样的:
为什么预测也做不到呢?这里一个关键信息是 人工智能语言模型 ,虽然可以这些东西都统称为 AI,但是请不要把所有的模型都混同起来。就好像你如果让一个商品推荐模型来告诉你什么时候机票价格最低显然是做不到的。总结起来就是:请不要把 ChatGPT 当作一个大号的 聊天机器人 或者 智能音箱 来使用,当然如果你想体验一把让人工智能一败涂地的感觉,大可以继续问它回答不了的问题来羞辱它。对于联不联网的问题其实并不是最关键的,毕竟它的所有训练数据都来自互联网,但是对于你所问的问题,马上去互联网搜索,然后去优化模型,再给出答案显然是不合理的。这里具体就不展开说了,我们用一个例子来解释 ChatGPT 到底做了一件什么事情。用数据库来做比喻,如果我们需要查询数据库中的数据,需要自己理解我们要查的数据应该到哪里获取,通过什么样的方式【SQL 语句】才能获取到。而目前 ChatGPT 就自主完成了上述的过程,可以理解我们需要的是什么,并且能够根据已掌握的知识去直接回答或创造性的解答。这里用数据库做对比并不是完全合适的,毕竟整个的过程是遵照Input Data -> Model -> Get Output,并不是数据库查询,而是模型处理结果,这个模型也就是 ChatGPT 的核心部分。
4. 各种体验方式
从 ChatGPT 推出以后,出现了很多相关的整合产品或阉割版【目前还没发现真正意义上的镜像网站,都是某个 API 封装】。原因很简单,官网目前还没有开放 ChatGPT 的 API 访问,如果想体验完整版还是需要去官网。这里为大家介绍几个用着还不错国内封装版:
-
CSDN 机器人:https://so.csdn.net/so/chat -> 还原度比较高,推测是基于 OpenAI 平台的 api 进行了二次开发,但是由于访问人数比较多,偶尔出现无法响应的情况
-
国内封装版:https://chatgpt3.net/ -> 感觉只是简单组合了某些 API 调用,还原度不高,但是界面基本百分百复刻,笔者测试时反应较慢
特别说明:并不是特意想说明这些网站不是真正的 ChatGPT,如果你想要查询一些问题,使用起来基本差别不大,但是如果你想真正了解和体验它的所有特点,请直接到官网。【满满的求生欲】
-
WebChatGPT【浏览器插件】:如果你就是纠结于让它能够从网络查询某些实时信息,可以使用这款插件。其实就是将搜索到的结果进行 Make Summary,并不具备验证错误或正确的能力。
-
ChatGPT for Google【浏览器插件】:在 Google 搜索结果右侧添加 ChatGPT 返回结果,这个插件相当于同时用搜索引擎和 ChatGPT,不过在国内折腾的话比较麻烦,而且使用需要有 OpenAI 平台账号。
-
整合搜索引擎:https://www.perplexity.ai/
原理与 WebChatGPT 插件类似,将搜索结果灌入到 ChatGPT 帮助总结,通过融合多个搜索结果来提高准确性,默认只会返回一条结果,实际网络搜索结果会在 SOURCES 中列出。不足:不支持直接在搜索框输入中文,需要复制粘贴进去,使用有些不便。
注意:如果你想体验真实的 ChatGPT,各种 API 接入教程就不用看了,基本都是某个 Chat 功能模块的接入罢了,并不是 ChatGPT 完全体,当然如果你的要求不高可以把它变成一个微信机器人,用着确实方便。
三、有趣的使用案例
接下来我们通过一些案例来更加全面的认识一下 ChatGPT,为什么说它不是一个聊天机器人。对于每一个案例,笔者不会做过多的主观评述,大家可以在评论区留下自己的看法。
1. 原创能力如何
世界级高 View 案例:【Please write a breaking news article about a leaf falling from a tree.】其实我更想放出英文版的,但是为了方便各位看官,直接贴出中文版:
这里可以看出,它知道新闻稿会是什么样的风格,有时间、地点、事件,并引出了与此可能相关的人员,并且关系和行为也十分合理。由于是一篇树叶掉下来的新闻,所以整体感觉上有些滑稽,但是创作能力可见一斑。
2. 绘画能力如何
现在有很多根据描述词生成图片的应用,从国内到国外都有,首先介绍几个用着不错的产品:
-
OpenAI 平台产品:https://labs.openai.com/
产品名称DALL·E 2,可以使用描述词或上传图片进行生成。初始赠送 50 个彩色魔方,用作图片生成的货币,目前不提供订阅付费,只提供单独购买。但是由于 AI 生成的图片一般要多次修改才能出现了自己理想中的效果,所以长期使用真的是太贵了,于是乎我并没有下手。
-
Deep Dream Generator:https://deepdreamgenerator.com/
初始赠送 80 能量,提供订阅和单独购买两种方式,但是测试之后发现在生成一些艺术图片时效果比较好,写实风就会差一些。
-
Midjourney:https://www.midjourney.com/
可以直接在 Discord 中以对话方式创建图像,初始赠送 20 张免费额度,提供按月支付方式。每月 200 张,月供 8 刀,没有犹豫,直接入了一年。
下面来介绍一下如何使用这些工具生成与预期效果更加贴合的图片,简单来说:AI 更懂 AI。目前生成图片的主要方式就是通过描述词语,但是我们并不知道如何向 AI 描述各种关键细节,因为每一张图片的关键细节都不一样,这个时候就可以借助 ChatGPT。如果我想生成一张 无骨鸡爪 的图片,并且只使用这个词本身,那么我会得到。。。
左边的图还好,虽然不是我想要的菜,但是附赠了一个服务员小姐姐,姑且就不追究了。但是第二张图着实是为我平淡的生活增添了一丝欢乐,好家伙,直接把原始食材摆上来了,直接看笑了。可见,对于一个专有名词,AI 的理解能力有限,但是我们可以让 ChatGPT 来帮助我们生成描述词:
接下来我得到了,相信还有优化的空间,因为我并没有修改 ChatGPT 给出的任何内容:
3. 竟能和狗对话
世界级高 Point 案例:【Explain HTML to me like I'm a dog.】这是一个很有意思的案例,这里我们对自己的身份做了假设,先来看看 ChatGPT 的反应如何:
-
当我是一只狗
我哭死,在觉得我不能理解 HTML 之后还贴心的安慰我,告诉我可以享受生活😂
-
当我只有三岁
这其实是笔者突发奇想,给自己一个设定,你会发现 ChatGPT 明确的理解什么是三岁小孩,三岁小孩是什么样的思维,应该如何与之沟通。在讲解的过程中,它更多的使用了比喻,而基本没有出现专业术语,结尾的总结也是点睛之笔,看起来很像是会对小孩子说的话。
-
当我是成年人
对于成年人来说,直接使用了专业性的术语,全面的讲解了基础概念和作用。
通过这个测试,其实可以引申出一个很有用的场景,当我们不能很好的理解一样东西时?能否换个思路,先从宏观上去认识,然后慢慢细化和拆解,也可以利用 ChatGPT 这个工具,让它从不同的角度为我们做出解答。
4. 编程代码纠错
最后来说说和开发者相关的内容,如果直接使用 ChatGPT 解答算法题目,甚至于是带有场景的应用题都是没问题的,这里就不进行演示了。这个案例是想让大家看看它对于代码的理解程度,如果我故意给了它一段错误的代码,结果会如何呢?
由于我没有指定编程语言,所以它给出了 C# 的正确代码片段,同时对其中的错误做了说明和完善,并给出了正确的调用测试用例。虽然使用测试的例子很简单,但是可以确定的是它不仅仅是在已有题库或功能代码进行查询,而是真的可以使用编程思维去解决你提出的问题。是的,它理解你说的。
四、我们应做的思考
最后一个部分算是笔者本人的一些思考,自从 ChatGPT 大火以后,出现了一些趁机蹭热度的,也有一些贩卖焦虑的,种种吧。。。我只是站在一个平凡人的角度说出自己对于这个事情的认识,不局限在这个事件本身。如果各位小伙伴想和我继续交流,可以从 CSDN 加入我的粉丝群或在评论区留言。
1. 为什么会大火
为什么 ChatGPT 会大火?这不是偶然的,正如前文中提到的,OpenAI 平台在此前就一直在进行模型训练和优化,也在不断的推出各种功能模块,但是为什么没有像现在这么火呢?我们用 3D 打印技术 来做一个例子:3D 打印被人们熟知是近 10 年内的事情,但是早在 1986 年,第一台商用 3D 打印机就已经问世,1993 年获得技术专利。这里我们抛开技术不成熟等因素,一个主要的原因是什么呢?就是应用面还不那么广泛,使用起来还不那么方便,使用成本也不像现在这么低。
大数据和人工智能等行业的积淀也不是靠最近几年完成的,而都是能够追溯到几十年前,包括很多经典的数据挖掘算法与数学模型依然被广泛使用,这里变化 最大 的是什么呢?就是 应用面 与使用成本,同时与之相关的各个学科也都在向前发展。此前 OpenAI 存在很多功能也能让人感觉到惊艳,但是只是体验一下罢了。ChatGPT 目前可以说是以一个十分亲民的姿势出现,不但免费体验,而且确实能够帮助很多人解决问题,不仅仅是好玩这么简单。从 ChatGPT 和浏览器的整合就可以看出,以后也许真的会成为人们日常生活的一部分。
2. 产生哪些影响
接下来我从自己的视角来简单谈一谈 ChatGPT 会带来的影响,也包括目前的一些局限性和未来的发展方向。首先被影响比较大的行业会涉及到 IT、运营、教育等等以知识积累为主的脑力劳动相关行业【个人粗浅认识】。目前 ChatGPT 可以进行基本的内容创作,成本为每个月 20 美元,这要比雇佣一个人的成本低的多。当然,现在就这样比较显然还不太合适,因为它还不能代替一个人来完成独立工作。 但是,它完全可以帮我们完成很多素材收集、基本内容创作等等方面的工作,可以大幅提升效率,这也就意味着可能我们不需要那么多人就可以完成原有的既定工作。如果 ChatGPT 长期作为一种稳定服务,甚至不断优化的服务长期存在,这种趋势就会越来越明显。不过好在目前它的局限性还有很多,比如:
-
创造的内容重复性依然较高
-
只能接受文本内容作为输入【不支持识别图像,音视频信息,不过语音操作对接已经能够实现】
-
对于复杂问题给出的解决方案偏基础且可操作性不高
差不多相当于能干一些初级性的工作,不需要过度神化,使用得当能大幅提升工作效率,这一点是肯定的。
3. 采取哪些行动
当一项新生事物产生的时候,我们要如何应对呢?其实很多时候,并不是由这件事本身决定的,而是由我们自己的长期思维所决定的。比如,当遇到一个与你可能相关的,大火的技术出现的时候,你的态度是什么?是积极尝试?是暂且观望?还是首先想着要怎么黑一下,还是说尽量回避,这本身就是一个很值得思考的问题。这里不想过多的展开了,之前写过一篇自己的经历,里面阐述了自己的人生目标是如何从 数学老师 一步一步变更到 开发工程师 – 培训讲师 – 大数据 / 人工智能 的,感兴趣的小伙伴可以去看一下:三入职场 – 你可以从我身上学到这些(附毕业 Vlog)。这里并不是说每个人都应该做出相同的选择,毕竟每个行业都在不断变革,希望这样的思维方式能给大家带来一点启发。
最后用 《2040 年的未来预测》 书中的一段话来作为结语:为什么我们每次总是错过机会呢?每当一个新鲜的事物或者一个新的技术出现在人们面前的时候,人们首先表现出来的是一种反感和抵抗。【作者认为】所有排斥和反感这些新事物的人必将进入败者组,而那些能够快速接受这些新事物的人就将进入胜者组。当新事物普及了之后,人们就忘记了自己曾经反感过它,这也就意味着他们不知道自己进入了败者组的原因。
原文链接:https://www.bilibili.com/read/cv21791522/