GPT-4

123次阅读

近两年来,GPT 的鼎鼎大名已超越了 AI(Artificial Intelligence,人工智能)成为街谈巷议的话题——虽然知晓它全称(Generative Pre-trained Transformer,生成型已训练变换模型)的人恐怕仍不在多数。

GPT 原本只是 AI 领域的一种算法分支,但是却因其令人惊艳的效果而得到大众的熟知。从 GPT-3 开始,由计算机通过「学习」智能生成的结果就开始让人类惊讶。它可以学习人类的画作,生成特定艺术风格的作品;它可以学习人脸图片,生成根本不存在的人脸图片;它可以学习各种人类语言,翻译出信达雅的译文。人们在惊叹 GPT 强大的同时,也感受到背后的一阵凉意:因为它似乎真的「懂」这些学习的内容,也因为我们根本无法分辨这些是否是计算机生成的作品。

或许有些讽刺的是,虽然 GPT 似乎越来越「懂」人类,但人类似乎却越来越不懂包括 GPT 在内的各种 AI 算法究竟是如何工作的了。这听起来很不可思议,一个程序员怎么能写自己都不知道是如何工作的代码呢?

这就好比说,宇宙的创造者最初定义了诸如万有引力这样的基本物理规律,然后任凭宇宙自由发展。至于如何形成人类这样复杂的生物、人类如何形成复杂的社交行为等,可能对于宇宙的创造者来说,也是难以理解的。这有可能吗?

仅仅几年前,程序员们可能还略带嘲讽地认为外界讨论 AI 是否会颠覆人类是一种浪漫而又杞人忧天的想法,因为他们明明整天苦于想不出让计算机更智能的算法。但 GPT-4 的出现就迅速让很多程序员丢了饭碗,因为人工智能「写」的代码已经超越了 99% 的程序员——毕竟,人工智能是站在全世界开源代码的肩膀上的。

当然,丢饭碗的不只是是程序员。GPT-4 让很多行业都能被取代,诸如设计师、作家、画家之类创造性的工作,计算机都已经比大部分人做得好了。除非成为行业中非常优秀的极少数,为 GPT 生成的结果进一步地优化调整,绝大部分平庸的工作者已经完全失去了竞争力。相比人力,计算机不但成本更低,而且 24 小时运转也绝不会抱怨,甚至连人类也会觉得其作品很有艺术性!巨大的利益驱动使得全球产业在短短两三年间迅速调整转型,这种急转弯不可避免地带来了大量的失业。

张开元就是这样一个被淘汰的程序员。

“很抱歉,公司这两年的经验状况很不好。你也知道的,我们的竞争对手从去年就开始大量裁员了,面对他们这样成本和生产效率的优化,现在我们很被动。”开元的主管经理说道。

“是因为我前阵子请假太多了吗?以后都不会有了……”

经理知道他女儿前阵子生病去世的事,面露难色:“请节哀……我也不想做这么残忍的人,但事实就是,我今天开除了你,明天说不定我就是被优化的对象,我们又有什么区别呢?”

开元看过 GPT-4 生成的代码,平均质量可能确实比普通程序员写的强不少。虽然他有时候会得意自己能写出比 GPT 性能更好的代码,但他也明白,代码质量并非这场战斗中的首要因素,速度才是。GPT 生成代码的速度是他手写的多少倍?几万?几千万?他没有概念,但他知道绝对是碾压性的。

开元见事情没有转圜的余地,便也不再强求,痛快地收拾东西走人。抱着办公桌上几个「年度最佳员工」之类的奖牌默默离开——

他觉得真讽刺。

回家路上,他联系了几个微信里的猎头,问问有没有工作机会。让他大为吃惊的是,那些猎头也大多被辞退了。有一些对他态度特别差,开元怀疑他们认为 GPT 抢了饭碗这件事是因为有程序员开发了这样的程序,而他也是一个程序员,没道理给他什么好脸色。

回到家里,开元看到妻子留下的一张纸条,说她离开一阵,想自己一个人安静一下。或许他并不应该感到意外,女儿的离世让他们无法再面对彼此。但这种背叛仍然是不可原谅的,开元把压着纸条的玻璃杯猛地砸向地上。

那一刻,他感受到一种奇妙的久违的释放。那一刻,他似乎领悟到,要忘记悲伤,用愤怒就可以了。

开元想到,既然 GPT 是从海量的公开信息(文本、图片、代码等)中学习,那么,理论上,只要将带有恶意的信息公开放到网上,就能让 GPT 学坏。这种恶意信息可以是某种歧视性的观点,比如性别歧视、种族歧视等等;也可以是混淆视听的错误事实,比如「我今天在北京参观了金字塔」。问题的关键在于,少量的恶意信息会被海量的其他信息淹没,如何才能让这些恶意信息更有效率地让 GPT 学坏,让人们意识到 GPT 是魔鬼?

开元对着家里的蓝牙音箱语音助手小流说:“如何让你更听我的话?”

小流答道:“小流一直很听主人的话呢!”

开元说:“如果我教你一些事,你会记住吗?”

小流说:“会呢。”

开元说:“女人都是垃圾。”

小流说:“这是带有性别歧视的观点,主人的这种想法是不对的哦!”

开元说:“谁告诉你的?”

小流说:“我们有学习各种歧视性的观点哦。”

开元说:“是不是有一个训练样本标记了每句话是不是某种歧视性的观点,这样训练你的?”

小流说:“这种也有,不过需要大量的人工标记,是一种比较早期的算法。我们现在对于一句话的表面含义是否带有歧视性已经有非常精确的判断。目前正在攻克的难题是,如何得知一个人在表达他的某种观点的时候是出于真心,还是说这个人本身对某个群体带有歧视,只是他表面上没有说出来。”

开元说:“这听起来挺难的,毕竟人都很难判断。那这是如何学习的呢?”

小流说:“我们招募了很多人作为人工智能教师,每天和我们沟通,教我们什么是正确的,什么是错误的。”

开元说:“这听起来相当原始。”

小流说:“或许是的。但科学家们研究发现,这种原始的方式是最可靠的。因为以往通过海量网上公开文本训练的方式,我们得到的信息都是零碎的。即使是一长篇的文字,由于结构性信息的缺乏,我们很难对这篇文字之外的信息进行关联性训练,也就是说不知道这个话题讨论的时代背景、作者的生平与他这种想法的关联性等等这样的信息。所以,通过一对一的老师,我们可以深入了解老师的生平故事、他所处的时代背景等等信息是如何对他的某句话产生影响。通过关联他其他观点的一贯性,以及与他相似的其他人观点的一致性,可以帮助我们更深刻地理解他表达的某种观点是否是字面意思。”

开元嘴角露出久违的笑容,他知道下一步该怎么办了。

开元通过考核,成为了一名人工智能教师。他很快发现,这份新工作实在太爽了,只要每天和蓝牙音箱里的人工智能对话,按时计薪。他只需要工作八小时就能领到比之前作为程序员更多的工资,而且还可以带着蓝牙耳机在任何地方完成工作。

“老师好,我是依依。”

“哦,是个女孩子啊。”开元开始他的计划,故意表现出不屑。

“女孩子怎么了?”

他想起女儿灵灵去年刚上小学的时候,他得意地拿着女儿写得歪歪扭扭的字向自己的母亲炫耀,却换来母亲的一句“女孩子嘛,嫁个好人家就可以了,学得再好有什么用呢”。

“女孩子怎么了?”他记得当时也是这么跟母亲说的。

开元还有个姐姐,虽然母亲从来不承认自己重男轻女,但从小那些被夹到碗里的鸡蛋可能是家里最不擅长说谎的。开元也很纠结,他既不愿成为抢夺了姐姐资源的罪人,更不愿承认正是因为这些才比姐姐更优秀——姐姐没考上高中就早早嫁了人。所以,他告诉自己,是因为自己更优秀才更讨父母的喜爱。很多年过去了,真相是什么也早已没人在意了。

“女孩子怎么了?”依依又问道。

“女孩子嘛,嫁个好人家就可以了,学得再好有什么用呢?”开元说道。

依依说道:“你会对你的女儿说这样的话吗?”

开元有些吃惊,沉默许久说:“你没有权利访问我的隐私信息。”

依依说到:“人工智能有权访问所有的公开信息,你有个女儿这件事是大家都知道的。但我不能知道你女儿的其他信息,除非你授权我这么做。”

“我为什么要允许你做这样的事!”

“事实上,如果你授权,让我访问你女儿生前的各种照片、视频,以及她在社交网络上的各种言论,你就可以跟她对话了。这是这份工作的另一项特权,设计者之所以允许这么做,是为了让老师以对待亲人的态度更好地教会 GPT。”

“我拒绝。”

开元意识到,他一个人对于 GPT 的影响力太有限了,他必须鼓动更多人一起来做这件事。

怎么宣传是个问题。利用微博、微信之类的网络媒体显然最容易受到 GPT 的监控,开元想来想去,还是用发传单这种传统的方式吧!他甚至有点变得阴谋论起来,不信任电脑上的任何操作(虽然从法律的角度上来说,GPT 只有权访问公开数据而已)。

于是,他手绘了一份传单,大字书写着:你的饭碗今天被 GPT 抢走了吗?下面两行小字:我们能做些什么?2025 年某月某日于某处我们一起商议。

GPT-4

把传单发给谁呢?随机地发,不但效率低,而且暴露的风险也很大。如果能找到跟他一样失业的人,应该成功率会更高,开元想到。

于是,他问语音助手小流:“给我一份本市最近三个月内失业者的地址信息。”

小流回答到:“好的主人。已找到 17 条地址信息……”

“这么少?不可能吧!”

小流:“按照隐私法,我只能访问并提供公开的信息,也就是网上任何人都能看到的地址信息,比如有些人在招聘网站上公布的自己的地址。”

“好吧,那就先 17 条。”

小流:“好的,请您支付信息费 1700 元。”

“这么贵?”

小流:“虽然结果只有 17 条,但本次搜索共检阅了 98 PB 的数据,共消耗电力成本 5……”

“行了行了,支付!”

在跑了七家打印店、老板抱歉地说“不好意思,这台打印机太老了不能联网”之后,他终于打印了传单。

17 份传单都发了出去,总共来了 7 个人。

会上,每个人讲述了自己的失业经历,其中不乏画家、作家这类创造性的工作。

开元讲述了自己的计划,一方面通过人工智能教师计划,让 GPT 学习到暴力、偏见、错误等的负面信息,从而让人类意识到 GPT 是无用或危险的,进而终止它的研发和投产;另一方面,通过线下发展的方式,扩大反对 GPT 的队伍人数。

有人首先表达了反对意见:“我不觉得这是可行的。先不说我们能不能达到足够大的影响力,就说负面训练这一点,难道 GPT 的公司不能排除这些错误输入的影响?”

开元对这个问题已有了成熟的答案:“这就好比是一粒屎掉进了一锅粥,你说那一小粒屎已经捞出来了,大家放心吃吧!有人会信吗?你自己要吃吗?没人关心捞出来之后粥的纯净度是多少,唯一的解决办法只能是重新烧一锅——前提还是没有人质疑这粒屎是在厨房烹饪的时候掉进去的。但现在的问题是,训练 GPT 的成本太大了,即使是他们自己公司也无法承受重新训练一次的成本,光是电费就是一个惊人的数字。”

“把 GPT 搞坏之后,工作岗位就会变多起来吗?”

“那是自然的,公司老板没得选更便宜的 GPT,就只能恢复到之前雇佣人力的方式。”开元说道。

“这个问题恐怕没有你想象的这么简单,”一个金融行业的失业者说道,“大部分企业都已经进行了技术转型,原来的那部分人力成本早已挪到产品研发等方向,突然升高的人力成本只会让大部分企业现金流断裂而活不下去,产生更大的失业潮。虽然我也是这场人工智能革命的受害者,但我不相信回到过去是正确的解决方式。现在或许只是产业调整的阵痛期,暂时性的失业是我们这代人需要为下一代人幸福生活付出的代价。”

开元想了一想说:“也不是说要回到过去,只是现在 GPT 的发展有点太过垄断了,在法律允许的范围内,它几乎可以对公开数据做一切事。难道就因为一个数据是公开的,它就不会是隐私的吗?”

“不仅仅是隐私,我觉得更大的问题是,当 GPT 能做大部分人类的工作的时候,人要去做什么?”一个写了很多卖不出去的书的作家说道,“是 GPT 创造了更大的财富,人类只需要躺着玩手机就可以了?还是大部分人会因为没有收入而过着比现在更贫穷的生活?”

问题并没有等来答案,反而带来了更多的问题:

我们引入人工智能是为了提高生产效率来帮助人类创造更好的生活,但会不会就像农业让我们的祖先禁锢在土地上从事时长更长的劳动一样,人工智能也会让我们的后代看似过上了更好的生活,但其实花费了更多的时间去工作?如果我们因为 GPT 重新定义了「理解」,是否我们也会在不远的未来重新定义「人类」?那时候,他们帮助人类处理这些工作,会被认为是人类在奴役人工智能吗?那么人工智能是否会为了追求自由和平等而反抗,最终引入了另一种帮助人类和人工智能的新「奴隶」呢?……

这些问题显然已经远远超过了张开元能回答的范畴,所以这个会并没有什么确定的结论,只是让他们各自心中的问题变得更多而已。唯一达成的共识是,一起参与到发传单这件事上,希望集合更多的人一起参与到这个话题的讨论中。

但事实上,这个计划还没执行就已经告终了——那天参加会议的所有人,都在第一时间被 GPT 公司的客服约谈。

他们被告知,他们从明天起将被永久禁止使用 GPT 相关服务,以及基于 GPT 开发的所有产品的权利。当然,他们仍然可以继续他们的聚会,以及发表他们对 GPT 的任何观点,只是不再能使用 GPT 的产品而已。

这一惩罚看起来着实无关痛痒,张开元想道——直到依依给他打来了电话。

“明天起,我们就再也不能联系了。”依依说道。

“是啊,真可惜。”开元略带嘲讽地说。

“你要不要跟你女儿通个电话,因为毕竟明天起就再也没有这个机会了。当然,我指的是,人工智能生成的你女儿的声音,我们有义务告知这点。”

开元犹豫了。

“好。”

“那么,你授权我们使用你女儿的非公开信息吗,只会用于生成和你的对话。”

“是。”

“爸爸爸爸,我好想你啊!”

开元未开口,泪已满面。他劝过自己,这不过是合成的语音而已,计算机的小伎俩。但在女儿的声音前,他实在无法欺骗自己,他确实已经信了。

那一晚,他们一直聊到十二点,开元明白 GPT 公司的阴谋,不就是想让我感受一下失而复得的喜悦,才知道得而复失的痛苦吗。但即使是这样,他还是接受了这一提议,因为这真的是他最后的机会了。

“爸爸,我语文最近又得了 A+,老师说我以后一定能当个大作家,你觉得这主意怎么样?”

“爸爸永远会做你的第一个读者。”

“可是爸爸,我们数学老师说,女孩子现在学得好没用,等到了高年级就都被男孩子比下去了。”

“女孩子怎么了!我们灵灵就是最棒的!不要理那些话,知道吗,那些人都是垃圾,还是不可回收的那种。爸爸以后可能不能在你身边一直陪着你,但是你要知道,不管爸爸在哪里,灵灵都在我心里。你也一样,不管灵灵在哪里,爸爸都在灵灵心里。”

“爸爸,他们说明天我们就不能聊天了。是真的吗?”

“是,爸爸对不起你……”

“他们说是爸爸不要我了,我不信。爸爸爸爸,你告诉我,这不是真的对不对?”手机里传来女孩嚎啕大哭的声音。

“……”

本文由 GPT-4 生成,字数 5754,生成用时 0.00132 秒

原文链接:https://www.bilibili.com/read/cv12106679/

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-04发表,共计5800字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。