作者 | 董温淑
编辑 | 董雨晴
继二次元 AI 作画之后,又一款 AI 应用火遍全网,在朋友圈里“霸屏”了。
当地时间 11 月 30 日,美国人工智能(AI)研究机构 OpenAI 发布了聊天机器人 ChatGPT。许多人很快发现,不同于此前一些聊天机器人经常出现答非所问、言语混乱等问题,ChatGPT 生成的答案不仅逻辑流畅,还能联系上下文语境进行连贯问答。
一位使用者告诉市界:“它可以说是目前为止最聪明的聊天机器人,只有你问不到,没有它不会答。”
除了在网友中狠刷了一波存在感,ChatGPT 的亮眼表现还让 AI 股重获关注。12 月 5 日,国内智能人机交互企业汉王科技触及涨停板,有投资者表示:“AI 以后要比人厉害了,ChatGPT、数字经济给汉王带来了最大的风口。”
最会聊天的网红机器人
当你问 Siri“怎样应付老板?”时,Siri 只能百度这个问题,再把 3 条搜索结果“转达”给你。而 ChatGPT 则能给出更“真诚”的建议:“建议你与他(她)直接沟通并尝试解决问题。通常来说,与老板和谐相处的最好方法是要尊重他(她)。”
当你细化问题描述,比如“我是程序员,怎么应付老板?”ChatGPT 会针对职业给出更加详细的答案:“与老板相处的最重要的一点是要尊重他(她),并尽力为公司做出贡献。尽量按时完成任务,并确保自己的代码质量达到公司的标准。”
不仅如此,如果你继续追问“被老板发现了怎么办?”,ChatGPT 还会在这一语境中,给出补救方案:“首先,你应该向老板道歉,并诚恳地表示自己会改进……同时,你还需要确保以后不会再犯同样的错误。”
这样顺滑、智能的沟通体验,让许多使用者直呼惊喜,并开始用其“整花活”。
有网友发现除了简单的日常对话,ChatGPT 还可以回答特定学科的问题,比如“拉格朗日定理是什么?”“英语的虚拟语气该怎么用?”写段小说或代码对它来说也是手到擒来。有网友对此表示:“这样发展下去,程序员和写手都要失业了。”
国盛证券研报认为:“ChatGPT 在寻找答案、解决问题的效率上已经部分地超越了如今的搜索引擎,ChatGPT 或许在未来会改变我们获取信息、输出内容的方式。”
(图源:ChatGPT)
总结来说,ChatGPT 上知天文下知地理,堪称“最强懂哥”。这样强大的 AI 模型,是全球顶级 AI 实验室 OpenAI 的手笔。
微软旗下的 OpenAI 与谷歌旗下的 DeepMind、Meta(原 Facebook)旗下的 FAIR,被公认为全球 AI 领域最为领先的三大实验室。而本次凭借 ChatGPT 火出圈的 OpenAI 成立于 2015 年 12 月,最初为非营利性机构。
OpenAI 的创始人之一是有“硅谷钢铁侠”之称的马斯克(Elon Musk),不过马斯克已经在 2018 年 2 月宣布退出 OpenAI。
2019 年,OpenAI 宣布重组为一家“有限营利(capped-profit)企业”。具体而言,管理者们设置了一家非营利性的母公司 OpenAI Inc,在这家公司基础上成立一家营利性的子公司 OpenAI LP,并限制股东对 OpenAI LP 的投资回报上限。首批股东对 OpenAI LP 的投资回报被限制为不超过原始投资金额的 100 倍。也就是说,如果你投资 1000 万美元,你最多能得到 10 亿美元的回报。
正是在这一年,OpenAI 宣布其获得了微软的 10 亿美元投资。
微软对 OpenAI 慷慨注资,绝不仅仅是看中了未来的财务回报,“醉翁之意”是在于 OpenAI 的前沿技术积累。而这项技术,同样是网红应用 ChatGPT 实现的基石。
从 2018 年起,OpenAI 开始发布生成式预训练语言模型 GPT(Generative Pre-trained Transformer)。GPT 可用于生成文章、代码、机器翻译、问答等各类内容。接下来两年,OpenAI 基本保持着每年发布一款模型的频率,分别在 2019 年 2 月和 2020 年 5 月发布了 GPT- 2 和 GPT- 3 模型。每一代 GPT 模型的智能程度,相较于前一代都实现了极大提升。
2020 年 9 月,GPT- 3 发布不久,微软就宣布获得了 GPT- 3 的独家授权、有权访问后者的底层代码。
此后,OpenAI 似乎并不急于发布 GPT-4,而是对 GPT- 3 体现出的歧视偏见问题进行“修修补补”。比如在 2022 年初发布的 AI 模型 InstructGPT,相比 GPT- 3 能够生成更加友善的内容。
OpenAI 称,本次爆火的 ChatGPT 是 InstructGPT 的“兄弟版本”。因此,业界普遍将 InstructGPT 和 ChatGPT 视为 GPT-3.5 版本。相比 GPT-3,ChatGPT 的主要提升点在于记忆能力,可以储存对话信息,延续上下文。
“万能”生成器,从理想到现实
人工智能从业者谷雯告诉市界:“马斯克曾经说‘人工智能可能在 2025 年之前超越人类’,试用过 ChatGPT 之后,再联想到前段时间的 AI 作画,我觉得距离这一天的到来更近了。”
无论是 AI 作画还是聊天机器人 ChatGPT,都可以被归类为 AIGC(AI 生成内容)。实际上,内容生成模型已经有近 60 年的发展历史。
早在 1964 年,全球首个聊天机器人 ELIZA 就已诞生。ELIZA 的“人设”被设定为一个心理医生,可在心理治疗情境下,按照预先设定的模式组织语句,与真人进行对话。ELIZA 仅有 200 行代码,但已能“骗过”使用者,被许多人认为是在与真实对象对话。
从 ELIZA 到 ChatGPT,内容生成模型的智能程度无疑实现了代际的提升。在这背后,是数以亿计的数据和极大的算力消耗。
AI 模型所依赖的深度学习技术,实际上就是通过不断输入数据,来调整运行算法的模型参数,使输出的结果最接近自然、真实的情况。在互联网发展至今数据量累积、计算设备软硬件迭代的基础上,才让 ChatGPT 有了成为“懂哥”的条件。
据国盛证券研报,ChatGPT 有着多达 1750 亿个模型参数,OpenAI 主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5 在微软 Azure AI 超算基础设施(由英伟达 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约 3640PF-days(即每秒一千万亿次计算,运行 3640 个整日)。
而在未来商业领域,ChatGPT 及其类似的技术也有望发挥更大的价值。据浙商证券研报,ChatGPT 模型的出现对于文字模态的 AIGC 应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理 (NLP) 等。
目前,国内许多企业已针对 AIGC 技术进行布局,比如百度推出的 AI 作画产品“文心一格”,抖音上线的 AI 绘画特效,腾讯上线的“QQ 小世界 AI 画匠”活动等。
本次被 ChatGPT“带上”涨停板的汉王科技则是一家以手写识别、OCR(光学字符识别)为核心技术,开发模式识别相关电脑产品的公司,在智能交互领域有所布局。
无论是《银翼杀手》等科幻电影,还是《AI 新生:破解人机共存密码》等计算机专家的著作,都描述了在不远的未来,AI 将实现“去工具化”、像人一样拥有创造力。
不过,在这之前,AI 领域“模型越大、偏见越大”的问题还有待解决。如英特尔中国研究院院长宋继强曾提到的:“让机器‘像人’是很大的挑战。计算机现在最容易超越人的是计算和逻辑智能,但很难超越社交智能和认知智能。”
对于像 ChatGPT 这类用亿级数据训练出来的模型来说,怎样保证数据没有被有偏见、歧视的信息污染?怎样防止其被用于生成假新闻等有害信息?还是需要思考的难题。
举报 / 反馈
原文链接:https://baijiahao.baidu.com/s?id=1751464371347058778&wfr=spider&for=pc