首先,咱们来看看 GPT- 4 和 GPT-3.5-Turbo 之间最重大的差异,这些差异可能会从模型使用和 API 使用的角度影响 ChatGPT 的开发。然后我们会用几个 Python 示例来演示如何通过 Python 的 openai 库访问 GPT-4 API。
新的 GPT- 4 是 ChatGPT AI 模型家族的一员。在不久的将来,它很可能会被作为 ChatGPT Web Service 的默认模型。目前,它只对 ChatGPT Plus 的用户开放,以应对 OpenAI 现在面临的极端流量需求。ChatGPT Plus 的订阅费是每月 20 美元,可在美国和英国(现在除了国内几乎所有其他国家)使用。
最基本的区别:图像到文本
GPT- 4 不仅是一个语言模型,它也是一个视觉模型。
GPT- 4 非常擅长接受图像输入,并基于图像进行接近人类水平的对话。你可以向 GPT- 4 提供一张图像,然后问它一些问题,比如,这里有什么好笑的?有什么不同?你能描述这张图片吗?你能总结这张图片吗等等。
除了新的图像到文本功能,GPT- 4 还具有文本到文本的功能,而 ChatGPT 家族的 GPT-3.5-Turbo 只有文本到文本的功能。看看下面 gpt- 4 的使用案例。
ChatGPT 的模式
GPT-4 图像到文本 & 文本到文本
GPT-3.5-Turbo 只有文本到文本
定价:GPT- 4 的价格比 GPT-3.5-Turbo 高
GPT-4(默认的 4K 版本)每 1000 个令牌(提示)需要 0.03 美元,每 1000 个令牌(完成)需要 0.06 美元。
GPT-4 32K 版本每 1000 个令牌(提示)需要 0.06 美元,每 1000 个令牌(完成)需要 0.12 美元。
因为 gpt-3.5-turbo 每 1K 令牌的成本是 0.002 美元,新模型的价格显然更高,但它在处理复杂任务方面也显然更有能力。根据 OpenAI 到目前为止的商业模式,我们预计新的 GPT- 4 的 API 每令牌价格在接下来的几个月内或多或少会降低。
模型和 API:相同的 API 端点,不同的模型名称
GPT- 4 和 GPT-3.5-Turbo 将继续使用 ChatCompletion 端点。在为模型参数指定模型名称时,ChatGPT 开发人员可以选择如下:
对于 GPT-4 API 模型
模型 = gpt-4
模型 = gpt-4-32k
OpenAI 还提供了 2023 年 3 月 14 日的 8K 和 32K 版本的两个快照模型。这些快照模型只会支持 3 个月。如果你有特殊的理由想要使用 3 月 14 日的快照,你可以按照以下方式引用它们。
模型 = gpt-4-0314
模型 = gpt-4-32k-0314
对于 GPT-3.5-Turbo API 模型
模型 = gpt-3.5-turbo(默认选择)
模型 = gpt-3.5-turbo(指定精确的模型,目前只有一个模型,所以它是默认选择)
行为:GPT- 4 的行为比它的老大哥更理智、更自觉
GPT- 4 在社会安全指导方面带来了更多的改进。这些高能力的 AI 模型既可以极其有益,也可能带来极大的伤害。幸运的是,OpenAI 是一个意识到这个现实并正在努力改进模型行为安全预防措施的组织。
GPT- 4 对不允许的提示和敏感的提示的管理显著提高。(对于敏感提示的改进几乎提高了 2 倍,gpt3.5-turbo 为 42%,而 gpt- 4 为 24%,而对于不允许的提示,改进更是显著。)
提示大小:GPT- 4 可以处理明显更大的提示 / 查询。
gpt-3.5-turbo 能够接受最多 4096 个令牌作为输入。gpt- 4 显著增加了可以传递给模型的最大令牌数,并且可以处理两种不同的令牌大小,具体取决于模型的变体。
gpt-4: 8192 个令牌
gpt-4-32k: 32768 个令牌
这是对 GPT- 4 模型的重大改进。虽然在聊天应用中,4K 令牌(大约 3000 个单词)足以与 ChatGPT 模型进行交互。你可以参考我们解释 ChatGPT 的令牌计算与单词计数的这一部分。
32K 个令牌对应着大约 50 页,或者大约 25000 个单词。这意味着我们将能够提供书籍(分几部分),长篇文档,法律协议,完整的章节,课程,技术文档,开发者指南等等给新的模型 GPT-4。这在任务自动化方面是一个升级,并将启用一种新的自动化案例,这些案例的规模更大。此外,在编码应用中,这也使得给出一小段脚本和给出整个应用程序基础的差别变得明显。
总的来说,GPT- 4 不仅提高了已经令人印象深刻的 gpt-3.5-turbo 的准确性和智能程度,而且还允许高达 8 倍的最大提示大小。GPT- 4 提供了一个全新的特性,那就是它可以通过多种模式(如图像到文本和文本到文本)进行沟通,这是一种多模态的功能。
原文链接:https://baijiahao.baidu.com/s?id=1765750038535089245&wfr=spider&for=pc