—-OpenAI API 官方文档学习总结
OpenAI API 提供一系列机器学习模型,每种模型各具特点,可以处理涉及自然语言或代码相关的虚拟任务
与 NLP 服务不同(任务单一),它可以执行任何复杂的虚拟任务,如生成代码或文字内容、总结、扩展、转换、创造性撰文、风格转换等等..
1 | 功能速览
https://platform.openai.com/examples
2 | 基础概念
- Prompts:向模型 输入 的文字,如 Write a tagline for an ice cream shop
- Completions:模型 输出 的结果,如 We serve up smiles with every scoop
- Token:输入的文字会被分解为类似意群的一组组词缀,如汉堡包分解为
ham
bur
ger
, 梨就是pear
,大部分 Token 以空格开头,如hello
⚠ 注意:OpenAI 一次可以处理的 Token 数量 有限制,最多为 2048 个,约合为 1500 个单词
Token 是如何分解的?官方试验网址 https://platform.openai.com/tokenizer
- Model: 即机器学习模型,功能、价格各不相同,GPT-3 系列基础模型分别以 4 位名人命名:
- Temperature:温度,实际可理解为模型返回结果的准确性,0 为准确,在此设定上,对于相同问题模型会返回更加类似的结果 ,1 则相反, 对于相同问题模型会返回“差异较大”的结果
GPT-3 是什么?
Generative Pre-trained Transformer 3 (GPT-3) is an autoregressive language model released in 2020 that uses deep learning to produce human-like text.
ChatGPT 采用的是 " 调整润色 " 过的 GPT-3.5 系列模型,于 2022 年训练完毕,模拟人类语言进行对话式交互
3 | Python 简单使用示例
可以与 OpenAI 交互,发送输入并取得输出,使用前需要注册账户,并获取一个 token
安装:
pip install openai
使用示例:
import openai openai.api_key = os.getenv("OPENAI_API_KEY") response = openai.Completion.create( model="text-davinci-003", prompt="What r u doing now?", temperature=0.6, )
response = openai.Completion.create( model="text-davinci-003", prompt="Give some names like Jax", temperature=0.6, )
4 | 模型系列
https://platform.openai.com/docs/models/overview
系列 | Info |
---|---|
GPT-4 | 基于 GPT-3.5,一组可以理解与生成自然语言或代码的模型 |
GPT-3.5 | 基于 GPT-3,一组可以理解与生成自然语言或代码的模型 |
Codex | 一组可以理解与生成代码的模型,能将自然语言翻译为代码 |
Content filter | 一个可以识别检测文字中是否有敏感或不安全词汇的模型 |
GPT-4 系列
在 GPT-3.5 系列模型基础上改良的版本,目前最新的模型系列,还处于 Beta 阶段
处理普通任务与 GPT-3.5 区别不大,但处理复杂问题优于以往所有模型
GPT-3.5 系列
GPT-3 系列
- Ada 性能最好,适合简单任务,价格最便宜;
- Davinci 功能最强大;
- Curie 亦可完成一些 Davinci 的任务,而且处理速度更快且价格为 Davinci 的 1/10;
Codex 系列
已经 Deprecated 了,基于 GPT-3 模型开发的新模型,训练集数据包括自然语言,以及来自 Github 的几亿行开源代码,目前提供两种
Content filter 系列
目前处于 Beta 阶段,可将文字分为三类 safe
senstive
unsafe
,该模型存在判断错误的几率,官方更推荐使用 Moderation 系列 API 处理
未完待续 ….
原文链接:https://zhuanlan.zhihu.com/p/606095390