一览表

OpenAI API由一套具有不同功能和价格点的多样化模型提供支持。您还可以通过微调为您的特定用例对我们的原始基础模型进行有限的定制。
模型 描述
GPT-4 一组改进GPT-3.5的模型,可以理解和生成自然语言或代码
GPT-3.5 一组改进GPT-3的模型,可以理解和生成自然语言或代码
DALL·E Beta 可以在自然语言提示时生成和编辑图像的模型
Whisper Beta 一个可以将音频转换为文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
Codex Limited Beta 一个微调的模型,可以检测文本是否敏感或不安全
GPT-3 一组可以理解和生成自然语言的模型
Deprecated 已弃用的型号的完整列表
我们还发布了开源模型,包括Point-EWhisperJukeboxCLIP 访问我们的研究人员模型索引,了解更多关于我们的研究论文中介绍了哪些模型,以及InstructGPT和GPT-3.5等模型系列之间的差异。

持续模型升级

随着gpt-3.5-turbo的发布,我们的一些型号现在正在不断更新。我们还提供静态模型版本,开发人员可以在引入更新模型后至少三个月继续使用。随着模型更新的新节奏,我们还让人们有能力进行评估,以帮助我们改进不同用例的模型。如果您有兴趣,请查看OpenAI Evals存储库。 以下模型是临时快照,一旦更新版本可用,我们将宣布其弃用日期。如果您想使用最新的型号版本,请使用标准型号名称,如gpt-4gpt-3.5-turbo
型号名称 终止日期 替换模型
gpt-3.5-turbo-0301 2023年9月13日 gpt-3.5-turbo-0613
gpt-4-0314 2023年9月13日 gpt-4-0613
gpt-4-32k-0314 2023年9月13日 gpt-4-32k-0613
在我们的弃用页面上了解有关模型弃用的更多信息。

GPT-4限量测试版

GPT-4目前处于有限的测试阶段,只有那些获得访问权限的人才能访问。请加入候补名单以获得访问权限。

GPT-4是一个大型多模态模型(今天接受文本输入和发射文本输出,未来将有图像输入),由于其更广泛的一般知识和先进的推理能力,它可以比我们之前的任何模型更准确地解决困难问题。像gpt-3.5-turbo,GPT-4针对聊天进行了优化,但使用Chat Completions API可以很好地完成传统完成任务。在我们的GPT指南中了解如何使用GPT-4。

2023年6月27日,gpt-4将从gpt-4-0314更新为gpt-4-0613,这是最新的模型迭代。

最新型号 描述 MAX代币 培训数据
gpt-4 比任何GPT-3.5模型都更有能力,能够执行更复杂的任务,并针对聊天进行了优化。将在发布2周后更新我们的最新模型迭代。 8,192个代币 到2021年9月
gpt-4-0613 从2023年6月13日起的gpt-4快照,带有函数调用数据。与gpt-4,该模型将不会收到更新,并将在新版本发布3个月后被弃用。 8,192个代币 到2021年9月
gpt-4-32k 与基本gpt-4模式功能相同,但上下文长度是4倍。将更新我们最新的模型迭代。 32,768个代币 到2021年9月
gpt-4-32k-0613 2023年6月13日的gpt-4-32快照。与gpt-4-32k,该模型将不会收到更新,并将在新版本发布3个月后被弃用。 32,768个代币 到2021年9月
对于许多基本任务,GPT-4和GPT-3.5模型之间的差异并不显著。然而,在更复杂的推理情况下,GPT-4比我们之前的任何模型都更有能力。

GPT-3.5

GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中最强大、最具成本效益的型号是gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的完成任务。

2023年6月27日,gpt-3.5-turbo将从gpt-3.5-turbo-0301更新为gpt-3.5-turbo-0613。

最新型号 描述 MAX代币 培训数据
gpt-3.5-turbo 最强大的GPT-3.5型号,并针对聊天进行了优化,成本为text-davinci-003的1/10。将在发布2周后更新我们的最新模型迭代。 4,096个代币 到2021年9月
gpt-3.5-turbo-16k 与标准gpt-3.5-turbo模型具有相同的功能,但具有4倍的上下文。 16,384个代币 到2021年9月
gpt-3.5-turbo-0613 2023年6月13日gpt-3.5-turbo的快照,带有函数调用数据。与gpt-3.5-turbo,该型号不会收到更新,并将在新版本发布3个月后被弃用。 4,096个代币 到2021年9月
gpt-3.5-turbo-16k-0613 2023年6月13日gpt-3.5-turbo-16k快照。与gpt-3.5-turbo-16k,该型号不会收到更新,并将在新版本发布3个月后被弃用。 16,384个代币 到2021年9月
text-davinci-003 与curie、babbage或ada模型相比,可以完成任何质量更好的语言任务,输出更长,并遵循一致的指令。还支持一些附加功能,如插入文本
4,097个代币 截止到2021年6月
text-davinci-002 text-davinci-003类似的功能,但经过监督微调而不是强化学习 4,097个代币 截止到2021年6月
code-davinci-002 针对代码完成任务进行了优化 8,001个代币 截止到2021年6月
我们建议使用gpt-3.5-turbo而不是其他GPT-3.5型号,因为它的成本更低,性能更好。

OpenAI模型是非确定性的,这意味着相同的输入可以产生不同的输出。将温度设置为0将使输出大部分确定性,但可能会保持少量的变异性。

DALL·E Beta

DALL·E是一个人工智能系统,可以从自然语言的描述中创建逼真的图像和艺术。我们目前支持在给定的给定的情况下创建具有一定尺寸的新图像、编辑现有图像或创建用户提供图像的变体的能力。 通过我们的API提供的当前DALL·E模型是DALL·E的第二次迭代,其图像比原始模型更逼真、更准确、分辨率更高4倍。您可以通过我们的实验室界面API进行尝试。

语音合成

TTS 是一种人工智能模型,可将文本转换为听起来自然的语音文本。我们提供两种不同的模型变量,tts-1针对实时文本到语音用例进行了优化,并tts-1-hd针对质量进行了优化。这些模型可以与音频 API 中的语音端点一起使用。

Whisper

Whisper是一种通用的语音识别模型。它是在多样化音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2大模型目前可以通过我们的API获得,其型号名称为whisper-1 目前,Whisper开源版本和通过我们的API提供的版本之间没有区别。然而,通过我们的API,我们提供了一个优化的推理过程,这使得通过我们的API运行Whisper比通过其他方式运行Whisper要快得多。有关Whisper的更多技术细节,您可以阅读论文

嵌入(Embedding)

嵌入是文本的数字表示,可用于测量两段文本之间的相关性。我们的第二代嵌入模型,text-embedding-ada-002旨在以一小部分成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、建议、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。

模型端点兼容性

Endpoint(指具体的某个API) 型号名称
/v1/chat/completions gpt-4,gpt-4-0613,gpt-4-32k,gpt-4-32k-0613,gpt-3.5-turbo,gpt-3.5-turbo-0613,gpt-3.5-turbo-16k,gpt-3.5-turbo-16k-0613
/v1/completions text-davinci-003,text-davinci-002,text-curie-001,text-babbage-001,text-ada-001
/v1/edits text-davinci-edit-001 text-davinci-edit-001,code-davinci-edit-001
/v1/audio/transcriptions whisper-1
/v1/audio/transcriptions whisper-1
/v1/fine-tunes davinci,curie,babbage,ada
/v1/embeddings text-embedding-ada-002,text-search-ada-doc-001
/v1/embeddings text-embedding-ada-002,text-search-ada-doc-001
此列表不包括我们的第一代嵌入模型,也不包括我们的DALL·E模型