:::info 主要讲3点:
1、官方API计费讲解
2、本网站额度消耗计算方法
3、降低额度消耗的3种方法
:::
1、官方API计费讲解
例举2个模型(gpt-4o mini和gpt-4o)来进行讲解,以下截图来自官方。
可以看到第三列为“Pricing with Batch API”,即官方对API的定价。
以gpt-4o mini为例:
输入:$0.000075 / 1K input tokens
表示输入1000 token的价格为0.000075美元,大约0.0005人名币
即提问GPT时,333个汉字的价格大约为0.0005人名币
输出:$0.000300 / 1K output tokens
表示输出1000 token的价格为0.000300美元,大约0.002人名币
即GPT回答问题时,333个汉字的价格为0.002人名币
注意:
官方的计量单位为“token”,我们为了方便理解称为“额度”
一个汉字约等于3 token
为了更直观的体现模型价格的差距,进行如下对比
官方gpt-4o mini 和gpt-4o价格对比:
输入(token) | 输出(token) | |
---|---|---|
gpt-4o | $0.00125 / 1K | $0.00500 / 1K |
gpt-4o mini | $0.000075 / 1K | $0.000300 / 1K |
官方不同模型,输入输出的价格不同
:::info 我们网站为了方便统计
以gpt-4o mini为基准
gpt-4o 、 gpt-4 模型的消耗均为gpt-4o mini的10倍,
gpt-4 PLUS 模型的消耗均为gpt-4o mini的15倍,
gpt-o1 mini 为 gpt-4o mini 的20倍
可以简单理解为:
使用gpt-4o mini模型一个汉字消耗3额度,
用gpt-4o 模型一个汉字消耗30额度
:::
2、本网站额度消耗计算方法
例如在同一个对话框内使用 gpt-4o mini 进行以下对话:
第一次提问:你好! (例如消耗10额度)
第一次回复:你好!有什么我可以帮助你的吗? (例如消耗40额度)
第二次提问:你是?** ** (例如消耗10额度)
第二次回复:你好,我是GPT-4人工智能助手。 (例如消耗 40额度)
这4个对话看似应该消耗:10+40+10+40=100额度,实则不然!
第一个对话:
你好!
你好!有什么我可以帮助你的吗?
确实是消耗了10+40=50额度
而当进行第二个对话:
你是?** **
你好,我是GPT-4人工智能助手。
在发出提问“你是?”时,gpt会把第一次提问的“你好! ”和“你好!有什么我可以帮助你的吗? ”一起再返回给gpt
因此,第二个对话提问“你是?”时消耗了10+40+10=60额度
再加上第二个问题的回答,这4个对话一共消耗,10+40+10+40+10+40=150额度
可以看到模型后面有“消耗x1”、“消耗x10”等
上面的对话,如果是用gpt-4o mini 消耗 150额度,
如果换成 gpt-4o 模型则“消耗 x10”即:150x10=1500.
3、降低额度消耗的3种方法
以上面2个对话为例:
第一种,新建对话:
在提问完一个问题后新建一个对话再进行下一次提问
第二种,关闭上下文:
打开关闭上下文按钮,如下图,打开之后之前的对话将和新的提问没有关联
第三种,切换模型:
使用消耗最少的gpt-4o mini 模型
以gpt-4o mini为基准
gpt-4o 、 gpt-4 模型的消耗均为gpt-4o mini的10倍,
gpt-4 PLUS 模型的消耗均为gpt-4o mini的15倍,
gpt-o1 mini 为 gpt-4o mini 的20倍