跳转到主内容

模型 & 价格

下表所列模型价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。

模型细节

模型 deepseek-v4-flash (1) deepseek-v4-pro
BASE URL (OpenAI 格式) https://api.deepseek.com
BASE URL (Anthropic 格式) https://api.deepseek.com/anthropic
模型版本 DeepSeek-V4-Flash DeepSeek-V4-Pro
思考模式 支持非思考与思考模式(默认)
切换方式详见 思考模式
上下文长度 1M
输出长度 最大 384K

功能支持

功能 deepseek-v4-flash deepseek-v4-pro
Json Output 支持 支持
Tool Calls 支持 支持
对话前缀续写(Beta) 支持 支持
FIM 补全(Beta) 仅非思考模式支持 仅非思考模式支持

价格

计费项 deepseek-v4-flash deepseek-v4-pro
百万 tokens 输入(缓存命中) 0.02 元 0.025 元
百万 tokens 输入(缓存未命中) 1 元 3 元
百万 tokens 输出 2 元 6 元

并发限制 (2)

模型 并发限制
deepseek-v4-flash2500
deepseek-v4-pro500

(1) deepseek-chatdeepseek-reasoner 两个模型名将于北京时间 2026/07/24 23:59 弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。

(2) 更多并发限制细节,请参考 限速与隔离

扣费规则

扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。当充值余额与赠送余额同时存在时,优先扣减赠送余额。
  • 扣减费用 = token 消耗量 × 模型单价
  • 费用直接从充值余额或赠送余额中扣减
  • 充值余额与赠送余额同时存在时,优先扣减赠送余额
产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。