计价
Model API 的计价方式由模型类型和调用规格决定。多模态模型通常按输入规格、输出规格或生成单位计费,部分图像模型和大语言模型也可能按 token 计费,具体规则以模型详情页展示为准。
LLM 计价口径
Section titled “LLM 计价口径”大语言模型通常按 token 计费,基础价格项包括输入价格和输出价格。部分模型还会提供缓存读写价格,用于区分缓存命中读取和缓存写入产生的费用。
同一模型也可能按上下文长度划分输入或输出价格,或按缓存时长划分缓存写入价格,例如短上下文和长上下文价格不同,5 分钟缓存和 1 小时缓存价格不同。
| 价格项 | 计费单位 | 影响因素 |
|---|---|---|
| 输入价格 | token | 输入 token 数、上下文长度 |
| 输出价格 | token | 输出 token 数、上下文长度 |
| 缓存读取价格 | token | 缓存命中 token 数、上下文长度 |
| 缓存写入价格 | token | 写入 token 数、缓存时长 |
多模态模型计价口径
Section titled “多模态模型计价口径”多模态模型的计价口径并不固定为单一参数。图片模型通常以单张图像为计费单位,价格可能随分辨率、生成模式、输出数量等规格变化;视频模型通常按秒计费,也可能按单个视频计费,价格可能随时长、分辨率、生成模式和是否同时生成音频变化。
部分 Google 或 GPT 系列图像模型会采用 token 计价,例如 Nano Banana、GPT Image 2,这类模型通常会将文本输入、图像输入和图像输出拆分为不同价格项。
| 模型类型 | 计费单位 | 影响因素 |
|---|---|---|
| 图片模型 | 单张图像 | 分辨率、模式、输出数量 |
| 视频模型 | 秒或单个视频 | 分辨率、模式、时长、是否包含音频 |
| 音频模型 | 秒、字符数或单次调用 | 输入长度、输出时长、音色或模式 |
| 3D 模型 | 单次调用 | 输出格式、质量档位、生成模式 |
| 特殊图像模型 | token | 文本输入、图像输入、文本输出、图像输出 |