计价

Model API 的计价方式由模型类型和调用规格决定。多模态模型通常按输入规格、输出规格或生成单位计费，部分图像模型和大语言模型也可能按 token 计费，具体规则以模型详情页展示为准。

LLM 计价口径

大语言模型通常按 token 计费，基础价格项包括输入价格和输出价格。部分模型还会提供缓存读写价格，用于区分缓存命中读取和缓存写入产生的费用。

同一模型也可能按上下文长度划分输入或输出价格，或按缓存时长划分缓存写入价格，例如短上下文和长上下文价格不同，5 分钟缓存和 1 小时缓存价格不同。

多模态模型的计价口径并不固定为单一参数。图片模型通常以单张图像为计费单位，价格可能随分辨率、生成模式、输出数量等规格变化；视频模型通常按秒计费，也可能按单个视频计费，价格可能随时长、分辨率、生成模式和是否同时生成音频变化。

部分 Google 或 GPT 系列图像模型会采用 token 计价，例如 Nano Banana、GPT Image 2，这类模型通常会将文本输入、图像输入和图像输出拆分为不同价格项。