Question 1

每个请求的成本怎么算？

Accepted Answer

每个请求按该模型公示费率的按量 token 账单行计价——输入/输出 Token 数乘以 /models 页公示的每 1M Token 单价。汇率与支付通道费用在结账时展示，与 token 账单行分开。

Question 2

可以按 API Key 限制消费吗？

Accepted Answer

可以。每把 Key 都可设独立的消费上限（maxSpend）、限流和每分钟 Token 上限（tokenLimitTpm）。某把 Key 触顶后只有它的请求会停，账号其余部分照常工作。

Question 3

在哪里看用量和成本？

Accepted Answer

Dashboard -> Logs 看每请求 Trace；Dashboard -> Usage 看按模型和 API Key 聚合的请求数、Token 与开销。请求完成即实时可见。

Question 4

余额用完会怎样？

Accepted Answer

API 调用返回 HTTP 402，直到充值或套餐额度生效。不存在静默超额——开销永远不会超过你的预付余额加套餐范围。

Question 5

计费需要存储我的 prompt 吗？

Accepted Answer

不需要。成本计量只用 Token 计数和元数据。prompt 与 completion 正文不会留存——Trace 记录的是模型、Token、成本、延迟和状态。

Question 6

Claude Code 和 Codex CLI 也能这样追踪吗？

Accepted Answer

能。CLI 编码工具走同一个网关，每个编码 agent 请求都有同样的成本 Trace，也计入同样的 Key 级预算，与应用流量一视同仁。

按请求、模型、Key 追踪每一分 LLM 成本

都追踪些什么