Router One

按请求、模型、Key 追踪每一分 LLM 成本

多数团队是在账单到达时才发现 LLM 开销——而失控循环、用力过猛的模型、泄露的 Key 早已造成损失。网关层的成本追踪改变了时机:经过 Router One 的每次调用都即时计量、按公示模型费率计价,并归因到发起它的 API Key。一个预付费钱包、25+ 个模型、一本真正对得上的账。

都追踪些什么

每请求一条成本 Trace

每次请求都记录模型、输入/输出 Token、按公示费率的成本、延迟、状态和处理线路——请求完成的那一刻就能在面板里看到。

按模型聚合

用量按模型随时间聚合,哪个模型族在烧钱、各工作负载成本几何、流量是否悄悄滑向昂贵模型,都一目了然。

按 Key 归因

给每个应用、环境或 agent 分配独立 API Key,开销自然归因清晰。不用再猜是哪个集成烧掉了预算——账本会指出具体哪把 Key。

Key 级消费上限

每把 Key 都可设独立的消费上限(maxSpend)、限流(rateLimit)和每分钟 Token 上限(tokenLimitTpm)。失控循环或泄露的 Key 只会撞上自己的上限,掏不空钱包。

预付费钱包账本

开销从预付费钱包扣减,按量 token 账单行使用各模型公示费率;汇率/通道费用在结账时单独可见,与 token 账单行分开。

余额归零即硬停

可用额度用尽时,调用返回 HTTP 402,不会累积意外欠费。用银行卡、微信、支付宝、Stripe 或 USDT/USDC 充值后立即恢复。

是账本,不是估算

直接调各家供应商,开销散落在各自节奏更新的面板里。网关把一本账放进请求路径:每次调用按公示费率计价、归因到 Key、实时聚合。成本工作从月底的法证式还原,变成工作负载运行中就能查询的实时数字——并且可以在账单变大之前用 Key 级上限直接干预。

把你的调用指向网关

流量经过网关的那一刻,成本追踪就开始工作。改 base URL,代码不动,此后每个请求都进账本。

terminal
# 此后的每个请求都会进入账本
export OPENAI_BASE_URL=https://api.router.one/v1
export OPENAI_API_KEY=sk-your-router-one-key

常见问题

每个请求的成本怎么算?

每个请求按该模型公示费率的按量 token 账单行计价——输入/输出 Token 数乘以 /models 页公示的每 1M Token 单价。汇率与支付通道费用在结账时展示,与 token 账单行分开。

可以按 API Key 限制消费吗?

可以。每把 Key 都可设独立的消费上限(maxSpend)、限流和每分钟 Token 上限(tokenLimitTpm)。某把 Key 触顶后只有它的请求会停,账号其余部分照常工作。

在哪里看用量和成本?

Dashboard -> Logs 看每请求 Trace;Dashboard -> Usage 看按模型和 API Key 聚合的请求数、Token 与开销。请求完成即实时可见。

余额用完会怎样?

API 调用返回 HTTP 402,直到充值或套餐额度生效。不存在静默超额——开销永远不会超过你的预付余额加套餐范围。

计费需要存储我的 prompt 吗?

不需要。成本计量只用 Token 计数和元数据。prompt 与 completion 正文不会留存——Trace 记录的是模型、Token、成本、延迟和状态。

Claude Code 和 Codex CLI 也能这样追踪吗?

能。CLI 编码工具走同一个网关,每个编码 agent 请求都有同样的成本 Trace,也计入同样的 Key 级预算,与应用流量一视同仁。

相关页面

每一次模型调用花了多少钱,当下就知道。

免费开始