速率限制
说明如何为 APIMUX 客户端设计节流与重试策略。
默认要考虑限流
APIMUX 会执行速率和额度控制。接入方不应假设可以无限并发调用,而应该内建节流与重试逻辑。
推荐客户端行为
- 只在临时性失败时重试
- 使用带随机抖动的指数退避
- 避免多个 worker 共用一个 API Key 时形成重试风暴
- 尽量先做 capability 发现,再发正式请求,减少盲试
CLI 与 Agent 场景
当 CLI 被脚本或 Agent 调用时,应把 429 和上游临时性失败视为可恢复条件,但重试必须有上限;如果最终仍失败,要清晰暴露最终错误。
参考入口
当前协议面和认证方式请以 /settings/api-docs 中的生成式 API Reference 为准。
APIMUX