ClaudeStore/文档
返回控制台

Claude API 速率限制 — 429、Retry-After 与吞吐建议

ClaudeStore 的 429 处理、Retry-After、保护性限流与高吞吐场景建议。

限流是如何工作的

范围说明
每个 API Key单个 Key 可能被独立限流
按 Key 并发过多同时进行的长请求可能触发 429
网关全局保护高负载时网关会主动保护稳定性
大附件 / 多模态这类请求可能比纯文本更严格

我们不公开固定的 RPM/TPM 数字表作为外部契约。如果你需要更高持续吞吐,请联系客服并说明你的负载模式。

HTTP 429 处理

当超过限额时,API 返回:

HTTP/1.1 429 Too Many Requests
retry-after: 8

{"error": {"type": "rate_limit_error", "message": "..."}}

客户端应解析 retry-after 头并等待对应秒数后重试。建议结合指数退避,并降低并发而不是盲目重试。

最佳实践

  • 使用 客户端排队(p-limit / bottleneck)控制并发
  • 启用 缓存 降低重复流量
  • 对长流式请求和多模态请求使用更保守的并发与重试策略
  • 不同项目 / 服务使用独立 Key,避免相互影响
  • 如需更高限额,联系客服开通
Cursor / Claude Code 往往会自动重试 429,但如果频繁触发,真正该做的是降低并发或联系支持,而不是堆更多重试。

准备好开始了吗?

2 分钟即可获得 Claude 全系列模型 API 接入。

查看价格