Лимиты запросов Клод нейросеть — Rate Limits Claude API
ClaudeStore: обработка 429, Retry-After, защитные лимиты gateway и рекомендации по высокой нагрузке.
Как это работает
| Область | Что ограничивается |
|---|---|
| На один API-ключ | Ключ может быть ограничен независимо от других ключей. |
| Параллелизм по ключу | Слишком много одновременных длинных запросов может привести к 429. |
| Глобальная защита gateway | Gateway может ограничивать создание новых запросов под нагрузкой. |
| Тяжёлые вложения | Крупные multimodal-запросы могут ограничиваться строже, чем обычный текст. |
Мы не публикуем стабильную числовую таблицу RPM/TPM как жёсткий контракт. Если вам нужен высокий постоянный throughput — напишите в поддержку с описанием вашего паттерна нагрузки.
Заголовки ответа
При срабатывании лимита ориентируйтесь на документированный публичный заголовок:
retry-after— секунд до следующего запроса (при 429)
Не закладывайтесь на недокументированные rate-limit headers как на стабильный внешний контракт.
Стратегии оптимизации
- Очередь и контроль параллелизма — не запускайте слишком много одновременных запросов
- Кэширование — не повторяйте одинаковые запросы без необходимости
- Экспоненциальная задержка — при 429 увеличивайте паузу
- Осторожность с multimodal — длинные стримы и крупные вложения требуют более консервативного ретрая
- Поддержка — для повышения лимита напишите нам в Telegram