Лимиты запросов Клод нейросеть — Rate Limits Claude API

ClaudeStore: обработка 429, Retry-After, защитные лимиты gateway и рекомендации по высокой нагрузке.

Как это работает

ОбластьЧто ограничивается
На один API-ключКлюч может быть ограничен независимо от других ключей.
Параллелизм по ключуСлишком много одновременных длинных запросов может привести к 429.
Глобальная защита gatewayGateway может ограничивать создание новых запросов под нагрузкой.
Тяжёлые вложенияКрупные multimodal-запросы могут ограничиваться строже, чем обычный текст.

Мы не публикуем стабильную числовую таблицу RPM/TPM как жёсткий контракт. Если вам нужен высокий постоянный throughput — напишите в поддержку с описанием вашего паттерна нагрузки.

Заголовки ответа

При срабатывании лимита ориентируйтесь на документированный публичный заголовок:

  • retry-after — секунд до следующего запроса (при 429)

Не закладывайтесь на недокументированные rate-limit headers как на стабильный внешний контракт.

Стратегии оптимизации

  • Очередь и контроль параллелизма — не запускайте слишком много одновременных запросов
  • Кэширование — не повторяйте одинаковые запросы без необходимости
  • Экспоненциальная задержка — при 429 увеличивайте паузу
  • Осторожность с multimodal — длинные стримы и крупные вложения требуют более консервативного ретрая
  • Поддержка — для повышения лимита напишите нам в Telegram

Готовы начать?

Получите доступ к API всех моделей Claude за 2 минуты.

Смотреть тарифы