Rate Limiting
Лимиты запросов к API и стратегии обработки ограничений
Обзор
Все запросы к Premiss Cloud API ограничены по частоте (rate limiting). Лимиты зависят от вашего тарифного плана и измеряются в запросах в минуту (RPM).
Используется алгоритм Sliding Window — лимит считается за скользящее окно в 60 секунд, а не за фиксированный интервал.
Лимиты по тарифам
| Тариф | RPM (запросов в минуту) |
|---|---|
| Start | 10 |
| Pro | 50 |
| Business | 100 |
Тариф определяется суммой пополнения баланса и действует 1 год. Текущий тариф и использование отображаются в Dashboard.
Заголовки ответа
Каждый ответ API содержит заголовки с информацией о лимитах:
При превышении лимита дополнительно возвращается:
Обработка ошибки 429
При превышении лимита API возвращает HTTP 429 Too Many Requests:
Рекомендуемая стратегия повтора
Используйте exponential backoff с учётом заголовка Retry-After:
Рекомендации
- Отслеживайте заголовки
X-RateLimit-Remaining— снижайте частоту запросов заблаговременно, не дожидаясь 429 - Используйте batch API —
POST /api/v1/tasks/batchпозволяет создать до 30 задач одним запросом (считается как 1 запрос к rate limiter) - Используйте webhooks — вместо polling статуса задачи, чтобы не тратить запросы на опрос
- Используйте SSE —
GET /api/v1/tasks/{taskId}/eventsдля отслеживания статуса в реальном времени (1 запрос вместо множества polling-запросов)
Rate limiting применяется ко всем эндпоинтам /api/v1/* — не только к созданию задач, но и к запросам статуса, списку задач и другим операциям.