Rate Limits
İstek limitleri ve kotalar
API'nin adil kullanımını sağlamak için istek limitleri uygulanmaktadır.
Varsayılan Limitler
| Limit Türü | Değer |
|---|---|
| Dakikalık İstek | 60 istek/dakika |
| Günlük İstek | 10,000 istek/gün |
| Maksimum Token | Model bağımlı |
Rate Limit Header'ları
Her API yanıtında rate limit bilgileri header olarak döndürülür:
X-RateLimit-Limit: 60 X-RateLimit-Remaining: 45 X-RateLimit-Reset: 1706000060
Model Bazlı Token Limitleri
Partner proje ve müşteri API key'lerinde, her model için ayrı ayrı günlük/aylık token ve istek limitleri tanımlanabilir. Bu limitler partner panelindeki Kullanım Analizi modalinden ayarlanır.
| Limit Türü | Açıklama |
|---|---|
| Günlük Token | Belirli bir model için 24 saat içindeki toplam token kullanımı. Sıfırlanma: her gece 00:00. |
| Aylık Token | Belirli bir model için ay içindeki toplam token. Sıfırlanma: ayın 1'i 00:00. |
| Günlük İstek | Belirli bir model için 24 saat içindeki toplam istek sayısı. |
| Model Engelleme | Belirli bir modelin kullanımı tamamen engellenebilir. |
Model pattern örnekleri:
gpt-4o— tam eşleşme, sadece bu modelgoogle/*— wildcard, Google'ın tüm modelleri*— tümü (tüm modeller için genel limit)
Öncelik Sırası:
Tam eşleşme > wildcard > genel (*). Bir modele özel limit tanımlıysa, o kullanılır.
Limitleri Yönetme
İpuçları:
- 429 hatası aldığınızda exponential backoff uygulayın
- Batch işlemleri için istekleri zamana yayın
- Header'lardan kalan limiti takip edin
- Aynı hatayı çok fazla model için aldıysanız, bir model bazlı limit tanımlı olabilir — yoneticinize danışın