レート制限
レート制限は、アプリケーションに到達するトラフィックを制御し、高額な請求や疑わしい活動を防ぎます。
レート制限は、特定の時間枠内に送信されるリクエストの数として定義できます。たとえば、アプリケーションを60秒間に100リクエストに制限することができます。
また、固定またはスライディングレート制限技術を選択することもできます。レート制限では、一定の時間枠内に特定の数のリクエストを許可します。たとえば、固定レートの場合、ウィンドウは時間に基づいているため、10分間のウィンドウ内にxリクエストを超えることはありません。スライディングレートの場合、過去10分間にxリクエストを超えることはありません。
これを説明するために、10分間に10リクエストの制限があり、12:00から始まるとしましょう。固定ウィンドウは12:00-12:10、12:10-12:20、などとなります。12:09に10リクエストを送信し、12:11に10リクエストを送信した場合、固定ウィンドウ戦略では20リクエストすべてが成功します。しかし、スライディングウィンドウ戦略では、過去10分間に10リクエストを超えているため、失敗します。
リクエストが許可されたレートを超えると、レート制限に遭遇します。これは、サーバーが429 Too Many Requestsステータスコードで応答し、リクエストが処理されないことを意味します。
ダッシュボードでデフォルトのレート制限設定を行うには:
- Cloudflareダッシュボード ↗にログインし、アカウントを選択します。
- AI > AI Gatewayに移動します。
- 設定に移動します。
- レート制限を有効にします。
- 必要に応じてレート、時間枠、レート制限方法を調整します。
APIを使用してデフォルトのレート制限設定を行うには:
- 次の権限を持つAPIトークンを作成します:
AI Gateway - ReadAI Gateway - Edit
このレート制限の動作は、そのゲートウェイに対するすべてのリクエストに均等に適用されます。