制限
Workers AIは一般提供が開始されました。これに伴い、レート制限を更新しました。
Wranglerを使用したローカルモードでのモデル推論も、これらの制限にカウントされることに注意してください。ベータモデルは、パフォーマンスとスケールの向上に取り組んでいる間、より低いレート制限が適用される場合があります。
レート制限はタスクタイプごとのデフォルトであり、モデルごとの制限は以下のように定義されています。
- 1分あたり720リクエスト
- 1分あたり3000リクエスト
- 1分あたり720リクエスト
- 1分あたり3000リクエスト
- 1分あたり1500リクエスト
- 1分あたり2000リクエスト
- 1分あたり3000リクエスト
- @cf/baai/bge-large-en-v1.5は1分あたり1500リクエスト
- 1分あたり300リクエスト
- @hf/thebloke/mistral-7b-instruct-v0.1-awqは1分あたり400リクエスト
- @cf/microsoft/phi-2は1分あたり720リクエスト
- @cf/qwen/qwen1.5-0.5b-chatは1分あたり1500リクエスト
- @cf/qwen/qwen1.5-1.8b-chatは1分あたり720リクエスト
- @cf/qwen/qwen1.5-14b-chat-awqは1分あたり150リクエスト
- @cf/tinyllama/tinyllama-1.1b-chat-v1.0は1分あたり720リクエスト
- 1分あたり720リクエスト
- @cf/runwayml/stable-diffusion-v1-5-img2imgは1分あたり1500リクエスト
- 1分あたり720リクエスト