価格設定
Workers AIは、無料および有料のWorkersプランに含まれており、$0.011 / 1,000 Regular Twitch Neurons(Neuronsとも呼ばれます)で価格設定されています。
私たちの無料割り当てにより、誰でも非ベータモデルで1日あたり10,000 Neuronsを無料で使用できます。ベータモデルについては、ベータから卒業するまで無制限に使用できます。
非ベータモデルで1日あたり10,000 Neuronsを超えて使用するには、Workers Paidプランにサインアップする必要があります。Workers Paidでは、非ベータモデルの無料割り当てである1日あたり10,000 Neuronsを超える使用に対して、$0.011 / 1,000 Neuronsが請求されます。
Neuronの使用状況は、Cloudflare Workers AIダッシュボード ↗で監視できます。Neuronsとコストを見積もるには、価格計算機 ↗を使用してください。
| 無料 割り当て | 超過 価格 | |
|---|---|---|
| Workers Free | 1日あたり10,000 Neurons | N/A - Workers Paidにアップグレード |
| Workers Paid | 1日あたり10,000 Neurons | $0.011 / 1,000 Neurons |
すべての制限は、毎日00:00 UTCにリセットされます。上記のいずれかの制限を超えた場合、さらなる操作はエラーで失敗します。
Neuronsは、異なるモデル間でAI出力を測定する方法です。10,000 Neuronsで何ができるかを理解するために、次のことができます:100-200のLLM応答を生成する、500の翻訳を行う、500秒の音声からテキストへの音声を処理する、10,000のテキスト分類を行う、または使用するモデルに応じて1,500 - 15,000の埋め込みを生成することができます。私たちのサーバーレスモデルでは、GPUのレンタル、管理、スケーリングを心配することなく、使用した分だけ支払うことができます。
リクエストが消費するNeuronsの数を見積もるには、価格計算機 ↗を使用してください。

2024年4月1日以降、Cloudflareは以下のモデルに対して、1日あたり10,000 Neuronsを超えるすべての使用に対して$0.011/1,000 Neuronsを請求します:
- bge-small-en-v1.5
- bge-base-en-v1.5
- bge-large-en-v1.5
- distilbert-sst-2-int8
- llama-2-7b-chat-int8
- llama-2-7b-chat-fp16
- mistral-7b-instruct-v0.1
- m2m100-1.2b
- resnet-50
- whisper
Cloudflareは、今後もカタログ内の他のモデルに対するNeuron計算を追加し、ベータから卒業させる予定です。
Cloudflareは、Workers AIでの推論を測定し請求するためにNeuronsを使用します。これは、他のプロバイダーで見られる入力ベースの価格設定とは異なる場合があります。以下の表は、Workers AIでのNeuronsと使用の推定コストを、カタログ内のモデルで使用される入力と比較して理解し評価するのに役立ちます。
以下は情報提供のみを目的としています。 すべての換算は、2024年3月1日時点のCloudflareの公表料金に基づいており、税金やその他の手数料は含まれていません。
| モデル | 音声1分あたりの価格 |
|---|---|
whisper | $0.0022 |
| モデル | 画像1枚あたりの価格 |
|---|---|
Resnet-50 | $0.0000025 |
| モデル | 1M 入力トークンあたりの価格 |
|---|---|
distilbert-sst-2-int8 | $0.33 |
| モデル | 1M 入力トークンあたりの価格 |
|---|---|
bge-small-en-v1.5 | $0.003 |
bge-base-en-v1.5 | $0.014 |
bge-large-en-v1.5 | $0.022 |
2024年4月2日、mistral-7b-instructモデルの価格を17倍安く、llama-2-7b-chat-int8を7倍安く更新しました。以下の価格表は新しい価格を反映していますが、アーカイブされた価格を確認すると、価格がどのように変わったかを見ることができます。
| モデル | 1M 入力トークンあたりの価格 | 1M 出力トークンあたりの価格 |
|---|---|---|
llama-2-7b-chat-fp16 | $0.56 | $6.66 |
llama-2-7b-chat-int8 | $0.16 | $0.24 |
mistral-7b-instruct | $0.11 | $0.19 |
| モデル | 1M 入力トークンあたりの価格 | 1M 出力トークンあたりの価格 |
|---|---|---|
m2m100-1.2b | $0.13 | $0.70 |
すべてのユーザーは、1日あたり10,000 Neuronsの無料割り当てを受け取ります(合計で1ヶ月あたり300,000 Neurons)。
ユーザーが1日あたり50,000 Neuronsを使用する場合、月の毎日で、Workers AIの使用料金は$13.20になります。
(50k Neurons - 10k含まれる日次Neurons) * 30日 * $0.011 / 1k Neurons = $13.20
推論プラットフォームの最適化を見つけるにつれて、これらの最適化を顧客に提供します。以下のアーカイブされた価格を参照して、価格がどのように変わったかを確認できます。
2024年4月2日以前:
| モデル | 1M 入力トークンあたりの価格 | 1M 出力トークンあたりの価格 |
|---|---|---|
llama-2-7b-chat-int8 | $0.28 | $1.72 |
mistral-7b-instruct | $0.28 | $3.33 |