コンテンツにスキップ

概要

AIアプリケーションを観察し、制御します。

Available on all plans

CloudflareのAI Gatewayを使用すると、AIアプリの可視性と制御を得ることができます。アプリをAI Gatewayに接続することで、分析やログを通じてアプリケーションの使用状況に関する洞察を収集し、キャッシング、レート制限、リクエストの再試行、モデルのフォールバックなどの機能を使用してアプリケーションのスケーリングを制御できます。さらに、始めるのに必要なのは1行のコードだけです。

始めるガイドをチェックして、AI Gatewayでアプリケーションを構成する方法を学びましょう。

機能

分析

リクエスト数、トークン、アプリケーションの実行にかかるコストなどのメトリクスを表示します。

リアルタイムログ

リクエストとエラーに関する洞察を得ます。

キャッシング

元のモデルプロバイダーではなく、Cloudflareのキャッシュから直接リクエストを提供し、リクエストを迅速化し、コストを削減します。

レート制限

アプリケーションが受け取るリクエストの数を制限することで、アプリケーションのスケーリングを制御します。

リクエストの再試行とフォールバック

エラーが発生した場合にリクエストの再試行とモデルのフォールバックを定義することで、レジリエンスを向上させます。

お気に入りのプロバイダー

Workers AI、OpenAI、Azure OpenAI、HuggingFace、ReplicateなどがAI Gatewayと連携しています。


関連製品

Workers AI

サーバーレスGPUを活用した機械学習モデルをCloudflareのグローバルネットワーク上で実行します。

Vectorize

CloudflareのベクターデータベースであるVectorizeを使用して、フルスタックのAIアプリケーションを構築します。Vectorizeを追加することで、セマンティック検索、推奨、異常検出などのタスクを実行したり、LLMにコンテキストとメモリを提供したりできます。

さらなるリソース

開発者Discord

質問をしたり、構築しているものを見せたり、他の開発者とプラットフォームについて議論したりするために、DiscordでWorkersコミュニティとつながります。

ユースケース

Cloudflareのグローバルネットワークに野心的なAIアプリケーションを構築し、展開する方法を学びます。

@CloudflareDev

Twitterで@CloudflareDevをフォローして、製品の発表やCloudflare Workersの新機能について学びます。