質問をしたり、構築しているものを見せたり、他の開発者とプラットフォームについて議論したりするために、DiscordでWorkersコミュニティとつながります。
概要
AIアプリケーションを観察し、制御します。
CloudflareのAI Gatewayを使用すると、AIアプリの可視性と制御を得ることができます。アプリをAI Gatewayに接続することで、分析やログを通じてアプリケーションの使用状況に関する洞察を収集し、キャッシング、レート制限、リクエストの再試行、モデルのフォールバックなどの機能を使用してアプリケーションのスケーリングを制御できます。さらに、始めるのに必要なのは1行のコードだけです。
始めるガイドをチェックして、AI Gatewayでアプリケーションを構成する方法を学びましょう。
分析
リクエスト数、トークン、アプリケーションの実行にかかるコストなどのメトリクスを表示します。
リアルタイムログ
リクエストとエラーに関する洞察を得ます。
キャッシング
元のモデルプロバイダーではなく、Cloudflareのキャッシュから直接リクエストを提供し、リクエストを迅速化し、コストを削減します。
レート制限
アプリケーションが受け取るリクエストの数を制限することで、アプリケーションのスケーリングを制御します。
リクエストの再試行とフォールバック
エラーが発生した場合にリクエストの再試行とモデルのフォールバックを定義することで、レジリエンスを向上させます。
お気に入りのプロバイダー
Workers AI、OpenAI、Azure OpenAI、HuggingFace、ReplicateなどがAI Gatewayと連携しています。
サーバーレスGPUを活用した機械学習モデルをCloudflareのグローバルネットワーク上で実行します。
CloudflareのベクターデータベースであるVectorizeを使用して、フルスタックのAIアプリケーションを構築します。Vectorizeを追加することで、セマンティック検索、推奨、異常検出などのタスクを実行したり、LLMにコンテキストとメモリを提供したりできます。
Cloudflareのグローバルネットワークに野心的なAIアプリケーションを構築し、展開する方法を学びます。
Twitterで@CloudflareDevをフォローして、製品の発表やCloudflare Workersの新機能について学びます。