コンテンツにスキップ

サンプリング

概要

ごく少数のケースでは、Cloudflare ダッシュボードおよび GraphQL Analytics API で提供される分析は サンプル — データセットのサブセットに基づいています。これらのケースでは、Cloudflare Analytics はサンプリングされた値から導出された推定値を返します。たとえば、攻撃中にサンプリングレートが 10% で 5,000 イベントがサンプリングされたとします。Cloudflare は合計 50,000 イベント (5,000 × 10) を推定し、この値を Analytics に報告します。

サンプリングされたデータセット

Cloudflare GraphQL API は、適応型サンプリングによって駆動されるデータセットを公開しています。これらのノードは名前に Adaptive が含まれており、introspection を通じて発見できます。

サンプリングされたデータの存在は、Cloudflare ダッシュボードおよび API のデータセットの説明にも明記されています。

サンプリングが適用される理由

Analytics は、要求されたデータを適切な詳細レベルでできるだけ早く提供するように設計されています。サンプリングにより、Cloudflare はデータセットが急速かつ予測不可能にスケールする場合でも、数秒以内に分析を提供できます。たとえば、攻撃中に生成されるファイアウォールイベントのバーストなどです。そして、基礎データのボリュームが大きいため、サンプルから推定された値は統計的に有意であるべきです。つまり、高い信頼度でサンプリングされたデータを信頼できます。サンプリングがなければ、クエリに応答するのに数分以上かかる可能性があり、緩和策の検証を待つには長すぎる時間です。

サンプリングの種類

適応型サンプリング

Cloudflare はほぼ常に 適応型サンプリング を使用します。これは、サンプルレートが取り込まれるデータのボリュームやクエリに応じて変動することを意味します。レコードの数が比較的小さい場合、サンプリングは使用されません。しかし、レコードのボリュームが大きくなるにつれて、徐々に低いサンプリングレートが適用されます。セキュリティイベント(ファイアウォールイベントとも呼ばれる)およびセキュリティイベントログはこのモデルに従います。適応型サンプリングを使用するデータノードは、ノード名の Adaptive サフィックスで簡単に識別できます。たとえば、firewallEventsAdaptive のようにです。

固定サンプリング

以下のデータノードは固定サンプリングに基づいており、サンプリングレートは変動しません:

データセットレートノート
ファイアウォールルールプレビュー

ノード:
firewallRulePreviewGroups

1%注意して使用してください。1% のサンプリングレートは、特定の閾値未満のデータセットに対して正確な推定を提供しません。このシナリオは Cloudflare ダッシュボードで明示的に指摘されていますが、API ではそうではありません。
ネットワーク分析

ノード:
ipFlows1mGroups
ipFlows1hGroups
ipFlows1dGroups
ipFlows1mAttacksGroups

0.012%サンプリングレートはパケット数(8,192 パケットごとに 1 パケット)で表されます。

生データへのアクセス

サンプリングは主に適応型であり、正確な推定を提供するために自動的に調整されるため、サンプリングレートを直接制御することはできません。エンタープライズ顧客は Cloudflare Logs を通じて生データにアクセスできます。