envoyproxy · wbpcode · Feb 10, 2025 · Oct 16, 2024 · Oct 16, 2024 · Oct 16, 2024
diff --git a/api/envoy/extensions/common/ratelimit/v3/ratelimit.proto b/api/envoy/extensions/common/ratelimit/v3/ratelimit.proto
@@ -101,8 +101,10 @@ message RateLimitDescriptor {
     // Descriptor key.
     string key = 1 [(validate.rules).string = {min_len: 1}];
 
-    // Descriptor value.
-    string value = 2 [(validate.rules).string = {min_len: 1}];
+    // Descriptor value. Blank value is treated as wildcard to create dynamic token buckets for each unique value.
+    // Blank Values as wild card is currently supported only with envoy server instance level HTTP local rate limiting
+    // and will not work if HTTP local rate limiting is enabled per connection level.
+    string value = 2 [(validate.rules).string = {min_len: 0}];
   }
 
   // Override rate limit to apply to this descriptor instead of the limit

diff --git a/api/envoy/extensions/filters/http/local_ratelimit/v3/local_rate_limit.proto b/api/envoy/extensions/filters/http/local_ratelimit/v3/local_rate_limit.proto
@@ -23,7 +23,7 @@ option (udpa.annotations.file_status).package_version_status = ACTIVE;
 // Local Rate limit :ref:`configuration overview <config_http_filters_local_rate_limit>`.
 // [#extension: envoy.filters.http.local_ratelimit]
 
-// [#next-free-field: 18]
+// [#next-free-field: 19]
 message LocalRateLimit {
   // The human readable prefix to use when emitting stats.
   string stat_prefix = 1 [(validate.rules).string = {min_len: 1}];
@@ -167,4 +167,13 @@ message LocalRateLimit {
   //   3. :ref:`disable_key <envoy_v3_api_field_config.route.v3.RateLimit.disable_key>`.
   //   4. :ref:`override limit <envoy_v3_api_field_config.route.v3.RateLimit.limit>`.
   repeated config.route.v3.RateLimit rate_limits = 17;
+
+  // Specifies the max dynamic descriptors kept in the cache for a particular wildcarded descriptor
+  // configured in the global :ref:`descriptors<envoy_v3_api_field_extensions.filters.http.local_ratelimit.v3.LocalRateLimit.descriptors>`.
+  // Wildcarded descriptor means descriptor has one or more entries `value` omitted. For example if user has configured two descriptors
+  // with blank value entries, then max dynamic descriptors stored in the LRU cache will be 2 * dynamic_descripters_lru_cache_limit.
+  // Actual number of dynamic descriptors will depend on the cardinality of unique values received from the http request for the omitted
+  // values.
+  // Default is 20.
+  uint32 dynamic_descripters_lru_cache_limit = 18;
 }
diff --git a/source/extensions/filters/common/local_ratelimit/local_ratelimit_impl.cc b/source/extensions/filters/common/local_ratelimit/local_ratelimit_impl.cc
@@ -2,6 +2,7 @@
 
 #include <chrono>
 #include <cmath>
+#include <memory>
 
 #include "envoy/runtime/runtime.h"
 
@@ -159,7 +160,8 @@ AtomicTokenBucket::AtomicTokenBucket(uint32_t max_tokens, uint32_t tokens_per_fi
                                      TimeSource& time_source)
     : token_bucket_(max_tokens, time_source,
                     // Calculate the fill rate in tokens per second.
-                    tokens_per_fill / std::chrono::duration<double>(fill_interval).count()) {}
+                    tokens_per_fill / std::chrono::duration<double>(fill_interval).count()),
+      fill_interval_(fill_interval) {}
 
 bool AtomicTokenBucket::consume(double factor) {
   ASSERT(!(factor <= 0.0 || factor > 1.0));
@@ -172,14 +174,16 @@ LocalRateLimiterImpl::LocalRateLimiterImpl(
     const uint32_t tokens_per_fill, Event::Dispatcher& dispatcher,
     const Protobuf::RepeatedPtrField<
         envoy::extensions::common::ratelimit::v3::LocalRateLimitDescriptor>& descriptors,
-    bool always_consume_default_token_bucket, ShareProviderSharedPtr shared_provider)
+    bool always_consume_default_token_bucket, ShareProviderSharedPtr shared_provider,
+    uint32_t lru_size, bool per_connection)
     : fill_timer_(fill_interval > std::chrono::milliseconds(0)
                       ? dispatcher.createTimer([this] { onFillTimer(); })
                       : nullptr),
       time_source_(dispatcher.timeSource()), share_provider_(std::move(shared_provider)),
       always_consume_default_token_bucket_(always_consume_default_token_bucket),
       no_timer_based_rate_limit_token_bucket_(Runtime::runtimeFeatureEnabled(
-          "envoy.reloadable_features.no_timer_based_rate_limit_token_bucket")) {
+          "envoy.reloadable_features.no_timer_based_rate_limit_token_bucket")),
+      dispatcher_(dispatcher) {
   if (fill_timer_ && fill_interval < std::chrono::milliseconds(50)) {
     throw EnvoyException("local rate limit token bucket fill timer must be >= 50ms");
   }
@@ -199,8 +203,16 @@ LocalRateLimiterImpl::LocalRateLimiterImpl(
 
   for (const auto& descriptor : descriptors) {
     RateLimit::LocalDescriptor new_descriptor;
+    bool wildcard_found = false;
     new_descriptor.entries_.reserve(descriptor.entries_size());
     for (const auto& entry : descriptor.entries()) {
+      if (entry.value().empty()) {
+        if (per_connection) {
+          throw EnvoyException(
+              "local rate descriptor value cannot be empty in per connection rate limit mode");
+        }
+        wildcard_found = true;
+      }
       new_descriptor.entries_.push_back({entry.key(), entry.value()});
     }
 
@@ -227,7 +239,13 @@ LocalRateLimiterImpl::LocalRateLimiterImpl(
           per_descriptor_max_tokens, per_descriptor_tokens_per_fill, per_descriptor_fill_interval,
           per_descriptor_multiplier, *this);
     }
-
+    if (wildcard_found) {
+      DynamicDescriptorSharedPtr dynamic_descriptor = std::make_shared<DynamicDescriptor>(
+          per_descriptor_token_bucket, (lru_size == 0 ? 20 : lru_size), dispatcher.timeSource(),
+          *this);
+      dynamic_descriptors_.addDescriptor(std::move(new_descriptor), std::move(dynamic_descriptor));
+      continue;
+    }
     auto result =
         descriptors_.emplace(std::move(new_descriptor), std::move(per_descriptor_token_bucket));
     if (!result.second) {
@@ -257,12 +275,13 @@ void LocalRateLimiterImpl::onFillTimer() {
   for (const auto& descriptor : descriptors_) {
     descriptor.second->onFillTimer(refill_counter_, share_factor);
   }
+  dynamic_descriptors_.onFillTimer(refill_counter_, share_factor);
 
   fill_timer_->enableTimer(default_token_bucket_->fillInterval());
 }
 
 LocalRateLimiterImpl::Result LocalRateLimiterImpl::requestAllowed(
-    absl::Span<const RateLimit::LocalDescriptor> request_descriptors) const {
+    absl::Span<const RateLimit::LocalDescriptor> request_descriptors) {
 
   // In most cases the request descriptors has only few elements. We use a inlined vector to
   // avoid heap allocation.
@@ -273,6 +292,11 @@ LocalRateLimiterImpl::Result LocalRateLimiterImpl::requestAllowed(
     auto iter = descriptors_.find(request_descriptor);
     if (iter != descriptors_.end()) {
       matched_descriptors.push_back(iter->second.get());
+    } else {
+      auto token_bucket = dynamic_descriptors_.getBucket(request_descriptor);
+      if (token_bucket != nullptr) {
+        matched_descriptors.push_back(token_bucket.get());
+      }
     }
   }
 
@@ -294,6 +318,10 @@ LocalRateLimiterImpl::Result LocalRateLimiterImpl::requestAllowed(
       // If the request is forbidden by a descriptor, return the result and the descriptor
       // token bucket.
       return {false, makeOptRefFromPtr<TokenBucketContext>(descriptor)};
+    } else {
+      ENVOY_LOG(trace,
+                "request allowed by descriptor with fill rate: {}, maxToken: {}, remainingToken {}",
+                descriptor->fillRate(), descriptor->maxTokens(), descriptor->remainingTokens());
     }
   }
 
@@ -316,6 +344,132 @@ LocalRateLimiterImpl::Result LocalRateLimiterImpl::requestAllowed(
   return {true, makeOptRefFromPtr<TokenBucketContext>(matched_descriptors[0])};
 }
 
+// Compare the request descriptor entries with the user descriptor entries. If all non-empty user
+// descriptor values match the request descriptor values, return true and fill the new descriptor
+bool DynamicDescriptorMap::compareDescriptorEntries(
+    const std::vector<RateLimit::DescriptorEntry>& request_entries,
+    const std::vector<RateLimit::DescriptorEntry>& user_entries,
+    std::vector<RateLimit::DescriptorEntry>& new_descriptor_entries) {
+  // Check for equality of sizes
+  if (request_entries.size() != user_entries.size()) {
+    return false;
+  }
+
+  bool has_empty_value = false;
+  for (size_t i = 0; i < request_entries.size(); ++i) {
+    // Check if the keys are equal
+    if (request_entries[i].key_ != user_entries[i].key_) {
+      return false;
+    }
+
+    // all non-blank user values must match the request values
+    if (!user_entries[i].value_.empty() && user_entries[i].value_ != request_entries[i].value_) {
+      return false;
+    }
+
+    // Check for empty value in user entries
+    if (user_entries[i].value_.empty()) {
+      has_empty_value = true;
+    }
+    new_descriptor_entries.push_back({request_entries[i].key_, request_entries[i].value_});
+  }
+  return has_empty_value;
+}
+
+void DynamicDescriptorMap::addDescriptor(const RateLimit::LocalDescriptor& user_descriptor,
+                                         DynamicDescriptorSharedPtr dynamic_descriptor) {
+  auto result = user_descriptors_.emplace(user_descriptor, std::move(dynamic_descriptor));
+  if (!result.second) {
+    throw EnvoyException(absl::StrCat("duplicate descriptor in the local rate descriptor: ",
+                                      result.first->first.toString()));
+  }
+}
+
+RateLimitTokenBucketSharedPtr
+DynamicDescriptorMap::getBucket(RateLimit::LocalDescriptor request_descriptor) {
+  for (const auto& pair : user_descriptors_) {
+    auto user_descriptor = pair.first;
+    if (user_descriptor.entries_.size() != request_descriptor.entries_.size()) {
+      continue;
+    }
+    RateLimit::LocalDescriptor new_descriptor;
+    bool wildcard_found = false;
+    new_descriptor.entries_.reserve(user_descriptor.entries_.size());
+    wildcard_found = compareDescriptorEntries(request_descriptor.entries_, user_descriptor.entries_,
+                                              new_descriptor.entries_);
+
+    if (!wildcard_found) {
+      continue;
+    }
+
+    // we found a user configured wildcard descriptor that matches the request descriptor.
+    return pair.second->addOrGetDescriptor(request_descriptor);
+  }
+  return nullptr;
+}
+
+void DynamicDescriptorMap::onFillTimer(uint64_t refill_counter, double factor) {
+  for (const auto& pair : user_descriptors_) {
+    pair.second->onFillTimer(refill_counter, factor);
+  }
+}
+
+DynamicDescriptor::DynamicDescriptor(RateLimitTokenBucketSharedPtr token_bucket, uint32_t lru_size,
+                                     TimeSource& time_source, LocalRateLimiterImpl& parent)
+    : parent_token_bucket_(token_bucket), lru_size_(lru_size), time_source_(time_source),
+      no_timer_based_rate_limit_token_bucket_(Runtime::runtimeFeatureEnabled(
+          "envoy.reloadable_features.no_timer_based_rate_limit_token_bucket")),
+      parent_(parent) {}
+
+RateLimitTokenBucketSharedPtr
+DynamicDescriptor::addOrGetDescriptor(const RateLimit::LocalDescriptor& request_descriptor) {
+  absl::WriterMutexLock lock(&dyn_desc_lock_);
+  auto iter = dynamic_descriptors_.find(request_descriptor);
+  if (iter != dynamic_descriptors_.end()) {
+    lru_list_.splice(lru_list_.begin(), lru_list_, iter->second.second);
+    return iter->second.first;
+  }
+  // add a new descriptor to the set along with its toekn bucket
+  RateLimitTokenBucketSharedPtr per_descriptor_token_bucket;
+  if (no_timer_based_rate_limit_token_bucket_) {
+    ENVOY_LOG(trace, "creating atomic token bucket for dynamic descriptor");
+    ENVOY_LOG(trace, "max_tokens: {}, fill_rate: {}, fill_interval: {}",
+              parent_token_bucket_->maxTokens(), parent_token_bucket_->fillRate(),
+              std::chrono::duration<double>(parent_token_bucket_->fillInterval()).count());
+    per_descriptor_token_bucket = std::make_shared<AtomicTokenBucket>(
+        parent_token_bucket_->maxTokens(),
+        uint32_t(parent_token_bucket_->fillRate() *
+                 std::chrono::duration<double>(parent_token_bucket_->fillInterval()).count()),
+        parent_token_bucket_->fillInterval(), time_source_);
+  } else {
+    per_descriptor_token_bucket = std::make_shared<TimerTokenBucket>(
+        parent_token_bucket_->maxTokens(),
+        uint32_t(parent_token_bucket_->fillRate() *
+                 std::chrono::duration<double>(parent_token_bucket_->fillInterval()).count()),
+        parent_token_bucket_->fillInterval(), parent_token_bucket_->multiplier(), parent_);
+  }
+
+  ENVOY_LOG(trace, "DynamicDescriptor::addorGetDescriptor: adding dynamic descriptor: {}",
+            request_descriptor.toString());
+  // add this bucket to cache.
+  // After updating cache, make a copy of the cache and update the tls with the new cache.
+  auto result = dynamic_descriptors_.emplace(
+      request_descriptor, std::pair(per_descriptor_token_bucket, lru_list_.begin()));
+  lru_list_.emplace_front(request_descriptor);
+  if (lru_list_.size() >= lru_size_) {
+    dynamic_descriptors_.erase(lru_list_.back());
+    lru_list_.pop_back();
+  }
+  return result.first->second.first;
+}
+
+void DynamicDescriptor::onFillTimer(uint64_t refill_counter, double factor) {
+  absl::WriterMutexLock lock(&dyn_desc_lock_);
+  for (auto& pair : dynamic_descriptors_) {
+    pair.second.first->onFillTimer(refill_counter, factor);
+  }
+}
+
 } // namespace LocalRateLimit
 } // namespace Common
 } // namespace Filters