elastic · jpountz · Jan 22, 2018 · Dec 16, 2017 · Dec 19, 2017 · Dec 31, 2017
diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/avg/AvgAggregator.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/avg/AvgAggregator.java
@@ -44,6 +44,7 @@ public class AvgAggregator extends NumericMetricsAggregator.SingleValue {
 
     LongArray counts;
     DoubleArray sums;
+    DoubleArray compensations;
     DocValueFormat format;
 
     public AvgAggregator(String name, ValuesSource.Numeric valuesSource, DocValueFormat formatter, SearchContext context,
@@ -55,6 +56,7 @@ public AvgAggregator(String name, ValuesSource.Numeric valuesSource, DocValueFor
             final BigArrays bigArrays = context.bigArrays();
             counts = bigArrays.newLongArray(1, true);
             sums = bigArrays.newDoubleArray(1, true);
+            compensations = bigArrays.newDoubleArray(1, true);
         }
     }
 
@@ -76,15 +78,31 @@ public LeafBucketCollector getLeafCollector(LeafReaderContext ctx,
             public void collect(int doc, long bucket) throws IOException {
                 counts = bigArrays.grow(counts, bucket + 1);
                 sums = bigArrays.grow(sums, bucket + 1);
+                compensations = bigArrays.grow(compensations, bucket + 1);
 
                 if (values.advanceExact(doc)) {
                     final int valueCount = values.docValueCount();
                     counts.increment(bucket, valueCount);
-                    double sum = 0;
+                    // Compute the sum of double values with Kahan summation algorithm which is more
+                    // accurate than naive summation.
+                    double sum = sums.get(bucket);
+                    double compensation = compensations.get(bucket);
+
                     for (int i = 0; i < valueCount; i++) {
-                        sum += values.nextValue();
+                        double value = values.nextValue();
+                        if (Double.isNaN(value) || Double.isInfinite(value)) {
+                            sum += value;
+                            if (Double.isNaN(sum))
+                                break;
+                        } else if (Double.isFinite(sum)) {
+                            double corrected = value - compensation;
+                            double newSum = sum + corrected;
+                            compensation = (newSum - sum) - corrected;
+                            sum = newSum;
+                        }
                     }
-                    sums.increment(bucket, sum);
+                    sums.set(bucket, sum);
+                    compensations.set(bucket, compensation);
                 }
             }
         };
@@ -113,7 +131,7 @@ public InternalAggregation buildEmptyAggregation() {
 
     @Override
     public void doClose() {
-        Releasables.close(counts, sums);
+        Releasables.close(counts, sums, compensations);
     }
 
 }
diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/avg/InternalAvg.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/avg/InternalAvg.java
@@ -91,9 +91,22 @@ public String getWriteableName() {
     public InternalAvg doReduce(List<InternalAggregation> aggregations, ReduceContext reduceContext) {
         long count = 0;
         double sum = 0;
+        double compensation = 0;
+        // Compute the sum of double values with Kahan summation algorithm which is more
+        // accurate than naive summation.
         for (InternalAggregation aggregation : aggregations) {
-            count += ((InternalAvg) aggregation).count;
-            sum += ((InternalAvg) aggregation).sum;
+            InternalAvg avg = (InternalAvg) aggregation;
+            count += avg.count;
+            if (Double.isNaN(sum) == false) {
+                if (Double.isNaN(avg.sum) || Double.isInfinite(avg.sum)) {
+                    sum += avg.sum;
+                } else if (Double.isFinite(sum)) {
+                    double corrected = avg.sum - compensation;
+                    double newSum = sum + corrected;
+                    compensation = (newSum - sum) - corrected;
+                    sum = newSum;
+                }
+            }
         }
         return new InternalAvg(getName(), sum, count, format, pipelineAggregators(), getMetaData());
     }

diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/stats/InternalStats.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/stats/InternalStats.java
@@ -152,12 +152,25 @@ public InternalStats doReduce(List<InternalAggregation> aggregations, ReduceCont
         double min = Double.POSITIVE_INFINITY;
         double max = Double.NEGATIVE_INFINITY;
         double sum = 0;
+        double compensation = 0;
         for (InternalAggregation aggregation : aggregations) {
             InternalStats stats = (InternalStats) aggregation;
             count += stats.getCount();
             min = Math.min(min, stats.getMin());
             max = Math.max(max, stats.getMax());
-            sum += stats.getSum();
+            // Compute the sum of double values with Kahan summation algorithm which is more
+            // accurate than naive summation.
+            if (Double.isNaN(sum) == false) {
+                double value = stats.getSum();
+                if (Double.isNaN(value) || Double.isInfinite(value)) {
+                    sum += value;
+                } else if (Double.isFinite(sum)) {
+                    double corrected = value - compensation;
+                    double newSum = sum + corrected;
+                    compensation = (newSum - sum) - corrected;
+                    sum = newSum;
+                }
+            }
         }
         return new InternalStats(name, count, sum, min, max, format, pipelineAggregators(), getMetaData());
     }

diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/stats/StatsAggregator.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/stats/StatsAggregator.java
@@ -48,6 +48,8 @@ public class StatsAggregator extends NumericMetricsAggregator.MultiValue {
     DoubleArray mins;
     DoubleArray maxes;
 
+    private DoubleArray compensations;
+
 
     public StatsAggregator(String name, ValuesSource.Numeric valuesSource, DocValueFormat format,
             SearchContext context,
@@ -59,6 +61,7 @@ public StatsAggregator(String name, ValuesSource.Numeric valuesSource, DocValueF
             final BigArrays bigArrays = context.bigArrays();
             counts = bigArrays.newLongArray(1, true);
             sums = bigArrays.newDoubleArray(1, true);
+            compensations = bigArrays.newDoubleArray(1, true);
             mins = bigArrays.newDoubleArray(1, false);
             mins.fill(0, mins.size(), Double.POSITIVE_INFINITY);
             maxes = bigArrays.newDoubleArray(1, false);
@@ -88,6 +91,7 @@ public void collect(int doc, long bucket) throws IOException {
                     final long overSize = BigArrays.overSize(bucket + 1);
                     counts = bigArrays.resize(counts, overSize);
                     sums = bigArrays.resize(sums, overSize);
+                    compensations = bigArrays.resize(compensations, overSize);
                     mins = bigArrays.resize(mins, overSize);
                     maxes = bigArrays.resize(maxes, overSize);
                     mins.fill(from, overSize, Double.POSITIVE_INFINITY);
@@ -97,16 +101,30 @@ public void collect(int doc, long bucket) throws IOException {
                 if (values.advanceExact(doc)) {
                     final int valuesCount = values.docValueCount();
                     counts.increment(bucket, valuesCount);
-                    double sum = 0;
                     double min = mins.get(bucket);
                     double max = maxes.get(bucket);
+                    // Compute the sum of double values with Kahan summation algorithm which is more
+                    // accurate than naive summation.
+                    double sum = sums.get(bucket);
+                    double compensation = compensations.get(bucket);
+
                     for (int i = 0; i < valuesCount; i++) {
                         double value = values.nextValue();
-                        sum += value;
+                        if (Double.isNaN(sum) == false) {
+                            if (Double.isNaN(value) || Double.isInfinite(value)) {
+                                sum += value;
+                            } else if (Double.isFinite(sum)) {
+                                double corrected = value - compensation;
+                                double newSum = sum + corrected;
+                                compensation = (newSum - sum) - corrected;
+                                sum = newSum;
+                            }
+                        }
                         min = Math.min(min, value);
                         max = Math.max(max, value);
                     }
-                    sums.increment(bucket, sum);
+                    sums.set(bucket, sum);
+                    compensations.set(bucket, compensation);
                     mins.set(bucket, min);
                     maxes.set(bucket, max);
                 }
@@ -164,6 +182,6 @@ public InternalAggregation buildEmptyAggregation() {
 
     @Override
     public void doClose() {
-        Releasables.close(counts, maxes, mins, sums);
+        Releasables.close(counts, maxes, mins, sums, compensations);
     }
 }
diff --git a/...org/elasticsearch/search/aggregations/metrics/stats/extended/ExtendedStatsAggregator.java b/...org/elasticsearch/search/aggregations/metrics/stats/extended/ExtendedStatsAggregator.java
@@ -49,9 +49,11 @@ public class ExtendedStatsAggregator extends NumericMetricsAggregator.MultiValue
 
     LongArray counts;
     DoubleArray sums;
+    DoubleArray compensations;
     DoubleArray mins;
     DoubleArray maxes;
     DoubleArray sumOfSqrs;
+    DoubleArray compensationOfSqrs;
 
     public ExtendedStatsAggregator(String name, ValuesSource.Numeric valuesSource, DocValueFormat formatter,
             SearchContext context, Aggregator parent, double sigma, List<PipelineAggregator> pipelineAggregators,
@@ -65,11 +67,13 @@ public ExtendedStatsAggregator(String name, ValuesSource.Numeric valuesSource, D
             final BigArrays bigArrays = context.bigArrays();
             counts = bigArrays.newLongArray(1, true);
             sums = bigArrays.newDoubleArray(1, true);
+            compensations = bigArrays.newDoubleArray(1, true);
             mins = bigArrays.newDoubleArray(1, false);
             mins.fill(0, mins.size(), Double.POSITIVE_INFINITY);
             maxes = bigArrays.newDoubleArray(1, false);
             maxes.fill(0, maxes.size(), Double.NEGATIVE_INFINITY);
             sumOfSqrs = bigArrays.newDoubleArray(1, true);
+            compensationOfSqrs = bigArrays.newDoubleArray(1, true);
         }
     }
 
@@ -95,29 +99,52 @@ public void collect(int doc, long bucket) throws IOException {
                     final long overSize = BigArrays.overSize(bucket + 1);
                     counts = bigArrays.resize(counts, overSize);
                     sums = bigArrays.resize(sums, overSize);
+                    compensations = bigArrays.resize(compensations, overSize);
                     mins = bigArrays.resize(mins, overSize);
                     maxes = bigArrays.resize(maxes, overSize);
                     sumOfSqrs = bigArrays.resize(sumOfSqrs, overSize);
+                    compensationOfSqrs = bigArrays.resize(compensationOfSqrs, overSize);
                     mins.fill(from, overSize, Double.POSITIVE_INFINITY);
                     maxes.fill(from, overSize, Double.NEGATIVE_INFINITY);
                 }
 
                 if (values.advanceExact(doc)) {
                     final int valuesCount = values.docValueCount();
                     counts.increment(bucket, valuesCount);
-                    double sum = 0;
-                    double sumOfSqr = 0;
                     double min = mins.get(bucket);
                     double max = maxes.get(bucket);
+                    // Compute the sum and sum of squires for double values with Kahan summation algorithm
+                    // which is more accurate than naive summation.
+                    double sum = sums.get(bucket);
+                    double compensation = compensations.get(bucket);
+                    double sumOfSqr = sumOfSqrs.get(bucket);
+                    double compensationOfSqr = compensationOfSqrs.get(bucket);
                     for (int i = 0; i < valuesCount; i++) {
                         double value = values.nextValue();
-                        sum += value;
-                        sumOfSqr += value * value;
+                        if (Double.isNaN(value) || Double.isInfinite(value)) {
+                            sum += value;
+                            sumOfSqr += value * value;
+                        } else {
+                            if (Double.isFinite(sum)) {
+                                double corrected = value - compensation;
+                                double newSum = sum + corrected;
+                                compensation = (newSum - sum) - corrected;
+                                sum = newSum;
+                            }
+                            if (Double.isFinite(sumOfSqr)) {
+                                double correctedOfSqr = value * value - compensationOfSqr;
+                                double newSumOfSqr = sumOfSqr + correctedOfSqr;
+                                compensationOfSqr = (newSumOfSqr - sumOfSqr) - correctedOfSqr;
+                                sumOfSqr = newSumOfSqr;
+                            }
+                        }
                         min = Math.min(min, value);
                         max = Math.max(max, value);
                     }
-                    sums.increment(bucket, sum);
-                    sumOfSqrs.increment(bucket, sumOfSqr);
+                    sums.set(bucket, sum);
+                    compensations.set(bucket, compensation);
+                    sumOfSqrs.set(bucket, sumOfSqr);
+                    compensationOfSqrs.set(bucket, compensationOfSqr);
                     mins.set(bucket, min);
                     maxes.set(bucket, max);
                 }
@@ -196,6 +223,6 @@ public InternalAggregation buildEmptyAggregation() {
 
     @Override
     public void doClose() {
-        Releasables.close(counts, maxes, mins, sumOfSqrs, sums);
+        Releasables.close(counts, maxes, mins, sumOfSqrs, compensationOfSqrs, sums, compensations);
     }
 }
diff --git a/...a/org/elasticsearch/search/aggregations/metrics/stats/extended/InternalExtendedStats.java b/...a/org/elasticsearch/search/aggregations/metrics/stats/extended/InternalExtendedStats.java
@@ -142,12 +142,23 @@ public String getStdDeviationBoundAsString(Bounds bound) {
     @Override
     public InternalExtendedStats doReduce(List<InternalAggregation> aggregations, ReduceContext reduceContext) {
         double sumOfSqrs = 0;
+        double compensationOfSqrs = 0;
         for (InternalAggregation aggregation : aggregations) {
             InternalExtendedStats stats = (InternalExtendedStats) aggregation;
             if (stats.sigma != sigma) {
                 throw new IllegalStateException("Cannot reduce other stats aggregations that have a different sigma");
             }
-            sumOfSqrs += stats.getSumOfSquares();
+            if (Double.isNaN(sumOfSqrs) == false) {
+                double value = stats.getSumOfSquares();
+                if (Double.isNaN(value) || Double.isInfinite(value)) {
+                    sumOfSqrs += value;
+                } else if (Double.isFinite(sumOfSqrs)) {
+                    double correctedOfSqrs = value - compensationOfSqrs;
+                    double newSumOfSqrs = sumOfSqrs + correctedOfSqrs;
+                    compensationOfSqrs = (newSumOfSqrs - sumOfSqrs) - correctedOfSqrs;
+                    sumOfSqrs = newSumOfSqrs;
+                }
+            }
         }
         final InternalStats stats = super.doReduce(aggregations, reduceContext);
         return new InternalExtendedStats(name, stats.getCount(), stats.getSum(), stats.getMin(), stats.getMax(), sumOfSqrs, sigma,

diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/sum/InternalSum.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/sum/InternalSum.java
@@ -35,7 +35,7 @@ public class InternalSum extends InternalNumericMetricsAggregation.SingleValue i
     private final double sum;
 
     public InternalSum(String name, double sum, DocValueFormat formatter, List<PipelineAggregator> pipelineAggregators,
-            Map<String, Object> metaData) {
+                       Map<String, Object> metaData) {
         super(name, pipelineAggregators, metaData);
         this.sum = sum;
         this.format = formatter;
@@ -73,9 +73,22 @@ public double getValue() {
 
     @Override
     public InternalSum doReduce(List<InternalAggregation> aggregations, ReduceContext reduceContext) {
+        // Compute the sum of double values with Kahan summation algorithm which is more
+        // accurate than naive summation.
         double sum = 0;
+        double compensation = 0;
         for (InternalAggregation aggregation : aggregations) {
-            sum += ((InternalSum) aggregation).sum;
+            double value = ((InternalSum) aggregation).sum;
+            if (Double.isNaN(value) || Double.isInfinite(value)) {
+                sum += value;
+                if (Double.isNaN(sum))
+                    break;
+            } else if (Double.isFinite(sum)) {
+                double corrected = value - compensation;
+                double newSum = sum + corrected;
+                compensation = (newSum - sum) - corrected;
+                sum = newSum;
+            }
         }
         return new InternalSum(name, sum, format, pipelineAggregators(), getMetaData());
     }

diff --git a/core/src/main/java/org/elasticsearch/search/aggregations/metrics/sum/SumAggregator.java b/core/src/main/java/org/elasticsearch/search/aggregations/metrics/sum/SumAggregator.java
@@ -43,6 +43,7 @@ public class SumAggregator extends NumericMetricsAggregator.SingleValue {
     private final DocValueFormat format;
 
     private DoubleArray sums;
+    private DoubleArray compensations;
 
     SumAggregator(String name, ValuesSource.Numeric valuesSource, DocValueFormat formatter, SearchContext context,
             Aggregator parent, List<PipelineAggregator> pipelineAggregators, Map<String, Object> metaData) throws IOException {
@@ -51,6 +52,7 @@ public class SumAggregator extends NumericMetricsAggregator.SingleValue {
         this.format = formatter;
         if (valuesSource != null) {
             sums = context.bigArrays().newDoubleArray(1, true);
+            compensations = context.bigArrays().newDoubleArray(1, true);
         }
     }
 
@@ -71,13 +73,29 @@ public LeafBucketCollector getLeafCollector(LeafReaderContext ctx,
             @Override
             public void collect(int doc, long bucket) throws IOException {
                 sums = bigArrays.grow(sums, bucket + 1);
+                compensations = bigArrays.grow(compensations, bucket + 1);
+
                 if (values.advanceExact(doc)) {
                     final int valuesCount = values.docValueCount();
-                    double sum = 0;
+                    // Compute the sum of double values with Kahan summation algorithm which is more
+                    // accurate than naive summation.
+                    double sum = sums.get(bucket);
+                    double compensation = compensations.get(bucket);
                     for (int i = 0; i < valuesCount; i++) {
-                        sum += values.nextValue();
+                        double value = values.nextValue();
+                        if (Double.isNaN(value) || Double.isInfinite(value)) {
+                            sum += value;
+                            if (Double.isNaN(sum))
+                                break;
+                        } else if (Double.isFinite(sum)) {
+                            double corrected = value - compensation;
+                            double newSum = sum + corrected;
+                            compensation = (newSum - sum) - corrected;
+                            sum = newSum;
+                        }
                     }
-                    sums.increment(bucket, sum);
+                    compensations.set(bucket, compensation);
+                    sums.set(bucket, sum);
                 }
             }
         };
@@ -106,6 +124,6 @@ public InternalAggregation buildEmptyAggregation() {
 
     @Override
     public void doClose() {
-        Releasables.close(sums);
+        Releasables.close(sums, compensations);
     }
 }