fix flaky penetrationProtectTestWithComputeIfAbsent #872

Roiocam · 2024-03-27T03:18:11Z

Resolve #870

Some of the threads will request a key with keyPrefix_0, but it won't cover it on the loader, so it may increase the counter unexpectedly(by race).

areyouok · 2024-03-27T05:52:59Z

这个我没看懂，竞争出现在哪里？

Roiocam · 2024-03-27T07:21:10Z

这个我没看懂，竞争出现在哪里？

我没细看穿透保护的代码，按单测的理解，应该是每一个 Key 有一个锁来保护。

20 个线程，会有三个 key 被访问，0，1，2，第一次大家都会成功，第二轮遍历，假如是 key_0 的那个先拿到时间片，那么 loadSuccess 就会 + 1，变成 4 了。

我这个 PR 就是避免这种情况，让 key 落在 0，1，两个都能被 if 覆盖上，不过我也没想明白一个点：在新的代码，如果 key_1 拿到时间片时，那么可能还是会出现 loadSuccess=4，断言出错的情况。

areyouok · 2024-03-27T07:30:46Z

穿透保护是为了避免多个线程同时去执行加载同一个key，增加（数据库的）压力。

如果线程1正在加载key0，线程2进来，线程2需要等待线程1的加载结果，不会执行加载。如果线程1已经加载完成，线程3进来，此时cache命中，就不会执行加载了。这样key0也是只能加载一次的。

如果单测没有通过，应该是有别的原因。

有很多单测依赖sleep来保证特定的多线程执行顺序，确实比较脆弱。sleep时间长了，单测运行慢，时间短了，在性能低的环境下执行容易失败。现在看来还是依靠CountDownLauch等手段来指定严格的执行顺序更靠谱一些，测试代码的编写会更复杂一点。

Roiocam · 2024-03-27T08:08:50Z

感谢解释，我在本地是可以复现的，穿透保护看起来有点问题？能让线程同时执行 loader，只要去掉 sleep，然后 debug 断点让某些线程卡一下就可以

i am loaded:penetrationProtect_0
i am loaded:penetrationProtect_1
i am loaded:penetrationProtect_2
15:59:40.277 [Thread-32] INFO  com.alicp.jetcache.AbstractCache - loader wait timeout:PT0.001S
15:59:40.417 [Thread-34] WARN  com.alicp.jetcache.AbstractCache - loader wait interrupted
i am loaded:penetrationProtect_0
i am loaded:penetrationProtect_1
i am loaded:penetrationProtect_2
i am loaded:penetrationProtect_0
i am loaded:penetrationProtect_0

java.lang.AssertionError: 
Expected :3
Actual   :5

areyouok · 2024-03-27T08:35:16Z

你的日志里面，这里load超时是1毫秒，是不是这个原因导致的

areyouok · 2024-03-27T08:38:06Z

还有个可能的原因，有的测试的cache超时时间设置比较短，比如200ms，在比较慢的环境运行超时了，导致再次加载

Roiocam · 2024-03-27T09:19:35Z

还有个可能的原因，有的测试的cache超时时间设置比较短，比如200ms，在比较慢的环境运行超时了，导致再次加载

确实是这样，之前 DEBUG 看到 expireAfterWrite 很小的时候尝试改了一下，发现不行。后来排查为啥这个单测跑了两遍才看到 AbstractEmbeddedCacheTest 里频繁改 expireAfterWrite 和 expireAfterAccess，把相关的参数都改了就好了

jetcache-test/src/main/java/com/alicp/jetcache/test/AbstractCacheTest.java

areyouok reviewed Mar 27, 2024

View reviewed changes

jetcache-test/src/main/java/com/alicp/jetcache/test/AbstractCacheTest.java Outdated Show resolved Hide resolved

Roiocam added 5 commits March 27, 2024 18:38

fix flaky penetrationProtectTestWithComputeIfAbsent

0879d4e

add comment

77aad01

fix flaky

6952f49

fix typo

fea2864

refactor

ee60359

Roiocam force-pushed the flaky-penetrationProtect branch from 9b52f6d to ee60359 Compare March 27, 2024 10:52

refactor

d697ddb

areyouok requested changes Mar 27, 2024

View reviewed changes

jetcache-test/src/main/java/com/alicp/jetcache/test/AbstractCacheTest.java Outdated Show resolved Hide resolved

delay execute

00fea91

areyouok merged commit 1b4dd04 into alibaba:master Mar 27, 2024
2 checks passed

Roiocam deleted the flaky-penetrationProtect branch March 28, 2024 01:30

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix flaky penetrationProtectTestWithComputeIfAbsent #872

fix flaky penetrationProtectTestWithComputeIfAbsent #872

Roiocam commented Mar 27, 2024 •

edited

Loading

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024 •

edited

Loading

areyouok commented Mar 27, 2024

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024 •

edited

Loading

fix flaky penetrationProtectTestWithComputeIfAbsent #872

fix flaky penetrationProtectTestWithComputeIfAbsent #872

Conversation

Roiocam commented Mar 27, 2024 • edited Loading

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024 • edited Loading

areyouok commented Mar 27, 2024

areyouok commented Mar 27, 2024

Roiocam commented Mar 27, 2024 • edited Loading

Roiocam commented Mar 27, 2024 •

edited

Loading

Roiocam commented Mar 27, 2024 •

edited

Loading

Roiocam commented Mar 27, 2024 •

edited

Loading