Memcached数据被踢(evictions>0)现象分析

Monday, Sep 7th, 2009 by Tim | Tags: evictions, LRU, memcached

很多同学可能熟知Memcached的LRU淘汰算法，它是在slab内部进行的，如果所有空间都被slabs分配，即使另外一个slab里面有空位，仍然存在踢数据可能。你可以把slab理解为教室，如果你的教室满了，即使别的教室有空位你的教室也只能踢人才能进人。

本文介绍的却是另外一种现象。今天监控发现线上一memcached发生数据被踢现象，用stats命令看evictions>0,因为以前也出现过此问题，后来对这个参数增加了一个监控，所以这次主动就发现了。由于给memcached分配的内存远大于业务存储数据所需内存，因此初步判断是“灵异现象”。

第一步，netstat查看所有连接，排除是否被一些未规划的client使用，经排查后断定无此可能。

第二步，用tcpdump抽样检查set的指令，排除是否有忘记设cache过期时间的client，初步检查所有典型的业务都有expire time。

第三步，Google，未果

第四步，看源代码，了解evictions计数器增加时的具体细节，oh, no…

in items.c, memcached-1.2.8,

125         for (search = tails[id]; tries > 0 && search != NULL; tries--, search=search->prev) {
126             if (search->refcount == 0) {
127                 if (search->exptime == 0 || search->exptime > current_time) {
128                     itemstats[id].evicted++;
129                     itemstats[id].evicted_time = current_time - search->time;
130                     STATS_LOCK();
131                     stats.evictions++;
132                     STATS_UNLOCK();
133                 }
134                 do_item_unlink(search);
135                 break;
136             }
137         }

从源代码发现踢数据只判断一个条件，if (search->refcount == 0)，这个refcount是多线程版本计数用，在当前服务器未启用多线程情况下，refcount应该始终为0,因此初步判断memcached是从访问队列尾部直接踢数据。

为了证实想法，设计以下场景：

部署一个memcached测试环境，分配比较小的内存，比如8M
设置1条永远不过期的数据到memcached中，然后再get一次，这条数据后续应该存在LRU队尾。
每隔1S向memcached set(并get一次) 1,000条数据，过期时间设为3秒。
一段时间后，stats命令显示evictions=1

按我以前的理解，第2步的数据是永远不会被踢的，因为有足够过期的数据空间可以给新来的数据用，LRU淘汰算法应该跳过没过期的数据，但结果证实这种判断是错误的。以上业务的服务器发生被踢的现象是由于保存了大量存活期短的key/value,且key是不重复的。另外又有一业务保存了小量不过期的数据，因此导致不过期的数据惨遭被挤到队列踢出。

本来这个问题就告一段落了，但在写完这篇文章后，顺便又看了新一代memcached 1.4.1的源代码，很惊喜发现以下代码被增加。

items.c, memcached 1.4.1

107     /* do a quick check if we have any expired items in the tail.. */
108     int tries = 50;
109     item *search;
110
111     for (search = tails[id];
112          tries > 0 && search != NULL;
113          tries--, search=search->prev) {
114         if (search->refcount == 0 &&
115             (search->exptime != 0 && search->exptime < current_time)) {
116             it = search;
117             /* I don't want to actually free the object, just steal
118              * the item to avoid to grab the slab mutex twice ;-)
119              */
120             it->refcount = 1;
121             do_item_unlink(it);
122             /* Initialize the item block: */
123             it->slabs_clsid = 0;
124             it->refcount = 0;
125             break;
126         }
127     }

重复进行上述测试，未发生evictions。

9/8 Update: 注意到L108的tries=50没有？试想把测试第2步设置51条不过期数据到cache中，情况会怎样？因此新版的Memcached也同样存在本文描述问题。

几条总结：

过期的数据如果没被显式调用get，则也要占用空间。
过期的不要和不过期的数据存在一起，否则不过期的可能被踢。
从节约内存的角度考虑，即使数据会过期，也不要轻易使用随机字符串作为key，尽量使用定值如uid，这样占用空间的大小相对固定。
估算空间大小时候请用slab size计算，不要按value长度去计算。
不要把cache当作更快的key value store来用, cache不是storage。

如想及时阅读 Tim Yang 的文章，可通过页面右上方扫码订阅最新更新。

Comments

54 Comments

xLight

2009-09-08 at 12:24 PM

如果每个应用都有自己独立的memcache集群就不会触发这个问题。
不过运维复杂了。
sky

2009-09-09 at 4:36 PM

晕。memcached文档中都有写，lazy expiration logic。expires与LRU无关。
dennis

2009-10-14 at 3:06 PM

事实上你后面的补充是错误的吧，哪怕把测试第2步设置51条不过期数据到cache中，也不会发生数据被踢现象的，测试证明。原因在于do_item_unlink(it);
调用的条件原来只判断refcount，现在还加上了(search->exptime != 0 && search->exptime < current_time)，变成了同一个if语句，而非原来的两个。
dennis

2009-10-14 at 3:31 PM

咳咳，原因说错了，是因为没有统计
stats.evictions++;
才对。
Tweet for 2009-10-31 « lifestream

2009-11-01 at 12:04 AM

[…] http://timyang.net/?p=418 […]
Twitter系统运维经验 - Tim[后端技术]

2009-11-02 at 8:46 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Memcached高级数据操作命令

2010-01-10 at 10:03 PM

[…] 当memcached需要内存，而又没有过期或是删除区域的内存可以重用的时候，memcached使用LRU算法将其认为没有必要再cache在内存中的数据剔除，以释放内存空间。如果需要详细了解memcached剔除数据的相关内容，建议参考Tim老大的这篇文章：Memcached数据被踢(evictions>0)现象分析 This entry was posted in Web开发 and tagged memcached. Bookmark the permalink. Post a comment or leave a trackback: Trackback URL. « Is it a burden […]
转载，NoSQL数据库笔谈 | 旁门左道

2010-05-14 at 6:17 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Memcache mutex设计模式 « Yet another wordpress blog

2010-07-29 at 3:01 AM

[…] Memcached数据被踢(evictions>0)现象分析 […]
NoSQL数据库笔谈 | Jim的blog

2010-08-13 at 9:30 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Tom

2010-08-19 at 5:16 PM

请问下楼主有没有遇到过，memcache 的连接不断开的，就是请求完数据，连接不断开，导致httpd进程不断增多
讨论小站 » Blog Archive » NoSQL数据库笔谈（转载）

2010-10-10 at 11:42 AM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Twitter系统运维经验 | haohtml's blog

2010-11-24 at 12:18 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Liexusong

2011-02-20 at 1:28 PM

楼上的原因是因为客户端没有调用quit命令吧。看过memcached的源码好像没有自动断开连接的。
NoSQL数据库笔谈 | 时光村落的博客

2011-03-11 at 10:45 AM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
Twitter系统运维经验 | web开发

2011-06-28 at 3:08 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
NoSQL数据库笔谈 | web开发

2011-06-30 at 3:27 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
[redis]为什么选择redis 传统MySQL+ Memcached架构遇到的问题 | web开发

2011-07-22 at 2:08 PM

[…] Memcached使用预分配的内存池的方式，使用slab和大小不同的chunk来管理内存，Item根据大小选择合适的chunk存储，内存池的方式可以省去申请/释放内存的开销，并且能减小内存碎片产生，但这种方式也会带来一定程度上的空间浪费，并且在内存仍然有很大空间时，新的数据也可能会被剔除，原因可以参考Timyang的文章：http://timyang.net/data/Memcached-lru-evictions/ […]
Why use Redis and product positioning [reproduced]

2011-07-27 at 7:44 AM

[…] Use Memcached advance of the allocated memory pool way, using slab and different sizes of the chunk to manage memory, Item according to choose the appropriate size chunk storage, memory pool way can save the cost of the application/free memory, and can reduce the memory pieces, but this way have also can bring certain degree of space wasted, and in the memory still a space, new data may also be eliminate, reason can reference Timyang article:http://timyang.net/data/Memcached-lru-evictions/ […]
NOSQL应用篇 | 杨益的博客

2011-07-28 at 1:01 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
为什么使用 Redis及其产品定位 | 海纳百川，有容乃大

2011-08-17 at 4:19 PM

[…] 内存管理方面Memcached使用预分配的内存池的方式，使用slab和大小不同的chunk来管理内存，Item根据大小选择合适的chunk存储，内存池的方式可以省去申请/释放内存的开销，并且能减小内存碎片产生，但这种方式也会带来一定程度上的空间浪费，并且在内存仍然有很大空间时，新的数据也可能会被剔除，原因可以参考Timyang的文章：http://timyang.net/data/Memcached-lru-evictions/ […]
为什么使用 Redis及其产品定位

2011-08-25 at 3:05 PM

[…] Memcached使用预分配的内存池的方式，使用slab和大小不同的chunk来管理内存，Item根据大小选择合适的chunk存储，内存池的方式可以省去申请/释放内存的开销，并且能减小内存碎片产生，但这种方式也会带来一定程度上的空间浪费，并且在内存仍然有很大空间时，新的数据也可能会被剔除，原因可以参考Timyang的文章：http://timyang.net/data/Memcached-lru-evictions/ […]
【技术资料】NoSQL数据库笔谈 « 悠游 Sam BLOG

2011-12-07 at 12:09 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
为什么使用 Redis及其产品定位 | Chinasb's Blog

2011-12-24 at 2:40 AM

[…] Memcached使用预分配的内存池的方式，使用slab和大小不同的chunk来管理内存，Item根据大小选择合适的chunk存储，内存池的方式可以省去申请/释放内存的开销，并且能减小内存碎片产生，但这种方式也会带来一定程度上的空间浪费，并且在内存仍然有很大空间时，新的数据也可能会被剔除，原因可以参考Timyang的文章：http://timyang.net/data/Memcached-lru-evictions/ […]
NoSQL数据库——非关系型数据库 | 懒人轻气球

2012-03-06 at 1:12 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
NoSQL数据库笔谈 | 博客秀 | blog.sowow.net

2012-04-11 at 5:23 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
hills

2012-05-18 at 4:44 PM

是啊我就设置了永不过期，一天以后就失效了！原来是这样子！
NoSQL数据库笔谈 | EvilCode 邪恶代码

2012-09-23 at 3:50 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]
pesiwang

2012-09-29 at 7:20 PM

memcached-1.4.15 变成了只检查一个了，注意最后边的break

/* We walk up *only* for locked items. Never searching for expired.
* Waste of CPU for almost all deployments */
for (; tries > 0 && search != NULL; tries–, search=search->prev) {
uint32_t hv = hash(ITEM_key(search), search->nkey, 0);
…
break;
}

所以不过期的数据还是不要跟过期数据放一起好
NoSQL数据库笔谈 | Hello! MY LOVE!

2012-11-14 at 4:00 PM

[…] “Evictions make the cache unreliable for important configuration data”，Twitter使用memcache的一条经验是，不同类型的数据需放在不同的mc,避免eviction，跟作者前文Memcached数据被踢(evictions>0)现象分析中的一些经验一致。 […]

1 2 Newer Comments

后端技术 by Tim Yang

Recent Posts

Categories

Most Commented

Archives

Feeds