高并发场景下的 Redis 优化实战技巧与案例分享-猿码集

高并发场景下的 Redis 优化实战技巧

1. 热点数据缓存与降级策略

热点数据缓存在高并发场景下是提升系统吞吐的关键。通过将热数据放在 Redis 中并设置合理的 TTL，可以显著降低后端数据库的压力，同时减小单点瓶颈带来的延迟波动。TTL 策略应结合数据热度和时效性动态调整，避免缓存穿透与雪崩效应。

降级策略是当后端查询成本过高或 Redis 容量接近上限时的最后防线。通过分层缓存（本地缓存、二级缓存、分布式缓存）以及对非核心数据进行降级处理，可以确保热点请求仍具备可接受的响应时间。降级设计要具备幂等性和可观测性。

-- Lua 脚本示例：将热点数据缓存到 Redis，并在命中后设置短期 TTL
local key = KEYS[1]
local value = redis.call('GET', key)
if value thenreturn value
elselocal v = cjson.encode({timestamp=ARGV[1], data='...'})redis.call('SET', key, v)redis.call('EXPIRE', key, tonumber(ARGV[2]))return v
end

通过上述方案，命中热点数据的响应时间缩短，而对于冷数据则走回源系统，避免持续拉取造成的负载波动。结合本地缓存和异步刷新，可以进一步提升系统的稳定性。

2. 连接与并发模型

高并发场景下，连接池与事件驱动模型对降低上下文切换和提高吞吐至关重要。尽量使用异步/非阻塞的客户端库，并为 Redis 设置合理的最大连接数，避免连接饥饿导致的队列阻塞。

在多节点/分片环境中，集群与分片设计要与业务访问模式相匹配。对于读多写少的场景，可以将热数据通过只读副本服务来分担读取压力；对于写密集场景，确保写操作尽量集中、并使用管道化（Pipeline）批处理以降低往返延迟。

# Python 示例：使用连接池和管道进行批量写入，降低往返延迟
import redis
pool = redis.ConnectionPool(host='redis-host', port=6379, db=0, max_connections=200)
r = redis.Redis(connection_pool=pool)with r.pipeline() as pipe:for i in range(1000):pipe.set(f'item:{i}', i)pipe.execute()

高并发场景下的 Redis 优化实战技巧与案例分享

案例分享：电商高并发下的 Redis 优化

1. 秒杀场景的挑战

在秒杀场景中，并发请求可能达到每秒数十万级，对库存、下单等核心流程的响应时间要求极高。为了避免将大量请求击穿到后端数据库，通常将库存、限流信息等关键数据提前缓存在 Redis 中，并通过原子性机制确保数据一致。

为避免库存被超卖，常用的做法是通过Lua 脚本实现原子库存扣减，确保取值、判断与扣减在同一事务内完成，从而消除竞争条件。

-- Redis Lua 脚本：原子扣减库存
-- KEYS[1] = 库存键，ARGV[1] = 购买数量
local stock = tonumber(redis.call('GET', KEYS[1]))
if not stock or stock <= 0 thenreturn -1
end
if stock < tonumber(ARGV[1]) thenreturn 0
end
redis.call('DECRBY', KEYS[1], tonumber(ARGV[1]))
return 1

2. 分布式缓存与限流设计

为了应对峰值并发，可在 Redis 上实现分布式限流。常见做法包括令牌桶/漏桶算法的 Lua 实现，以及对限流 key 设置合理的过期时间，确保速率维持在可控范围。

通过将限流工作从应用层转移到 Redis，可以实现统一限流、跨服务可观测，并降低单点异常对下游的影响。

-- Redis Lua 脚本：简单令牌桶限流
local token_key = KEYS[1]
local rate = tonumber(ARGV[1])      -- 每秒放入的令牌数
local capacity = tonumber(ARGV[2])  -- 令牌桶容量
local now = redis.call('TIME')[1]local tokens = tonumber(redis.call('GET', token_key) or '0')
local new_tokens = math.min(capacity, tokens + rate * (now - tonumber(redis.call('GET', token_key .. ':ts') or tostring(now))))
redis.call('SET', token_key, new_tokens)
redis.call('SET', token_key .. ':ts', now)if new_tokens < 1 thenreturn 0
elseredis.call('DECR', token_key)return 1
end

案例分享：实时广告投放系统中的 Redis 优化

1. 数据写入与查询分离

实时广告投放需要对解码事件、点击日志等进行高吞吐写入，同时对查询进行低延迟返回。写入路径与查询路径分离，结合 Redis 的快速读写特性，可以显著降低查询时延与写压力的耦合度。

在此场景中，使用分区缓存与本地缓存协同工作，并通过 TTL 与数据版本控制确保数据新鲜度，避免数据过期带来的用户体验波动。

# Python 示例：写入侧的管道化批处理
import redis
r = redis.Redis(host='redis-ad-cache', port=6379, db=0)def batch_write(items):with r.pipeline() as pipe:for k, v in items:pipe.set(k, v, ex=60)  # 60 秒TTLpipe.execute()

2. 基于 Lua 的原子操作与守护

对于广告投放中的计费、曝光统计等场景，原子操作与幂等性保障至关重要。Lua 脚本可以实现对关键键的原子更新，避免并发竞争带来的数据错乱。

-- Lua 脚本：原子写入曝光计数并返回新值
local key = KEYS[1]
local delta = tonumber(ARGV[1])
local curr = tonumber(redis.call('GET', key) or '0')
curr = curr + delta
redis.call('SET', key, curr)
return curr

高可用性与监控在高并发场景中的落地

1. 监控指标与告警配置

在高并发场景中，内存使用、命中率、请求吞吐、延迟分布、慢查询比例等指标是核心。通过对 INFO、SLOWLOG、MEMORY、LATENCY 等信息的持续观测，可以提前发现瓶颈并定位问题。

又如，设置合理的告警阈值（如内存使用超过 80%、延迟 P95 超过阈值、命中率持续下降等），可以在故障初期触发自动化运维流程，帮助快速回到平稳状态。

# 观察示例：查看内存与命中率
redis-cli info memory
redis-cli info statistics
redis-cli --latency-user  yes

2. 故障排查与演练流程

在演练中，故障分解、逐步回滚、回放日志是常用的有效方法。常见的排查点包括：内存碎片、慢查询、网络抖动、阻塞操作，以及集群分区重平衡时的短时抖动。

通过建立标准化的故障排查手册，可以快速定位瓶颈，例如：慢查询定位、命令阻塞、gc 高峰期等情况的根因分析与快速解决。

# 示例：查看慢查询日志
redis-cli CONFIG GET slowlog-log-slower-than
redis-cli SLOWLOG GET 10

高并发场景下的 Redis 优化实战技巧与案例分享