最近接到一个大项目，给公司设计抢商品代金劵业务

我们公司是做汽车金融方面的工作，在业内还挺大。目前单量来源于2，3线城市，随着大环境越老越差位了吸引他们，公司决定给全国的客户，销售等发一些商品

1.总体学习了京东开源秒杀系统设计思路和方案。

我们公司决定进行如下设计。

a.资源投入不会太大，一个完全体的秒杀系统那都是用到很多硬件比如交换机。机房设计等

b.公司给我们的资源不会太多，所以整体思路上只能从现有资源层面进行处理，

c.发挥出Nginx 的长版优势，用它做一些业务处理，（这一步非常关键，要完美契合你们公司业务逻辑。这需要很多方向的思考）

为啥Nginx 能在秒杀系统中这么优秀，这就要说到多进程单线程的多路复用技术，多路复用技术有两个模型。一个是select和epoll模型目前最好的是epoll模型。当一个请求进来之后遇到IO或者调用外部服务的时候。会阻塞，但是进程不会一直等待，这期间他会干其他事，等好了再回来处理。

举一个例子，比如你干一件事，这件事中有很多过程，你时间上无法控制的，比如你去买星巴克咖啡，下完单之后他给你制作，你不会在哪里等，你跑到卖炸鸡的那边再买炸鸡。

同样都是多路复用为啥epoll 模型优秀呢，像刚才那个例子假如你同时干了10件事，都处于等待状态。你怎么知道哪件干完了呢，而且需要等着你继续处理呢，那就一遍一遍的问，跑去咖啡店说好了吗，回复没好，跑去炸鸡店好了吗。没好继续往下问。这样很慢是吗。对这就是select 模型。而epoll 多了一个回调，主动通知，但是呢不是主动通知你，而是主动放到一个完成队列里边去，就是完成的都放到一起，你自己处理。

2.隔离（安全为主）

主要是两方面一个是数据隔离一个是业务隔离，数据这块尽量要做到读写分离，热点数据做缓存，业务隔离每家公司不一样所以说具体要结合你们业务场景去做，但是非常非常重要。

3.预约机制

我们系统上线之后，咋说呢还是有问题，具体过程心酸～，后来我们该用预约方法（这样可以提前预知多少数据请求），因为我们公司业务较特殊，很多客户和业务员让他们预约的话，有些繁琐，具体细节不赘述了。就是先主动放一部分非预约的，然后一部分预约的。然后针对预约的数据放到 redis 一手机号设置为key 但是这里有一个问题，我们是单片redis 的key进行操作目前只能支持7，8万的 TPS。那咋办呢后续说，（别老想着扩redis 资源有限）。

4.销峰填谷

有没有想过这样一个问题，比如一个业务很火爆的时候，主办方会分为上午场，下午场。对我们平台为了避免页面被同一时间大量访问，随机给每位用户的响应时间，这样用户在提交的同时，不会同一时间集中访问平台。因为用户在访问购买的时候填写的信息大都是一直，比如付款金额，手机号，商品信息等等都差不多，提交时间也差不多。但是给每位用户不同的响应时间界面就会避免集中提交。（说简单一点，访问你们页面，你们响应时间设置一个随机数，就类似于sheep.(1000),但是这仅仅助于你理解，可别乱说）。还有一些其他平台从验证码，上做功夫，避免集中访问道理一样。

下面再说一下技术手段，想象这样一个场景，当你的前置系统访问后方核心系统，当很平稳的时候，前置系统访问核心系统通过RPC 没问题。但是如果前置系统访问了超大，你核心系统处理不过来很容易被冲击。这个时候咋办，不能用RPC了只能用MQ 进行处理了。（我见过一些公司，也不分析自己的业务逻辑上来不管那个接口访问直接用MQ，问他们他们说快啊，稳定啊，牛的不行）。

5.限流

到这个地方需要上技术手段了。我们说的秒杀重器，Nginx 用ip 或者用户名（我们公司是和手机号关联）限流，具体怎么做很多教程

limit_req_zone <变量名> zone=<限流规则名称>:<内存大小> rate=<速率阈值>r/s;

一搬rate 定义 1

还有就是 API 限流这个比较简单了，自己写一个或者用开源的都可以（RateLimiter Google）

6.监控系统

高并发的系统最关键是监控，也就是你必须随时知道系统的健康状况，以及预警机制，注意只关注最重要的几个数据，比如缓存数据是否被打满，缓存命中率是否正常，划重点少但是关键。然后就是一些细节类的，比如缓存踢出率，是不是旧的key值有没有被剔除等。

7.数据一致性问题

我们平时对一个数据进行加减通常回操作数据库，这只是平常的业务需求没问题，业务量不大的情况下，像高并发的场景必须要单独设计。既要满足高并发处理，月要保证数据安全。这是你可能说分布式锁，setNx等，这样不行因为这回带来更多的问题虽然能解决一部分问题。这里用的是Reids 的原生方法，众所周知Redis 是单线程的天然解决查询和更新操作（一次性完成）。怎么做呢？重点来了Redis 中可以使用lua 脚本

复制代码

下边是我们的lua脚本
local pcount = redis.call('get', KEYS[1])
if not c_s or tonumber(pcount) < tonumber(ARGV[1]) then
   return 0
end
redis.call('decrby',KEYS[1], ARGV[1])
return 1

读取lua脚本

复制代码

URL url = Resources.getResource("你的脚本地址");
List<String> lines = Resources.asCharSource(url, Charsets.UTF_8).readLines();

复制代码

lines.forEach(line->{
    luaScript += (line + "\n");
});

复制代码

可以吧 sha1 存放起来  因为是预加载,以后都可以用sha1 了 
String sha1 =  jedisCluster.scriptLoad(luaScript);

注意@PostConstruct 也可以用这个做项目启动的时候就把lua脚本加载到缓存

复制代码

执行jedisCluster.evalsha(sha1,Collections.singletonList(key),Collections.singletonList(value));

这样就可以了对一个数据进行 decrby（减操作）操作如果库存不够了则会返回0

这样可以支持很高的。并发量，而且不存咋数据安全问题。然后可以在秒杀完了之后对数据库进行一致性操作。

7.JVM 垃圾回收

对于垃圾回收器的选择，是需要分业务场景的。如果我们提供的服务对响应时间敏感，并且堆内存能够给到 8G 以上的，那建议选择 G1；堆内存较小或 JDK 版本较低的，可以选择 CMS。相反如果对响应时间不敏感，追求一定的吞吐量的，则建议选择 ParallelGC，同时这也是 JDK8 的默认垃圾回收器。这一部分需要结合你们系统逐步分析就可以。每个公司系统不一样参考网上的一些设计，同时多做并发测试。多做测试。