各位大佬,项目是这样子的 存在多个定时处理数据的项目,项目是一样的,只是端口不一样,实现效果是对相同的一个库的一张表进行查询与修改操作(每次都是取最新时间的十条数据),但是这样子好像数据又会冲突,如何避免这种情况
1
xuanbg 2020-05-23 15:35:50 +08:00
分布式锁是唯一解决方案
|
2
yc8332 2020-05-23 15:40:39 +08:00
搞个 redis 锁。或者把数据维护到 redis,只保留 10 条数据。。每次直接从 redis 取
|
3
huhu3312 2020-05-23 15:42:11 +08:00
这种跑一个定时任务不就好了
|
4
Saurichthys OP @huhu3312 一个定时任务效率太低了呀- -
|
5
coder2019 2020-05-23 17:14:46 +08:00
@Saurichthys 感觉没啥意义,操作的是同个库同个表,修改数据会加锁,瓶颈在数据库上,跑多个定时任务有啥效率提升吗
|
6
skypyb 2020-05-23 17:30:21 +08:00
。。。 就分布式锁就完事了呗
|
7
jugelizi 2020-05-23 18:06:58 +08:00 via iPhone
...上消息队列吧
|
8
yjxjn 2020-05-23 18:10:45 +08:00
悲观锁?
|
9
ak78 2020-05-23 18:12:29 +08:00
1 、分布式锁(推荐) 2 、通过数据库乐观锁加上更新条件,条件不满足自然更新不到。3 、不同的机器粉笔通过相关表 id%取模来达到取到不同的数据(不推荐)
|
10
huntcool001 2020-05-23 18:16:26 +08:00
redisson 里有包装好的 redis 客户端
或者用 xxl-job 一类的分布式框架, 有一台机子执行就行了 |
11
fmumu 2020-05-23 18:19:31 +08:00 via Android
查询修改?乐观锁行吧
|
12
xizismile 2020-05-23 18:51:20 +08:00 via Android
@huntcool001 +1,用 xxl-job
|
13
luckyrayyy 2020-05-23 19:10:00 +08:00 via iPhone
分布式锁,或者十个并发并不大,数据库加个 version 字段乐观锁
|
14
luozic 2020-05-23 19:36:17 +08:00
最简单的令牌桶,漏斗,麻烦点,消息队列。
|
15
vchat 2020-05-23 19:49:20 +08:00
可以这样, 多台机器 启动通过争抢的方式获取 leader 用来作为调度器 负责将来取数据库数据到缓存队列中,其他机器从缓存中获取数据处理更新数据表
|
16
lyyhello 2020-05-23 22:00:57 +08:00
xxl-job-gateway 投递-mq-应用系统消费(多几个消费端 多几个消费线程) 完美解决
|
17
lyyhello 2020-05-23 22:01:24 +08:00
xxl-job>gateway 投递>mq>应用系统消费(多几个消费端 多几个消费线程) 完美解决
|
18
lyyhello 2020-05-23 22:09:52 +08:00
方案二(垃圾方案 但是对你来说可能是改动最小的 主机名注册到一张表里面 server_config 配置处理序号 ),再从业务表里面挑出一个唯一字段 选取任务的时候进行 hash 然后取模 命中配置处理序号的,就有本台主机处理。 优点就是不加锁不用中间件 缺点就是主机挂了。有部分数据处理不到。只有等主机上线了。 有需要可以找我私聊。帮助大佬是我的美德
|
19
aaahhh123 2020-05-23 22:47:25 +08:00
666
|
20
fewok 2020-05-23 22:49:06 +08:00
本质就是错的,为啥不一个定时任务扫出来,再发给其他机器协同处理呢??
|
21
Saurichthys OP @fewok 你好,一个任务扫出来,那就需要在创建一个项目来做这个事情了, 然后你原来项目的业务逻辑都要改了,之前是针对数据库,现在要针对这个任务转为接收数据执行业务逻辑。
目前综合各位大佬的意见,我觉得分布式锁 Redis 的方案可能会比较好一点,任务启动,执行的数据 key 锁住 + expireTime,其他任务并发任务执行到这条数据 有 key 就跳过!!! |
22
gtexpanse 2020-05-23 23:16:31 +08:00 via iPhone
分布式锁太麻烦了吧,db 加一列 runhost,大家都同时去 update runhost is null 的,然后再去查询一下就拿到只属于自己的任务了
|
23
wujieyuan 2020-05-23 23:22:50 +08:00
上面回答什么分布锁啊, 消息队列啊都太麻烦了, 其实有个非常简单的方法, 也无需修改代码,可以读指定路径下的文件, 如果有就执行,没有就不执行, 想让哪台机器执行任务就在那台机器上放上指定的文件,其他机器就不会执行啦, 日后不管怎么换服务器都不用修改代码
|
24
fewok 2020-05-23 23:27:33 +08:00
@Saurichthys 为啥要创建服务,所有服务的 ip 挨个发送下消息等结果,不就完事了。可以用中间件的话,直接扔 MQ 。。。
|
25
micean 2020-05-23 23:34:59 +08:00 via Android
为什么要分布式锁啊……数据库开事务锁呗
|
26
xyjincan 2020-05-23 23:37:13 +08:00 via Android
把代码改改,写操作抽象出来,单独部署
|
27
laball 2020-05-24 00:08:06 +08:00
这个设计方案感觉有问题啊,建议使用下次队列+多个消费者的模式,每次增加一条记录,即往 MQ 中放入一个任务,然后,让多个消费者去处理,这样,每条数据,都能处理到,描述中关于取最新时间的 10 条数据,逻辑上是存在问题的,因为有可能会出现有数据没有被取到的情况,这样就有些数据处理了,有些数据没有处理,存在不一致的情况;
|
28
abcbuzhiming 2020-05-24 14:43:23 +08:00
@Saurichthys 你为什么觉得低?你的数据真多到了一个线程跑不够的地步?那你首先要考虑的是需要一个生产者模型来分配任务,为了保证任务不重复,你生产的时候是要加锁的,加锁后性能也就那样。你觉得你到了这一步了吗?
|
29
lidlesseye11 2020-05-24 17:01:23 +08:00
什么叫“每次都是取最新时间的十条数据”。。
比如现在表里一共 20 条,A 取了 10 条最新的,这时候 B 进来是和 A 抢锁?还是取剩下的 10 条?还是等新的 10 条进来? |
30
Saurichthys OP @lidlesseye11 是和 A 抢锁的呀, 都是处理最新的十条数据, 但是这十条可能 A 处理 也有 B 加载到需要处理呀,这不就很矛盾了吗
|