这是一个创建于 1575 天前的主题,其中的信息可能已经有所发展或是发生改变。
假设某个公司的订单 10 年达到 100 个亿的数据,存在 hbase 里面
1.创建一张表,散列到 100 个分区,rowkey 是按照 userid 进行散列
2.创建 10 张表,每个表有 10 个分区,这 10 个表是按照订单的创建时间每年来划分的,rowkey 是按照 userid 进行散列
如果用方案 1,那么这张表会不会显得大,因为最近一年的订单访问会比较频繁,一年前的数据访问不那么频繁,有没有那种浪费的感觉
如果用方案 2,最近一年那个表会不会出现热点问题,可以把一年前的订单用机械磁盘存,最近一年用 ssd 存储,保证 99rt,且降低成本
目前存在的疑惑就是 方案 2 会不会出现热点问题,因为方案 1 的话,感觉会路由到不同的分区,会减少热点的概率
对 hbase 还不是太熟悉,求指教一下