云数据库 HBase 如何助力物联网

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 2538 天前的主题，其中的信息可能已经有所发展或是发生改变。

免费申请云数据库 HBase 地址： https://cn.aliyun.com/product/hbase 引言从有线互联网到无线互联网，本质是加强了人与人之间随时随地的关联。下一个互联的时代是万物互联，也就是物联网。有人说，这个是第三次信息革命，不管咋样，这都会产生大量的数据。举一个例子，杭州市有 200w 辆汽车(具体肯定比这个多)，我们给每辆车安装一个传感器，每隔 10s，上传 1k 的数据量，说明这个车的位置，一些情况。QPS 为 20w，1 年的数据量为：36536024200w1k=5.73P，如果不做任何的容灾，每个磁盘 4T 来算，则需要 5.73*1024/4T=1466 块磁盘，做一些容灾，则至少需要 2000+的磁盘。这些数据蕴含着巨大的价值，分析这些数据后，则会改变整个杭州的交通。

架构在我们传统架构下，一般会使用关系型数据库，关系型数据库索引结构基本上都是类 B+树，随着终端设备数增多，读写压力剧增，读写延迟增大，数据库面临崩溃；其次，关系型数据库也无法做到存储容量无限扩容，目前有一些分库分表的方案，实现起来比较复杂，往往有较多的限制。

物联网最大的特点写入量大，要求延迟低，且数据存量巨大。HBase 基于 LSM，把磁盘的随机写改为顺序写，写吞吐高，不受 SSD 随机写入放大干扰，也不受空间放大的干扰。目前 HBase 非常满足物联网存储需求，存储数 T、数 P 甚至百 P 的空间，延迟稳定在数毫秒之内，跟 Hadoop 分析体系有较为深入的结合，满足分析类的需求。具体物理网的大致结构如下： screenshot 主要流程： 1、一部分实时，直接走 MQ，到流式系统，做一些实时的分析，后写入 HBase。 2、一部分写入 HBase，一般是全量数据，后接入 Hadoop/Spark，做一些离线分析，后续结果写入 HBase 中。往往在使用 HBase 时，使用的 rowkey 设计是：设备 ID+地点+xxx+时间 xxx

每个云公司，都在前端的一些环节做了很多事情，比如提供硬件支持、协议支持、ECS 可以使用一些弹性方案，当然也有不少公司是自己做方案。针对数据从云 HBase 到 EMR Hadoop/Spark 中，目前有两种方案，其一是 Hadoop、Spark 直接连接云 HBase 分析；其二是云 HBase 提供一些导出数据的功能，在 EMR 中自动生成一张表（目前云 HBase 在实现中）。

云 HBase 免费申请地址： https://cn.aliyun.com/product/hbase

目前尚无回复

Hbase hadoop 写入数据库