HBase 分布式、面向列的数据库 HBase: Row-Key:用于标识行 HBase: 配合Zookeeper使用的列式数据库 Zookeeper:负责管理大数据集群中的各个组件,用于协调和共享大数据库框架中的参数数据 HBase内部使用哈希表, 并存储索引, 可以快速查找HDFS中数据 HBase的数据模型: NameSpace:数据库的元数据 表:存储管理数据,可以有上亿行,上百万列,对于值为空的数据,不占用磁盘空间,表可以设计的很稀疏 行:每一行是一个数据对象,用Row key唯一标识 列:Column,有CF和CQ组成 行键:Row key,唯一标识,用于索引行数据 列族:Column Family,列的集合 列修饰符:Column Qualifier,可以理解为一个键值对 时间戳:列的一个属性,可以根据版本或时间戳来执行查询历史数据。 Hbase启动: 必须先启动zookeeper,才能启动HBase 启动zookeeper:zkServer.sh start 启动后的效果:端口 QuorumPeerMain 启动Hbase:start-hbase.sh 启动后的效果: 45264 HRegionServer 44843 HMaster HMaster:很容易挂掉,可能由于各种原因。具体查看:$HBASE_HOME/logs/hbase-用户名-master-主机名.log的文件,来查找错误。