HBase列族存储在HDFS文件系统中,每个列族对应一个HDFS文件,数据按行键和列族、列名进行存储。
HBase列族的存储方式如下:
1、行键(Row Key)
HBase中的数据以行的形式存储,每一行数据都有一个唯一的行键,行键是按照字典顺序排序的,因此查询性能较好,行键可以是任意字符串,但通常使用字符串的前缀来表示数据的类型或归属。
2、列族(Column Family)
列族是HBase中的基本数据结构,它将一组相关的列存储在一起,列族可以看作是一个表的分区,每个列族都有自己独立的存储空间,列族中的列按照字典顺序排序。
3、列(Column)
列是HBase中的基本数据单元,用于存储具体的数据,每个列都有一个唯一的列名,列名由列族和列限定符组成,如果有一个名为“info”的列族和一个名为“age”的列,那么该列的完整名称为“info:age”。
4、单元格(Cell)
单元格是HBase中最小的数据单元,用于存储一行中的一个值,每个单元格都有一个唯一的单元格标识符,由行键、列族和列限定符组成,如果有一个行键为“row1”,列族为“info”,列名为“age”的单元格,那么该单元格的标识符为“row1:info:age”。
5、时间戳(Timestamp)
HBase中的每个单元格都可以包含一个时间戳,用于表示数据的创建时间或最后修改时间,时间戳可以帮助用户在查询时过滤出最新的数据。
6、单元格值(Cell Value)
单元格值是存储在单元格中的具体数据,可以是任意类型的数据,如字符串、数字、布尔值等,HBase支持多种数据类型,如String、Integer、Long、Float、Double、Boolean等。
HBase中的数据以行的形式存储,每行数据包含一个行键、多个列族、每个列族包含多个列、每个列包含多个单元格,单元格中存储具体的数据值和时间戳。
原创文章,作者:K-seo,如若转载,请注明出处:https://www.kdun.cn/ask/494845.html