
Nosql数据库一些知识点
拓展考点NoSQL部分:(1)关系数据库优势:以完善的关系代数理论作为基础,有严格的标准,支持事务ACID四性,借助索引机制可以实现高效的查询,技术成熟,有专业公司的技术支持。劣势:可扩展性较差,无法较好支持海量数据存储,数据模型过于死板、无法较好支持Web2.0应用,事务机制影响了系统的整体性能等。(2)NoSQL数据库优势:可以支持超大规模数据存储,灵活的数据模型可以很好地支持Web2.0应用
拓展考点
NoSQL部分:
(1)关系数据库
优势:以完善的关系代数理论作为基础,有严格的标准,支持事务ACID四性,借助索引机制可以实现高效的查询,技术成熟,有专业公司的技术支持。
劣势:可扩展性较差,无法较好支持海量数据存储,数据模型过于死板、无法较好支持Web2.0应用,事务机制影响了系统的整体性能等。
(2)NoSQL数据库
优势:可以支持超大规模数据存储,灵活的数据模型可以很好地支持Web2.0应用,具有强大的横向扩展能力等。基础理论为:CAP原则,BASE理论,最终一致性原则
劣势:缺乏数学理论基础,复杂查询性能不高,大多不能实现事务强一致性,很难实现数据完整性,技术尚不成熟,缺乏专业团队的技术支持,维护较困难等。
关系数据库和NoSQL数据库各有优缺点,彼此无法取代
- 关系数据库应用场景:电信、银行等领域的关键业务系统,需要保证强事务一致性。
- NoSQL数据库应用场景:互联网企业、传统企业的非关键业务(比如数据分析)。
采用混合架构
- 案例:亚马逊公司就使用不同类型的数据库来支撑它的电子商务应用
- 对于“购物篮”这种临时性数据,采用键值存储会更加高效
- 当前的产品和订单信息则适合存放在关系数据库中
- 大量的历史订单信息则适合保存在类似MongoDB的文档数据库中
传统关系数据库ACID特性
Redis部分:
用redis做数据缓存:
redis存储在内存中,读取效率高
1、保证读取的高效性,接近每秒钟十万次的吞吐量
2、减少下层持久层数据库读取压力,mongodb每秒近千次读取就已经表示压力山大
3、单进程运行,具备读写的原子性,避免并发导致脏读等问题
用redis做购物车
支持丰富的数据类型,可设置过期时间注重时效性,支持事务原子性,结构简单,可以存储一个或者多个属性
核心任务用传统数据库,格式很规整
HBase部分介绍
关系数据库已经流行很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?HBASE与HDFS对比:
HBase特点
- HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳。
- 每个值是一个未经解释的字符串,没有数据类型。
- 用户在表中存储数据,每一行都有一个可排序的行键和任意多的列。
- 表在水平方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起。
- 列族支持动态扩展,可以很轻松地添加一个列族或列,无需预先定义列的数量以及类型,所有列均以字符串形式存储,用户需要自行进行数据类型转换。
- HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留(这是和HDFS只允许追加不允许修改的特性相关的)
HBase特性:
(1)伸缩性强。
(2)自动分区。当表增长时,表会自动分裂成Region,并分布到可用节点上。
(3)支持线性扩展和对新节点的自动处理。
(4)支持普通商用硬件。
(5)容错能力强。HBase构建在Hadoop的文件系统之上,充分利用了Hadoop文件系统(HDFS)提供的容错能力。
(6)检索性能强
“海面多稀易高”
海量存储,面向列,多版本,稀疏性,易扩展,高可靠性
HBase布局
HBase的三层结构中各层次的名称和作用
HRegionServer部分的详细图解:
Store是Region服务器的核心;
多个StoreFile合并成一个;
单个StoreFile过大时,又触发分裂操作,1个父Region被分裂成两个子Region。
StoreFile的合并和分裂过程
HBase操作小结
更多推荐
所有评论(0)