计算机三级 - 数据库技术 - 第十三章 大规模数据库架构 笔记

++第十三章++ ++大规模数据库架构++

内容提要:

  1. 了解分布式数据库技术
  2. 了解并行数据库技术
  3. 了解云数据库技术
  4. 了解XML数据库技术

13.1 分布式数据库

分布式数据库的目标:【12个目标】

  • 本地自治、非集中式管理、高可用性。(最基本特征)
  • 位置独立性、数据分片独立性、数据复制独立性。(分布透明性)
  • 分布式查询处理、分布式事务管理。(复杂性)
  • 硬件独立性、操作系统独立性、网络独立性。
  • 数据库管理系统独立。(总体体现)

数据分布策略:

  1. 数据分片:【对分片结果的操作】【考虑的是怎样从概念模型到逻辑模型的存储策略】

    • 水平分片----每个分片是原始关系所有数据行的子集合
    • 垂直分片----每个分片是原始关系所有数据列的子集合
    • 导出分片----导出水平分片
    • 混合分片----以上三种的混合
  2. 数据分配:【考虑的是怎样从逻辑模型到物理模型的映射】

    • 解决数据分配的方法:
      • 集中式----所有数据片断安排在一个场地上。
      • 分割式----所有全局数据有且只有一份,分割成若干被分配在特定场地上的片断。
      • 全复制式----全局数据有多个副本,每个场地上有一个完整的数据副本。
      • 混合式----介于分割与全复制式之间。

分布式数据库的参考模式结构:

|----------------------------------------------------------------------------|
| |

分布透明性:

  1. 分片透明性

  2. 位置透明性

  3. 局部数据模型透明性

分布式数据库管理系统:

|----------------------------------------------------------------------------|
| |

分布式数据库的相关技术:

复制代码
  ##### 分布式查询:用户与分布式数库系统的接口。

  * 分布式查询优化需考虑:
    1. 操作执行的顺序。
    2. 操作的执行算法(连接操作和并操作)
    3. 不同场地间的数据流动的顺序。
复制代码
  ##### 分布式事务管理

  * 主要包括:
    1. 恢复控制
       * 基于两阶段的提交协议。
    2. 并发控制
       * 基于封锁协议。

13. 2 并行数据库

并行数据库系统结构

实现并行DBMS的三种硬件结构:

共享内存系统

|----------------------------------------------------------------------------|
| |

共享磁盘系统

|----------------------------------------------------------------------------|
| |

无共享资源系统
层次结构

|----------------------------------------------------------------------------|
| |

二. 数据划分与并行算法

  1. 一维数据划分:将大数据集水平划分到多个磁盘上,可以通过并行读写有效地利用多磁盘的I/O带宽。
    1. 轮转法
    2. 散列法----使用特定的哈希函数,作用于选定的属性,将记录划分到不同的处理机。
    3. 范围划分法
  1. 多维数据划分
    1. CMD多维划分法
    2. BERD多维划分法
    3. MAGIC多维划分法
  2. 并行算法:
    1. 并行排序
    2. 并行连接
      1. 划分连接
      2. 分片--复制连接
    3. 其他的关系操作:
      1. 选择
      2. 消除重复
      3. 投影
      4. 聚集

13. 3 云计算数据库架构

|----------------------------------------------------------------------------|
| |

云计算的服务类型:

|--------------------------------------------------------------------------------------------------------|
| 将基础设施作为服务 将平台作为服务 将基础设施作为服务 |

  • 云:即云计算提供商的数据中心的软硬件设施
  • 云分为:
    1. 公共云:以即用即付的方式提供给公众。
    2. 私有云:不对公众开放的云。
    3. 混合云

|----------------------------------------------------------------------------|
| |

|----------------------------------------------------------------------------|
| |

  • 云数据库与传统数据库比较:

云数据库的缺点:

  1. 数据安全问题
  2. 对云的管理问题
  3. 对因特网的依赖

13. 4 XML 数据库

  1. XML数据库概述:
    • XML ----可扩展标识语言。
    • XML数据库----支持对XML文档格进行存储和查询等操作的数据库管理系统
  • 三种类型的XML数据库:

    1. XEDB----能处理XML的数据
    2. NXD----纯XML数据库
    3. HXD----混合XML数据库
  • 与传统数据库比较,XML数据库的优势:

    1. 能够对半结构化数据进行处理。
    2. 提供对标签和路径的操作。
    3. 能清晰地表达数据的层次特征。

其余章节进我主页进行查看

相关推荐
m0_58875848几秒前
如何解决Oracle启动ORA-00119错误_网络服务名与listener相关性
jvm·数据库·python
PSLoverS1 分钟前
MySQL如何利用防火墙限制MySQL端口_使用iptables或安全组防御
jvm·数据库·python
qq_414256571 分钟前
Go语言如何用strings.Builder_Go语言strings.Builder教程【总结】
jvm·数据库·python
阿坤带你走近大数据4 分钟前
Oracle-表空间temp
数据库·oracle
Navicat中国4 分钟前
数据库事务隔离级别的实践指南
数据库·navicat
马优晨7 分钟前
数据库的连接池、最大连接池会话数目、SQL查询超时时间、连接等待超时时间是什么意思?
数据库·数据连接池·最大连接池会话数目·sql查询超时·连接等待超时
2301_7693406713 分钟前
SQL如何处理分组后的空值统计_善用COALESCE与聚合函数
jvm·数据库·python
2301_7820404516 分钟前
在 Go 语言中声明包级(全局)映射的正确方法
jvm·数据库·python
zh15702317 分钟前
如何在 macOS 中使用 launchd 每分钟执行一次 PHP 脚本
jvm·数据库·python
阿正呀17 分钟前
HTML怎么显示计量值_HTML meter标签应用场景【指南】
jvm·数据库·python