前端工程师应该掌握的数据库知识

本文整理了作为前端工程师，应该了解一些数据库系统的知识；这些知识和web息息相关，在一定程度上代表着web的发展方向。

1. ORM - Object Relation Mapping

在关系型数据库和对象之间做一个映射，这样在具体的操作数据库的时候，就不需要再去和复杂的SQL语句打交道，只要像平时操作对象一样操作即可
这种映射能能够成功的原理在于：面向对象编程把所有实体看成对象，关系型数据库则是采用实体之间的关系来连接数据。所以实体之间的关系也可以通过对象来表达，这样的话就可以使用面向对象编程来操作关系型数据库。
ORM映射前后：1. table --> class 2. record --> object 3. field --> attribute
ORM的优点：降低了学习和开发成本；程序员可以不用再写SQL来进行数据库操作了；减少程序的代码量；降低由于书写的SQL代码质量差带来的影响。
ORM的缺点：不太容易处理复杂的查询语句；性能较直接使用SQL差。

常见的数据库可以分成下面几类：关系型数据库、NoSQL、内存数据库

关系型数据库：建立在关系模型基础上的数据库，借助集合代数等数学海联和方法来处理数据库中的数据，显示世界中的各种实体以及实体之间的各种联系均可以用关系模型来表示。关系型数据库是由多张互相联接的二维行列表格组成的数据库。
NoSQL: 本意是Not only SQL，被用来泛指非关系型数据库。其产生的目的就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题，包括超大规模数据的存储。
内存数据库：将数据库整体存储在内从中，提高性能。

常见的缓存技术分成两种，一个是MemCache，一个是Redis。

MemCache: 是一个高性能的分布式的内存对象缓存系统，用于动态web应用以减轻数据库负载。通过在内存里维护一个同一个巨大的hash表，它能够用来存储各种格式的数据。
Redis: 是一个开源的，使用ANSI C语言编写、支持网络，可基于内存亦可以持久化的日志型、k-v数据库，并提供多种语言的API。
二者的差异：
- 都是放在内存中，都是内存型数据库，都支持k-v数据类型；但是MemCache还支持其它类型的数据。
- Redis将一些很久没有用到的数据交换到磁盘中，也就是说并不是将数据一种存储在内存中的。
- Redis支持更多的数据库的特性，例如对事务的支持；从这一点来说，Redis更像是一个数据库，而MemCache只是一张大的哈希表。

数据库名称	主要数据类型	读写性能	存储容量	可靠性
内存数据库	k-v	内存读写，性能高	容量受限	可靠性低，恢复机制复杂
关系型数据库	关系模式	外存读写，性能低	容量大	内建恢复机制，可靠性高

数据库名称	设计难度	数据冗余程度	数据架构	应用扩展性
文件系统	难度较小	同一数据可能在多个文件中重复，冗余度大	以应用为中心	可扩展性低
关系型数据库	难度较大	有不同范式规范，冗余小	以数据库为中心	可扩展性高

并发控制中的三个常见问题：丢失更新、不可重复读、读脏数据

分布式数据库是由一组数据组成的，这组数据分布在计算机网络的不同的计算机上，网络中的每个结点都具有独立处理的能力，即场地自治。同时每一个结点也能通过网络通信子系统执行全局应用。分布式数据库系统实在集中式数据库系统技术的基础之上发展卡来的，具有以下的特点：

数据仓库集成是把种来源的数据集中在一起，建立数据仓库，所有数据都驻留在单个数据库服务器上，配置大型处理器和存储容量，其特点是：

BI系统主要包括：数据预处理，建立数据仓库，数据分析和数据表现四个主要阶段

分布式存储方案
- 主从
- cluster
集群切片方式
- 客户端切片：即通过key就可以确定value由哪个数据库服务器提供
- key经过散列得到slot，根据slot确定value由哪个数据库服务器提供