【数据库系统】SQL和T-SQL

第四章 SQL

基本内容
系统结构、DDL、DML、视图、数据控制、嵌入式SQL
SQL介绍
- 特点
- 一体化；面向集合操作；非过程化语言；可以单独写，也可以作为嵌入式语言（JDBC）
- 体系结构
数据库存储结构
- 逻辑存储结构
- 面向用户可视化部分
- 物理存储结构
- 存储在磁盘上的文件，包括数据文件和事务日志文件
  - 主数据文件，.mdf
    - 数据库起点，指向数据库中的其他文件
    - 每个数据库有且仅有一个主数据文件
  - 次要数据文件，.ndf
    - 除了主数据文件之外的文件都是次要数据文件
    - 一个数据库科可以包含零个或多个次要数据文件
  - 事务日志文件，.ldg
    - 存储所有事物及每个事务对数据库的修改，用于对数据库的恢复，
    - 每个数据库至少有一个日志文件
数据库主要对象
- 用户创建数据库时仅仅创建了物理文件，逻辑数据库在逻辑角度对数据库进行描述，提供给用户逻辑视图
- 主要对象有：表table，视图view，关系，存储过程procedure，触发器trigger，索引index，约束constrain，规则rule，角色role，用户user，用户定义数据类型，用户自定义函数function
数据库组成
- 系统数据库，用于记录系统信息的数据库
  - master
    - 记录SQL Server的所有系统级信息，还记录其他数据库是否存在，以及这些数据库文件的位置
    - 需要经常备份master数据库，修改后备份一次
  - model
  - 为新建的数据库创建一个模板，在用户执行CREATE DATABASE 自动生成 ， 不可删除
  - msdb
  - 提供程序调度警报和作业及记录操作员使用
  - resource
  - 只读数据库，包含所有系统对象
  - tempdb
  - 保存所有临时表和临时存储过程，每次启动时都重新创建
- 用户数据库
- 示例数据库
数据库数据类型
- 整数类型
  - bigint，8字节
  - int，4字节
  - small，2字节
  - tinyint，1字节
- 浮点数类型
  - real，4字节，可以存储正或负的十进制数
  - float，8字节
  - decimal，小数
  - numeric
- 字符类型
  - char（n），固定长度字符串,1字节，n取值为1~8000
  - varchar（n | max），可变长度字符串
  - text，可变长度字符串
- 日期和时间类型
  - date，3字节，数据格式为"YYYY-MM-DD"
  - time，5字节，据格式为"hh:mm:ss $.nnnnnnn$ "
数据库操作， @面试
- 创建数据库
- 创建模式，创建模式就是创建数据库
- create scheme scheme_name authorization user_name
  - 也可以在创建表的时候，显示指明模式，从而同时创建二者
  - create table STT.student (sno.....)
- 创建表
  - create table student(sno char(6) not null unique, sage int, ssex char(2), cno char(6) not null, constrain c1 check ssex in ('男','女'), constarin pk primary key(sno), constrain fk foreign key (cno));
  - constrain规定了列级（作用域一列）或者表级（作用于整个表）的约束
  - 其中，可以使用创建域来约束域
  - create domain domain_name data_type
- 修改表
  - alter table add 列名类型
  - alter table drop 列名 [cascade | restrict]
  - alter table modify 列名类型
  - 创建约束
    *
    1. 添加主键约束
    - Alter table 表名 add Constraint 主键名 primary key(字段)
    - 1. 添加唯一约束
    - Alter table 表名 add Constraint 约束名 unique(字段)
    - 1. 添加默认约束
    - Alter table 表名 add Constraint 约束名 default（默认内容） for 字段名
    - 1. 添加检查约束
    - Alter table 表名 add Constraint 约束名 check (字段表达)
    - 1. 添加外键约束
    - Alter table 表名 add Constraint 约束名 foreign key(字段) references 表名（字段名）
- 撤销表
  - drop table table_name
- 删除数据，删除一个或多个元组
  - delete from table [where P]
- 插入数据，列名和值一一对应 @面试，没有写到的属性为null
  - 可以省略列名，默认为全部属性且values的值必须按照顺序进行排布。
  - 成批插入数据是把一次子查询的所有结果插入指定表中
  - DBMS在执行插入语句后会自动检查是否破坏了完整性约束
  - insert into table_name(属性列) values(值|子查询)
- 更新数据，主码数据不允许修改 @面试
  - update table_name set 列名 = 表达式|子查询
- 截断表， truncate table table_name
- 删除表的所有行数据
  - 比delete更快，且使用更少的事务和系统资源
  - 操作不可以回滚，delete可以回滚
- 索引
- 一种数据结构，可以提高查询速度，可以在一个表上建立一个或者多个索引
  - 索引的数据结构
    - B树/B+树
    - Hash索引
  - 建立索引
    - 有的DBMS自动创建索引，建立在PK上
    - 也可以由DBA自己建立索引
      - create [unique] index index_name on table_name (列表名)
    - 非聚簇索引
    - 索引存储在一个地方，数据存储在另一个地方，通过指针进行指明
    - 聚簇索引， @面试
    - 数据进行重新排序存储，索引和数据混为一体
      - 一个表只能有一个聚簇索引，但是聚簇索引可以包含多个列
      - 适用于：很少增删；很少对变长列修改
      - 找到一个值后，寻找后续索引可以直接找相邻物理位置，有助于提高查询性能
    - 删除索引
    - drop index index_name
    - 索引选择 @面试
    - 在进行索引选择上应该考虑到空间和时间效率
      - 对某一列进行索引可以提高其查询效率，还可以加快连接
      - 带索引的表会占用更多空间，同时对数据进行插入、更新等操作会有更大的代价
      - 更适合建立索引情况
        
        查询操作多于更新操作
        
        经常出现在where中的属性
    - 索引优化 @面试
      - 在进行查询操作时不要使用非索引列
      - 可以使用多列索引提高效率
      - 优先使用选择性强的索引，即在选择性强的列设置索引
  - DBMS自动维护和使用索引，不需要用户管理
  - 索引失效的情况
    - 对数据进行增删
    - 没有在索引列进行查找
    - 使用like模糊查询
    - 索引列的判断条件是is NULL或is not NULL
- 元组操作
- 针对表中元组的操作
  - 查询select
    - select选中的属性名默认是all，也可以使用distinct来消除重复值
    - select中可以使用四则元素对属性的域进行修改，但是这种修改不会执行到数据库中
    - 执行和编写顺序：join->where->group by->having
    - group by中的属性必须在select中写出
    - 查询语句与关系代数对应关系
      - select------投影
      - where------选择
      - join------连接
  - 聚集函数
    - avg、max、min、sum（对数值类型进行操作）、count（对任意类型操作）
    - 出了count函数，其他都不对null进行操作，即直接忽视null
    - 常常用在having操作中
    - 不能出现在where子句中
  - like模糊查询， @面试
    - % 包含 零个或更多 字符的任意字符串。
    - _（下划线）任何单个字符，如a_b可以是abb，aab，ahb
    - 指定范围（例如 $a-f$ ） 或集合 （例如 $abcdef$ ）内的任何单个字符。
    - $\^$ 不在指定范围（例如 $\^a - f$ ）或集合（例如 $\^abcdef$ ）内的任何单个字符。
    - 实例
      - LIKE '赵%' 将搜索姓赵的人名或者说以汉字'赵' 开头的字符串（如赵刚、赵小刚等）。
      - LIKE '%刚' 将搜索以汉字'刚'结尾的所有字符串（如刘刚、李小刚等）。
      - LIKE '%小%' 将搜索在任何位置包含汉字'小'的所有字符串（如赵小刚、李小刚、山本小郎等）。
      - LIKE '_小刚' 将搜索以汉字"小刚"结尾的所有三个汉字的名称（如李小刚、赵小刚）。
- 集合操作
- 针对整个集合的操作
  - union：并集
  - 如果需要保留重复的元组，需要使用union all
  - intersect：交集
  - except：差集 @面试
  - 以上都是自动去重，若不需要自动去重在后面加上all
  - order语句只能出现在最后
- 嵌套子查询
  - where + 嵌套
    - 集合成员比较where expression (not) in 子查询
    - 非相关子查询 ，子查询与外层无关，只执行一次，效率高
      - 实例
    - 集合之间比较where expression comparison_operator some|any子查询
    - 集合基数where (not) exist 子查询
    - 相关子查询 ，子查询与外层查询有关，依赖于外层查询结果或引用了外层查询
  - from + 嵌套
  - having + 嵌套
  - 可以用嵌套子循环替换and操作和一些自然连接， 优化效率
- 空值操作， @面试
  - SQL中有三种逻辑值：true，false，unknown
  - 任何值（包括null）与null进行 逻辑运算 都会返回unknown
  - null与数值进行运算时，会返回null
  - 在where 和having条件中，unknown会被视作false处理
  - 在check约束中，unknown会被视作true处理
  - 空值判断只可以使用 name (not) is null，可以使用 =，但是最好使用 is，判断条件未必是个单值，如果返回值多个则会出错
  - 聚集函数中，只有count不会忽视null进行操作
- 视图， @面试
- 根据基本表导出，也叫虚表，不存储与内存中
  - 特点
    - 对不同用户提供个性化服务
    - 提高数据库安全性，限制了用户对数据的访问范围
    - 提供了逻辑独立性
    - 不会出现数据冗余，基表中数据发生变化，视图中数据也会变化
    - 不占用存储空间，以定义的方式存储在数据库中，使用时只是执行了查询语句
    - 视图上还可以定义视图
  - 创建视图
  - create view view_name as <子查询> 【with check option】
  - 撤销视图
  - drop view view_name ，删除基表时，视图也会删除
  - 插入视图
  - insert into view_name values('Lee','1000')
  - 修改视图
  - - 最好不使用视图更新，有些视图是无法被更新的，更新视图是基于更新基本表的情况更新的
    - 视图更新约束
      - 只有视图包含基本表得主键时才可以更新
      - 目标列不包含聚集函数
      - 不使用unique和distinct
      - 不包括group by
  - 视图查询
    - 检查视图是否存在
    - 将视图临时实体化，生成临时表，
    - 查询视图转化为查询临时表
    - 查询完毕删除临时表
    - 也可以使用视图消解法，即将对视图得查询语句进行修改，然后转化为对基表得查询语句
- 关系连接join  @连接 第三章关系数据库
  - 内连接 inner join
  - 默认是笛卡尔乘积
    - select * from table1 inner join table2 on condition
    - 等值连接
    - 保留重复列的自然连接，也就是关系数据库运算中的theta连接
    - select * from T_student s inner join T_class c on s.classId <运算符> c.classId
  - 外连接 outer join
  - 默认相当于取并集，分成左外连接和右外连接，left outer join，right outer join
    - 全连接，对于并集中没有的用null填充
  - 自连接self join， @面试
  - select * from table as t1,table as t2
    - 当一个表需要多次使用时使用
  - 交叉连接cross join
  - 就是笛卡尔连接，实际上很少使用
- compute by
  - group by返回的数据集中只保留合计数据，并没有保留原始数据，使用compute by函数可以使得合计数据作为附加项附加到原始数据集的最后
  - compute by前面必须使用order by
- 嵌入式SQL， @面试
  - SQL使用方式
  - 在终端使用得交互式SQL 在高级语言中使用的嵌入式SQL，高级语言称作宿主语言，
  - 实现方式
  - k扩种宿主语言的编译器，使之可以编译SQL语言进行预处理方式
  - 嵌入式SQL在嵌入高级语言时，已经确定，无法更改
- 动态SQL， @面试
  - 传统在高级语言中嵌入SQL（例如JDBC）需要预先编译好语句，虽然可以用占位符但是还是不方便
  - 根据用户输入或者外部条件动态组合的SQL语句，根据不同的需求完成不同的任务
  - 经过预处理和执行阶段
    - 预处理只需要执行一次
    - 多次调用需要多次执行编译
T-SQL，transact SQL， @面试
提供了变量定义，赋值操作，流程控制，函数等语句，供用户使用。标准SQL的非过程性的缺陷
- 数据类型
  - 系统定义数据类型
  - 用户自定义数据类型
  - 用户自定义数据类型是建立在 SQL Server 系统数据类型基础上的
    - 一般情况下，当多个表的列中要存储同样类型的数据，且想确保这些列具有完全相同的数据类型、长度、取值范围和是否等特点时，可使用用户定义数据类型。
    - SQL Server 为用户提供了两种方法来创建自定义数据类型即
      - 使用 SQL ServerManagement Studio 创建用户自定义数据类型
      - 调用系统存储过程 sp_addtype 创建用户自定义数据类型。
      - sp_addtype type_name 系统数据类型
- 常量
  - 整型常量
  - 实型常量
  - 日期型常量
  - 货币常量
- 变量
  - 局部变量（必须先定义后使用）
    - 命名： @ 标识符
    - 定义： declare @标识符类型
    - 赋值
      - set @标识符 = 值
      - select @标识符 = 值
      - set 和select区别
        
        set一次只能赋值一个变量，select一次可以赋值多个变量
        
        set @变量1 = value1
        
        set @变量2 = value2
        
        select @变量1 = value1,@变量2 = value2
        
        当表达式返回多个值时，select会返回最后一个，而set会报错
        
        set @变量 = (select 属性 from 表)（报错）
        
        select @变量 = 属性 from 表
        
        当表达式返回空值时， set会赋空值，select则保持不变
        
        set @变量 = (select 属性 from 表)（报错）
        
        select @变量 = 属性 from 表
        
        使用标量子查询时，如果无返回值，SET和SELECT一样，都将置为NULL
    - 用途：函数和存储过程参数，局部使用，供用户使用
    - 强制转化操作
    - cast @ 变量 as type
    - 初始化为null
  - 全局变量
    - 命名@@标识符
    - 常见的由系统提供，存储系统的信息
- 流程控制
- 流程控制和程序设计语言中的流程控制类似，是SQL提供给用户用于改变语句执行顺序的控制语句
  - begin and相当于程序设计语言中的一个语句块，{ }
  - 批处理中的语句一旦出现错误，和事务一样，一句也不执行
- 函数
- T-SQL提供了很多内置函数
  - 字符串函数
  - 数学函数
  - 时间和日期函数
    - DATENAME(YYYY,GETDATE()) 返回日期中某部分字符串
    - DATEPART(MM,GETDATE()) 返回日期中某部分数据
    - DATEADD(datepart,number,date) 在一个日期格式上增加间隔，返回值还是日期值
    - DATEDIFF(datepart,startdate,enddate) 计算两个日期的间隔
    - GETDATE() 获取当前的日期
  - 用户自定义函数
    - create function 【database_name】 function_name
    - （【@参数名参数类型】）
    - returns **参数数据类型**
    - as
    - begin
      - function body
      - return **返回参数**
    - end
  - 使用函数
  - select @变量 = **database.函数名(参数)**
- 游标
- 从包含多条数据记录的结果集中返回一条记录，每次处理一行或一部分行
  - 可以被视作一个指针，可以指向结果集中的任意一个位置并对其进行处理,
  - 使用过程：声明游标-》打开游标-》检索游标-》关闭游标-》释放游标
  - 声明游标
  - declare 游标名 cursor for select语句
  - 打开游标
  - open 游标名
  - 检索游标
  - fetch【next | prior | first | last | 】from 游标名 into 变量名称
  - 检查游标，是否有更多行可以提取，使用系统变量 @@FTECH_STATUS
    - WHILE @@FTECH_STATUS = 0
    - BEGIN
      - FETCH [NEXT | PRIOR | FIRST | LAST] FROM 游标名 into 变量名称
    - END
  - 关闭游标，删除游标
  - clsoe 游标名；deallocate 游标名；
    - 关闭游标并释放资源，关闭了的游标与原来的查询结果集不再关联，可以被再次打开与新的结果集进行关联
  - 游标系统变量
    - @@CURSOR_ROWS 表示当前打开的游标中存在的记录数量。
    - @@FETCH_STATUS 返回被 FETCH 语句执行的最后游标的状态
- 存储过程和触发器
  - 存储过程
  - 是SQL中的一种对象，封装了可重用的模块和子程序，可以接受、输出参数，返回单个或多个结果集以及返回值
    - 存储过程经数据库编译后存储在数据库服务端，应用程序只需要调用一次代码便可以执行存储过程的所有代码，类似于程序设计语言中的函数
    - 优点
      - 执行前已经存储在数据库中，比起函数有更好的性能
      - 用户不用访问数据库的数据和对象
      - 提供了安全性机制
      - 减少了网络通信量，用户只需要执行存储过程即可，存储过程内大量的代码已经在服务器中存储
    - 分类
      - 系统存储过程：用于完成某些特殊的功能，以sp_开头
      - 用户自定义存储过程
    - 创建存储过程
    - 执行存储过程
    - EXEC procedure_name 参数
  - 触发器， @面试
  - 是一种特殊的存储过程 ，和数据库架构和表紧密关联，当数据库架构发生变化或表的结构发生变化（增、删、修改）时，触发器自动运行，一个表可以有多个触发器
    - 创建触发器
      - 实现设置好：触发器名称、触发器关联的表、触发器触发的时间、触发器触发执行的操作的类型（uupdate、delete、insert）、触发器触发后执行的语句
    - 分类
      - update触发器：检查修改操作是否符合要求
      - insert触发器：检查插入操作是否符合要求
      - delete触发器：用作级联删除和记录外键的删除操作
      - delete触发器不会被截断表truncate触发
    - 原理
      - 触发器创建时会创建两个表， deleted和inserted表，他们都是 临时表 ，DBMS会自动管理这些临时表， 触发器完成后自动删除 @面试
      - deleted表中存储的是被delete操作和update操作影响的数据，在从原表中操作后会自动记录一份副本到deleted表中
      - inserted表中存储的是inserted操作和update操作中受影响的数据，插入后会自动存一份副本到inserted表中
    - 创建触发器
    - 触发器性能考虑
      - 触发器执行的语句尽量简单
      - 触发器执行速度快，因为deleted和inserted表都在缓存中
      - 尽量减少触发器中ROLLBACK语句使用，系统开销特别大
      - 在使用触发器前最好还是考虑使用check约束