SQL Server核心知识总结

SQL Server核心知识总结

🎯 本文总结了SQL Server核心知识点,每个主题都提供实际可运行的示例代码。

一、SQL Server基础精要

1. 数据库核心操作

sql 复制代码
-- 1. 创建数据库(核心配置)
CREATE DATABASE 学生管理系统
ON PRIMARY
(
    NAME = '学生管理系统_数据',
    FILENAME = 'D:\Data\学生管理系统.mdf',
    SIZE = 100MB,
    FILEGROWTH = 100MB
)
LOG ON
(
    NAME = '学生管理系统_日志',
    FILENAME = 'D:\Data\学生管理系统.ldf',
    SIZE = 50MB,
    FILEGROWTH = 50MB
);
GO

-- 2. 创建核心表结构
CREATE TABLE 学生表
(
    学号 CHAR(10) PRIMARY KEY,           -- 主键(最重要)
    姓名 NVARCHAR(20) NOT NULL,         -- 必填字段
    性别 CHAR(2),
    出生日期 DATE,
    班级 NVARCHAR(20)
);

CREATE TABLE 成绩表
(
    ID INT IDENTITY(1,1) PRIMARY KEY,    -- 自增主键
    学号 CHAR(10),
    课程号 CHAR(5),
    成绩 DECIMAL(5,2),
    CONSTRAINT FK_成绩表_学生表 
        FOREIGN KEY (学号) REFERENCES 学生表(学号)  -- 外键关系
);

-- 3. 基本数据操作(最常用)
-- 插入数据
INSERT INTO 学生表 (学号, 姓名, 性别, 班级)
VALUES ('2021001', '张三', '男', '计算机1班');

-- 更新数据
UPDATE 学生表 
SET 班级 = '计算机2班'
WHERE 学号 = '2021001';

-- 删除数据
DELETE FROM 学生表 
WHERE 学号 = '2021001';

🔑 核心要点

  1. 数据库设计三要素:

    • 主数据文件(.mdf):存储数据
    • 日志文件(.ldf):记录事务
    • 合理的初始大小和增长设置
  2. 表设计核心原则:

    • 必须有主键(唯一标识)
    • 建立合适的外键关系
    • 选择合适的数据类型
    • 添加必要的约束
  3. 最常用的SQL操作:

    • INSERT:添加数据
    • UPDATE:修改数据
    • DELETE:删除数据

2. 数据类型和查询

让我们学习最常用的数据类型和SELECT查询:

sql 复制代码
-- 1. 最常用数据类型示例
CREATE TABLE 数据类型示例
(
    -- 整数类型(最常用)
    ID INT IDENTITY(1,1),         -- 自增整数,常用主键
    数量 SMALLINT,               -- 较小范围整数
    
    -- 精确数值(金融计算必用)
    金额 DECIMAL(12,2),          -- 总12位,小数2位
    单价 MONEY,                  -- 专用于金融计算
    
    -- 字符串(最常用)
    名称 NVARCHAR(50),           -- Unicode变长,最常用
    编号 CHAR(10),              -- 定长,如学号工号等
    描述 VARCHAR(MAX),          -- 大文本数据
    
    -- 日期时间(最常用)
    创建日期 DATE,               -- 仅日期
    更新时间 DATETIME2           -- 日期时间,推荐使用
);

-- 2. 核心查询语句
-- 基础查询(最常用)
SELECT 学号, 姓名, 成绩
FROM 学生表
WHERE 班级 = '计算机1班'
ORDER BY 成绩 DESC;

-- 多表联接(重要)
SELECT s.姓名, c.课程名, g.成绩
FROM 学生表 s
INNER JOIN 成绩表 g ON s.学号 = g.学号
INNER JOIN 课程表 c ON g.课程号 = c.课程号
WHERE g.成绩 >= 60;

-- 分组统计(常用)
SELECT 班级, 
       COUNT(*) AS 人数,
       AVG(成绩) AS 平均分,
       MAX(成绩) AS 最高分
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
GROUP BY 班级
HAVING AVG(成绩) >= 60;

-- 子查询(重要)
SELECT 姓名, 成绩
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
WHERE 成绩 > (
    SELECT AVG(成绩)
    FROM 成绩表
);

📝 查询要点

  1. SELECT语句核心组成(按执行顺序):

    • FROM:指定数据来源
    • WHERE:行级过滤
    • GROUP BY:分组
    • HAVING:组级过滤
    • ORDER BY:排序
  2. 常用联接类型:

    • INNER JOIN:内联接(最常用)
    • LEFT JOIN:左外联接(保留左表所有行)
    • RIGHT JOIN:右外联接(保留右表所有行)
  3. 常用聚合函数:

    • COUNT():计数
    • SUM():求和
    • AVG():平均值
    • MAX()/MIN():最大/最小值
  4. 性能优化要点:

    • 只查询需要的列
    • 合理使用索引
    • 避免SELECT *
    • 适当使用WHERE条件

3. 索引和性能优化

让我们学习最核心的性能优化技术:

sql 复制代码
-- 1. 创建最常用的索引类型
-- 聚集索引(主键,每表仅一个)
CREATE TABLE 订单表
(
    订单号 INT PRIMARY KEY,  -- 自动创建聚集索引
    客户ID INT,
    订单日期 DATE,
    总金额 DECIMAL(12,2)
);

-- 非聚集索引(最常用的查询优化方式)
CREATE NONCLUSTERED INDEX IX_订单表_客户ID
ON 订单表(客户ID);

-- 覆盖索引(包含所有需要的列)
CREATE NONCLUSTERED INDEX IX_订单表_日期_金额
ON 订单表(订单日期)
INCLUDE (总金额);

-- 2. 查看索引使用情况
-- 查看索引的使用统计
SELECT 
    OBJECT_NAME(i.object_id) AS 表名,
    i.name AS 索引名,
    ius.user_seeks + ius.user_scans AS 使用次数,
    ius.last_user_seek AS 最后查询时间
FROM sys.dm_db_index_usage_stats ius
JOIN sys.indexes i ON ius.object_id = i.object_id 
    AND ius.index_id = i.index_id
WHERE database_id = DB_ID();

-- 3. 性能诊断(最常用)
-- 查看执行计划
SET STATISTICS IO ON;
SET STATISTICS TIME ON;
GO

-- 慢查询示例
SELECT * FROM 订单表 
WHERE 订单日期 BETWEEN '2024-01-01' AND '2024-01-31';

-- 优化后的查询
SELECT 订单号, 订单日期, 总金额 
FROM 订单表 WITH(INDEX(IX_订单表_日期_金额))
WHERE 订单日期 BETWEEN '2024-01-01' AND '2024-01-31';

🚀 性能优化核心要点

  1. 索引使用原则:

    • 经常查询的列建立索引
    • 外键列必建索引
    • 避免对频繁更新的列建索引
    • 选择性高的列适合建索引
  2. 最重要的优化技巧:

    • 使用覆盖索引避免回表
    • 避免索引列上使用函数
    • 避免隐式类型转换
    • 合理使用索引提示
  3. 常见性能问题:

    • 索引碎片化:定期重建或重组
    • 统计信息过期:更新统计信息
    • 参数嗅探:使用OPTIMIZE FOR
    • 死锁:合理的事务处理
  4. 性能监控工具:

    • 执行计划
    • STATISTICS IO/TIME
    • sys.dm_db_index_usage_stats
    • 数据库引擎优化顾问

4. 事务和并发控制

让我们学习如何保证数据的一致性:

sql 复制代码
-- 1. 基本事务处理(最常用)
-- 转账示例
BEGIN TRY
    BEGIN TRANSACTION;
        -- 从账户A扣款
        UPDATE 账户表
        SET 余额 = 余额 - 1000
        WHERE 账户ID = 'A';
        
        -- 给账户B存款
        UPDATE 账户表
        SET 余额 = 余额 + 1000
        WHERE 账户ID = 'B';
        
        -- 记录交易日志
        INSERT INTO 交易日志(交易类型, 金额, 时间)
        VALUES ('转账', 1000, GETDATE());
    COMMIT TRANSACTION;
END TRY
BEGIN CATCH
    ROLLBACK TRANSACTION;
    INSERT INTO 错误日志(错误信息, 时间)
    VALUES (ERROR_MESSAGE(), GETDATE());
END CATCH;

-- 2. 事务隔离级别(重要)
-- 设置隔离级别
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;

-- 处理并发访问
BEGIN TRANSACTION;
    -- 使用锁提示
    SELECT * FROM 订单表 WITH (UPDLOCK, ROWLOCK)
    WHERE 订单号 = '001';
    
    -- 更新订单
    UPDATE 订单表
    SET 状态 = '已处理'
    WHERE 订单号 = '001';
COMMIT TRANSACTION;

-- 3. 死锁处理(常见问题)
-- 设置死锁优先级
SET DEADLOCK_PRIORITY HIGH;

-- 使用表锁提示避免死锁
UPDATE 订单表 WITH (ROWLOCK)
SET 状态 = '处理中'
WHERE 订单号 = '001';

-- 4. 并发控制最佳实践
-- 使用乐观并发控制
CREATE TABLE 商品表
(
    商品ID INT PRIMARY KEY,
    名称 NVARCHAR(50),
    库存 INT,
    版本号 ROWVERSION  -- 用于乐观并发控制
);

-- 乐观并发更新示例
UPDATE 商品表
SET 库存 = 库存 - 1
WHERE 商品ID = 1 
AND 版本号 = @原版本号;  -- 确保数据未被其他事务修改

🔒 事务管理核心要点

  1. 事务ACID特性:

    • 原子性:要么全做要么全不做
    • 一致性:保持数据完整
    • 隔离性:事务间互不干扰
    • 持久性:提交后永久保存
  2. 最常用的隔离级别:

    • READ COMMITTED(默认):防止脏读
    • REPEATABLE READ:防止不可重复读
    • SERIALIZABLE:最高隔离级别
    • READ UNCOMMITTED:性能最好但不安全
  3. 并发控制策略:

    • 悲观锁:适用于高并发更新
    • 乐观锁:适用于读多写少
    • 行级锁:粒度小,并发高
    • 表级锁:粒度大,阻塞多
  4. 实践建议:

    • 事务尽可能短小
    • 合理设置隔离级别
    • 避免长时间持有锁
    • 正确的错误处理

5. 备份和恢复

让我们学习如何保护数据安全:

sql 复制代码
-- 1. 完整备份(最基础最重要)
-- 创建完整备份
BACKUP DATABASE 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Full.bak'
WITH 
    COMPRESSION,                 -- 启用压缩
    CHECKSUM,                   -- 验证备份完整性
    DESCRIPTION = '完整备份';    -- 备份描述

-- 2. 差异备份(节省空间和时间)
BACKUP DATABASE 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Diff.bak'
WITH 
    DIFFERENTIAL,               -- 差异备份
    COMPRESSION;

-- 3. 日志备份(保证时间点恢复)
BACKUP LOG 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Log.bak'
WITH COMPRESSION;

-- 4. 数据库恢复(最常用场景)
-- 完整恢复
RESTORE DATABASE 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Full.bak'
WITH NORECOVERY;  -- 允许继续还原其他备份

-- 还原差异备份
RESTORE DATABASE 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Diff.bak'
WITH NORECOVERY;

-- 还原日志备份到指定时间点
RESTORE LOG 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Log.bak'
WITH 
    STOPAT = '2024-01-15 14:30:00',  -- 指定恢复时间点
    RECOVERY;  -- 完成恢复,数据库可用

-- 5. 自动化备份维护(生产环境必备)
-- 清理过期备份文件
DECLARE @cmd NVARCHAR(500);
SET @cmd = 'forfiles /p "D:\Backup" /s /m *.bak /d -30 /c "cmd /c del @path"';
EXEC xp_cmdshell @cmd;

-- 验证备份有效性
RESTORE VERIFYONLY 
FROM DISK = 'D:\Backup\学生管理系统_Full.bak';

💾 备份恢复核心要点

  1. 三种主要备份类型:

    • 完整备份:整个数据库的完整副本
    • 差异备份:自上次完整备份后的变化
    • 日志备份:记录详细的事务日志
  2. 常用备份策略(最佳实践):

    • 每周一次完整备份
    • 每天一次差异备份
    • 每小时一次日志备份
    • 定期验证备份有效性
  3. 关键恢复场景:

    • 系统崩溃:使用最新的一致备份
    • 数据误删:使用时间点恢复
    • 硬件故障:完整恢复流程
    • 测试环境:快速还原生产数据
  4. 备份管理要点:

    • 异地存储重要备份
    • 定期清理过期备份
    • 监控备份执行状态
    • 测试恢复流程

6. 安全管理

让我们学习如何保护数据库安全:

sql 复制代码
-- 1. 用户和角色管理(基础安全)
-- 创建登录名
CREATE LOGIN 教师登录 
WITH PASSWORD = 'P@ssw0rd123',
     CHECK_POLICY = ON;  -- 启用密码策略

-- 创建数据库用户
USE 学生管理系统;
CREATE USER 教师用户 FOR LOGIN 教师登录;

-- 创建角色并分配权限
CREATE ROLE 教师角色;
GRANT SELECT, UPDATE ON 成绩表 TO 教师角色;
GRANT SELECT ON 学生表 TO 教师角色;

-- 将用户添加到角色
ALTER ROLE 教师角色 ADD MEMBER 教师用户;

-- 2. 数据加密(敏感数据保护)
-- 创建主密钥
CREATE MASTER KEY ENCRYPTION 
BY PASSWORD = 'YourStr0ngP@ssw0rd';

-- 创建证书
CREATE CERTIFICATE 学生信息证书
WITH SUBJECT = '学生敏感信息加密证书';

-- 创建加密密钥
CREATE SYMMETRIC KEY 学生信息加密密钥
WITH ALGORITHM = AES_256
ENCRYPTION BY CERTIFICATE 学生信息证书;

-- 加密数据示例
CREATE TABLE 学生敏感信息
(
    学号 CHAR(10) PRIMARY KEY,
    姓名 NVARCHAR(20),
    身份证号 VARBINARY(256),  -- 加密存储
    联系电话 VARBINARY(256)   -- 加密存储
);

-- 插入加密数据
OPEN SYMMETRIC KEY 学生信息加密密钥
DECRYPTION BY CERTIFICATE 学生信息证书;

INSERT INTO 学生敏感信息 
VALUES ('2021001', '张三',
    EncryptByKey(Key_GUID('学生信息加密密钥'), '320123199901011234'),
    EncryptByKey(Key_GUID('学生信息加密密钥'), '13912345678')
);

CLOSE SYMMETRIC KEY 学生信息加密密钥;

-- 3. 审计跟踪(最重要的安全措施)
-- 创建服务器审计
CREATE SERVER AUDIT 数据库审计
TO FILE (FILEPATH = 'D:\Audit\');

-- 创建数据库审计规范
CREATE DATABASE AUDIT SPECIFICATION 学生数据审计
FOR SERVER AUDIT 数据库审计
ADD (SELECT, UPDATE, DELETE ON 学生表 BY PUBLIC),
ADD (SELECT, UPDATE ON 成绩表 BY PUBLIC);

-- 启用审计
ALTER SERVER AUDIT 数据库审计 WITH (STATE = ON);
ALTER DATABASE AUDIT SPECIFICATION 学生数据审计 WITH (STATE = ON);

-- 查看审计日志
SELECT * FROM fn_get_audit_file
('D:\Audit\*', DEFAULT, DEFAULT);

-- 4. 安全最佳实践
-- 定期修改密码
ALTER LOGIN 教师登录 
WITH PASSWORD = 'NewP@ssw0rd456';

-- 禁用不用的账户
ALTER LOGIN 教师登录 DISABLE;

-- 回收不需要的权限
REVOKE UPDATE ON 成绩表 FROM 教师角色;

-- 监控登录失败
SELECT * FROM sys.dm_exec_sessions
WHERE login_time > DATEADD(HOUR, -1, GETDATE())
AND login_name = '教师登录';

🔐 安全管理核心要点

  1. 访问控制基础:

    • 最小权限原则
    • 基于角色的授权
    • 定期审查权限
    • 密码策略管理
  2. 数据加密策略:

    • 敏感数据加密存储
    • 传输数据加密
    • 密钥定期轮换
    • 证书安全管理
  3. 审计要点:

    • 重要操作必须审计
    • 定期检查审计日志
    • 异常行为告警
    • 审计日志安全存储
  4. 安全维护:

    • 定期安全评估
    • 及时安装补丁
    • 监控可疑活动
    • 制定应急预案

二、高级特性

让我们学习SQL Server最常用的高级功能:

1. 存储过程和函数

sql 复制代码
-- 1. 存储过程(最常用的封装方式)
-- 创建成绩统计存储过程
CREATE PROCEDURE sp_统计学生成绩
    @班级 NVARCHAR(20),
    @及格率 DECIMAL(5,2) OUTPUT
AS
BEGIN
    SET NOCOUNT ON;
    
    -- 计算及格率
    SELECT @及格率 = 
        CONVERT(DECIMAL(5,2),
            SUM(CASE WHEN 成绩 >= 60 THEN 1 ELSE 0 END) * 100.0 / 
            COUNT(*))
    FROM 成绩表 g
    JOIN 学生表 s ON g.学号 = s.学号
    WHERE s.班级 = @班级;
    
    -- 返回详细统计
    SELECT 
        COUNT(*) AS 总人数,
        AVG(成绩) AS 平均分,
        MAX(成绩) AS 最高分,
        MIN(成绩) AS 最低分
    FROM 成绩表 g
    JOIN 学生表 s ON g.学号 = s.学号
    WHERE s.班级 = @班级;
END;

-- 调用存储过程
DECLARE @及格率 DECIMAL(5,2);
EXEC sp_统计学生成绩 
    @班级 = '计算机1班',
    @及格率 = @及格率 OUTPUT;
PRINT '及格率: ' + CAST(@及格率 AS VARCHAR(10)) + '%';

-- 2. 自定义函数(常用计算封装)
-- 创建年龄计算函数
CREATE FUNCTION fn_计算年龄
(
    @出生日期 DATE
)
RETURNS INT
AS
BEGIN
    RETURN DATEDIFF(YEAR, @出生日期, GETDATE()) -
        CASE 
            WHEN DATEADD(YEAR, DATEDIFF(YEAR, @出生日期, GETDATE()), @出生日期) > GETDATE()
            THEN 1 
            ELSE 0 
        END;
END;

-- 创建成绩等级函数
CREATE FUNCTION fn_计算等级
(
    @成绩 DECIMAL(5,2)
)
RETURNS CHAR(1)
AS
BEGIN
    RETURN 
        CASE 
            WHEN @成绩 >= 90 THEN 'A'
            WHEN @成绩 >= 80 THEN 'B'
            WHEN @成绩 >= 70 THEN 'C'
            WHEN @成绩 >= 60 THEN 'D'
            ELSE 'F'
        END;
END;

-- 使用函数
SELECT 
    姓名,
    dbo.fn_计算年龄(出生日期) AS 年龄,
    成绩,
    dbo.fn_计算等级(成绩) AS 等级
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号;

📦 存储过程和函数要点

  1. 存储过程优势:

    • 减少网络流量
    • 重用业务逻辑
    • 提高执行效率
    • 增强安全性
  2. 函数使用场景:

    • 复杂计算封装
    • 数据转换处理
    • 业务规则统一
    • 代码重用

2. 触发器

sql 复制代码
-- 1. 数据审计触发器(最常用)
CREATE TRIGGER tr_学生表_审计
ON 学生表
AFTER INSERT, UPDATE, DELETE
AS
BEGIN
    SET NOCOUNT ON;
    
    -- 插入操作审计
    INSERT INTO 审计日志(表名, 操作类型, 操作时间, 操作用户, 数据)
    SELECT 
        '学生表',
        'INSERT',
        GETDATE(),
        SYSTEM_USER,
        (SELECT * FROM inserted FOR JSON AUTO)
    FROM inserted
    WHERE EXISTS (SELECT 1 FROM inserted);
    
    -- 删除操作审计
    INSERT INTO 审计日志(表名, 操作类型, 操作时间, 操作用户, 数据)
    SELECT 
        '学生表',
        'DELETE',
        GETDATE(),
        SYSTEM_USER,
        (SELECT * FROM deleted FOR JSON AUTO)
    FROM deleted
    WHERE EXISTS (SELECT 1 FROM deleted);
END;

-- 2. 业务规则触发器(数据验证)
CREATE TRIGGER tr_成绩表_验证
ON 成绩表
INSTEAD OF INSERT
AS
BEGIN
    SET NOCOUNT ON;
    
    -- 验证成绩范围
    IF EXISTS (
        SELECT 1 FROM inserted 
        WHERE 成绩 < 0 OR 成绩 > 100
    )
    BEGIN
        RAISERROR ('成绩必须在0-100之间', 16, 1);
        RETURN;
    END;
    
    -- 验证通过后插入数据
    INSERT INTO 成绩表(学号, 课程号, 成绩)
    SELECT 学号, 课程号, 成绩
    FROM inserted;
END;

🔄 触发器使用要点

  1. 常用场景:

    • 数据审计跟踪
    • 业务规则验证
    • 数据同步更新
    • 自动计算汇总
  2. 设计原则:

    • 触发器要简单
    • 避免长事务
    • 注意性能影响
    • 合理使用事务

3. 视图

让我们继续学习视图的应用:

sql 复制代码
-- 1. 基础视图(最常用)
-- 创建学生成绩汇总视图
CREATE VIEW v_学生成绩汇总
AS
SELECT 
    s.学号,
    s.姓名,
    s.班级,
    COUNT(g.课程号) AS 课程数,
    AVG(g.成绩) AS 平均分,
    SUM(CASE WHEN g.成绩 >= 60 THEN 1 ELSE 0 END) AS 及格课程数
FROM 学生表 s
LEFT JOIN 成绩表 g ON s.学号 = g.学号
GROUP BY s.学号, s.姓名, s.班级;

-- 2. 带检查选项的视图(数据验证)
CREATE VIEW v_优秀学生
WITH SCHEMABINDING
AS
SELECT 学号, 姓名, 班级, 成绩
FROM dbo.成绩表 g
JOIN dbo.学生表 s ON g.学号 = s.学号
WHERE 成绩 >= 90
WITH CHECK OPTION;

-- 3. 索引视图(提高查询性能)
CREATE VIEW v_课程平均分
WITH SCHEMABINDING
AS
SELECT 
    课程号,
    COUNT_BIG(*) AS 学生数,
    AVG(CONVERT(DECIMAL(5,2), 成绩)) AS 平均分
FROM dbo.成绩表
GROUP BY 课程号;

-- 在视图上创建唯一聚集索引
CREATE UNIQUE CLUSTERED INDEX IX_课程平均分
ON v_课程平均分(课程号);

-- 4. 分区视图(大表分区)
-- 创建分区表
CREATE TABLE 历史成绩表_2023
(
    学号 CHAR(10),
    课程号 CHAR(5),
    成绩 DECIMAL(5,2),
    学年 CHAR(4) CHECK (学年 = '2023')
);

CREATE TABLE 历史成绩表_2024
(
    学号 CHAR(10),
    课程号 CHAR(5),
    成绩 DECIMAL(5,2),
    学年 CHAR(4) CHECK (学年 = '2024')
);

-- 创建分区视图
CREATE VIEW v_历史成绩
AS
SELECT * FROM 历史成绩表_2023
UNION ALL
SELECT * FROM 历史成绩表_2024;

-- 5. 视图的使用示例
-- 查询优秀学生
SELECT * FROM v_优秀学生
WHERE 班级 = '计算机1班'
ORDER BY 成绩 DESC;

-- 更新视图数据
UPDATE v_学生成绩汇总
SET 班级 = '计算机2班'
WHERE 学号 = '2021001';

-- 通过视图插入数据
INSERT INTO v_优秀学生(学号, 姓名, 班级, 成绩)
VALUES ('2021010', '李四', '计算机1班', 95);

👁️ 视图使用要点

  1. 视图的优势:

    • 简化复杂查询
    • 控制数据访问
    • 提供数据独立性
    • 实现数据安全
  2. 常用视图类型:

    • 基础视图:简化查询
    • 索引视图:提升性能
    • 分区视图:管理大数据
    • 更新视图:维护数据
  3. 设计原则:

    • 避免过于复杂的视图
    • 合理使用索引视图
    • 注意更新限制
    • 控制视图嵌套层数
  4. 性能考虑:

    • 适当使用SCHEMABINDING
    • 避免使用SELECT *
    • 合理使用索引
    • 控制视图复杂度

4. XML和JSON

让我们学习如何处理结构化数据:

sql 复制代码
-- 1. XML数据处理(常用于数据交换)
-- 创建包含XML列的表
CREATE TABLE 学生档案
(
    学号 CHAR(10) PRIMARY KEY,
    基本信息 XML,
    成绩记录 XML
);

-- 插入XML数据
INSERT INTO 学生档案(学号, 基本信息)
VALUES (
    '2021001',
    '<学生>
        <姓名>张三</姓名>
        <性别>男</性别>
        <联系方式>
            <电话>13912345678</电话>
            <邮箱>zhangsan@example.com</邮箱>
        </联系方式>
    </学生>'
);

-- 查询XML数据
SELECT 
    学号,
    基本信息.value('(/学生/姓名)[1]', 'NVARCHAR(20)') AS 姓名,
    基本信息.value('(/学生/联系方式/电话)[1]', 'VARCHAR(20)') AS 联系电话
FROM 学生档案;

-- 使用XML索引提高查询性能
CREATE PRIMARY XML INDEX PX_学生档案_基本信息
ON 学生档案(基本信息);

-- 2. JSON数据处理(更现代的选择)
-- 将查询结果转为JSON
SELECT 
    学号,
    姓名,
    班级,
    成绩
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
FOR JSON PATH;

-- 创建包含JSON的表
CREATE TABLE 学生信息扩展
(
    学号 CHAR(10) PRIMARY KEY,
    扩展信息 NVARCHAR(MAX)
    CHECK (ISJSON(扩展信息) = 1)  -- 确保是有效的JSON
);

-- 插入JSON数据
INSERT INTO 学生信息扩展
VALUES (
    '2021001',
    '{
        "兴趣爱好": ["编程", "篮球", "音乐"],
        "获奖记录": [
            {"时间": "2023-06", "奖项": "编程大赛一等奖"},
            {"时间": "2023-12", "奖项": "优秀学生"}
        ],
        "实习经历": {
            "公司": "科技公司",
            "职位": "开发实习生",
            "时间": "2023-07至2023-09"
        }
    }'
);

-- 查询JSON数据
SELECT 
    学号,
    JSON_VALUE(扩展信息, '$.实习经历.公司') AS 实习公司,
    JSON_QUERY(扩展信息, '$.兴趣爱好') AS 兴趣爱好
FROM 学生信息扩展;

-- 3. 结构化数据转换(常用场景)
-- 行转列(XML方式)
SELECT 
    学号,
    姓名,
    (
        SELECT 课程号 AS '@课程', 成绩 AS '@分数'
        FROM 成绩表
        WHERE 学号 = s.学号
        FOR XML PATH('课程'), ROOT('成绩记录')
    ) AS 成绩XML
FROM 学生表 s;

-- 行转列(JSON方式)
SELECT 
    学号,
    姓名,
    (
        SELECT 课程号, 成绩
        FROM 成绩表
        WHERE 学号 = s.学号
        FOR JSON PATH
    ) AS 成绩JSON
FROM 学生表 s;

-- 4. 数据导入导出
-- 导出XML数据
SELECT 学号, 姓名, 班级
FROM 学生表
FOR XML PATH('学生'), ROOT('学生列表');

-- 导出JSON数据
SELECT 学号, 姓名, 班级
FROM 学生表
FOR JSON PATH, ROOT('学生列表');

-- 解析JSON数组
SELECT 
    学号,
    兴趣
FROM 学生信息扩展
CROSS APPLY OPENJSON(扩展信息, '$.兴趣爱好')
    WITH (兴趣 NVARCHAR(50) '$');

📊 结构化数据处理要点

  1. XML使用场景:

    • 数据交换接口
    • 配置文件存储
    • 复杂数据结构
    • 遗留系统集成
  2. JSON优势:

    • 更轻量级的格式
    • 更好的可读性
    • 前后端数据传输
    • 现代API集成
  3. 性能考虑:

    • 适当使用XML索引
    • JSON数据类型验证
    • 避免过大的文档
    • 合理的查询方式
  4. 最佳实践:

    • 选择合适的格式
    • 规范的数据结构
    • 有效的错误处理
    • 定期数据维护

5. 全文检索

让我们学习如何实现高效的文本搜索:

sql 复制代码
-- 1. 全文检索配置(基础设置)
-- 创建全文目录
CREATE FULLTEXT CATALOG 文章目录
WITH ACCENT_SENSITIVITY = OFF
AS DEFAULT;

-- 创建包含大文本的表
CREATE TABLE 文章表
(
    文章ID INT PRIMARY KEY,
    标题 NVARCHAR(200),
    内容 NVARCHAR(MAX),
    作者 NVARCHAR(50),
    发布时间 DATETIME2
);

-- 创建全文索引
CREATE FULLTEXT INDEX ON 文章表
(
    标题 LANGUAGE 2052,  -- 简体中文
    内容 LANGUAGE 2052
)
KEY INDEX PK__文章表__ID
ON 文章目录
WITH CHANGE_TRACKING AUTO;

-- 2. 基本全文搜索(最常用)
-- 简单匹配
SELECT 文章ID, 标题, 作者
FROM 文章表
WHERE CONTAINS(内容, '数据库');

-- 多个关键词(任意匹配)
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, 'SQL OR 数据库');

-- 精确短语匹配
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, '"SQL Server 优化"');

-- 3. 高级搜索功能
-- 近似匹配
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, 'NEAR((数据库, 优化), 10)');

-- 通配符搜索
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, '"SQL*"');

-- 加权搜索
SELECT 文章ID, 标题,
    RANK
FROM 文章表
INNER JOIN CONTAINSTABLE(文章表, (标题, 内容), 
    '数据库 OR 优化',
    LANGUAGE 2052
) AS KEY_TBL
ON 文章表.文章ID = KEY_TBL.[KEY]
ORDER BY RANK DESC;

-- 4. 全文搜索最佳实践
-- 创建复合全文索引
CREATE FULLTEXT INDEX ON 文章表
(
    标题 LANGUAGE 2052 STATISTICAL_SEMANTICS,
    内容 LANGUAGE 2052 STATISTICAL_SEMANTICS,
    作者 LANGUAGE 2052
)
KEY INDEX PK__文章表__ID
ON 文章目录
WITH CHANGE_TRACKING AUTO;

-- 使用停用词
CREATE FULLTEXT STOPLIST 自定义停用词
FROM SYSTEM STOPLIST;

ALTER FULLTEXT STOPLIST 自定义停用词
ADD '的' LANGUAGE 2052;

-- 更新全文索引
ALTER FULLTEXT INDEX ON 文章表
SET STOPLIST 自定义停用词;

-- 5. 性能优化示例
-- 重建全文索引
ALTER FULLTEXT INDEX ON 文章表
START FULL POPULATION;

-- 增量更新
ALTER FULLTEXT INDEX ON 文章表
START INCREMENTAL POPULATION;

-- 查看索引状态
SELECT 
    OBJECT_NAME(object_id) AS 表名,
    FULLTEXTCATALOGPROPERTY('文章目录', 'ItemCount') AS 索引文档数,
    FULLTEXTCATALOGPROPERTY('文章目录', 'PopulateStatus') AS 填充状态
FROM sys.fulltext_indexes
WHERE object_id = OBJECT_ID('文章表');

🔍 全文检索核心要点

  1. 基础配置:

    • 创建全文目录
    • 配置全文索引
    • 设置语言选项
    • 管理停用词
  2. 搜索功能:

    • 简单关键词搜索
    • 精确短语匹配
    • 近似词搜索
    • 加权排序结果
  3. 性能优化:

    • 合理使用索引
    • 定期重建索引
    • 增量更新策略
    • 监控索引状态
  4. 使用建议:

    • 选择合适的列
    • 控制索引大小
    • 优化搜索语句
    • 定期维护索引

以上就是全部内容了,如果各位大佬有任何疑问,欢迎在评论区留言,你的点赞收藏我创作的最大动力!🥰🥰🥰

相关推荐
明矾java2 小时前
MySQL进阶-关联查询优化
数据库·mysql
冰糖码奇朵2 小时前
大数据表高效导入导出解决方案,mysql数据库LOAD DATA命令和INTO OUTFILE命令详解
java·数据库·sql·mysql
迷路的小犀牛2 小时前
【MYSQL数据库异常处理】执行SQL语句报超时异常
数据库·sql·mysql
极限实验室4 小时前
INFINI Labs 产品更新 | Easysearch 增加异步搜索等新特性
数据库
m0_748246874 小时前
maven导入spring框架
数据库·spring·maven
前后相随4 小时前
springboot集成maven多模块开发
数据库·oracle
勘察加熊人5 小时前
fastapi房产销售系统
数据库·lua·fastapi
m0_748254665 小时前
MySQL和SQL server的区别
数据库·mysql
补三补四5 小时前
Yashan DB 实例
数据库·oracle·dba
椰椰椰耶6 小时前
【redis】全局命令set、get、keys
数据库·redis·缓存