SQL Server核心知识总结
🎯 本文总结了SQL Server核心知识点,每个主题都提供实际可运行的示例代码。
一、SQL Server基础精要
1. 数据库核心操作
sql
-- 1. 创建数据库(核心配置)
CREATE DATABASE 学生管理系统
ON PRIMARY
(
NAME = '学生管理系统_数据',
FILENAME = 'D:\Data\学生管理系统.mdf',
SIZE = 100MB,
FILEGROWTH = 100MB
)
LOG ON
(
NAME = '学生管理系统_日志',
FILENAME = 'D:\Data\学生管理系统.ldf',
SIZE = 50MB,
FILEGROWTH = 50MB
);
GO
-- 2. 创建核心表结构
CREATE TABLE 学生表
(
学号 CHAR(10) PRIMARY KEY, -- 主键(最重要)
姓名 NVARCHAR(20) NOT NULL, -- 必填字段
性别 CHAR(2),
出生日期 DATE,
班级 NVARCHAR(20)
);
CREATE TABLE 成绩表
(
ID INT IDENTITY(1,1) PRIMARY KEY, -- 自增主键
学号 CHAR(10),
课程号 CHAR(5),
成绩 DECIMAL(5,2),
CONSTRAINT FK_成绩表_学生表
FOREIGN KEY (学号) REFERENCES 学生表(学号) -- 外键关系
);
-- 3. 基本数据操作(最常用)
-- 插入数据
INSERT INTO 学生表 (学号, 姓名, 性别, 班级)
VALUES ('2021001', '张三', '男', '计算机1班');
-- 更新数据
UPDATE 学生表
SET 班级 = '计算机2班'
WHERE 学号 = '2021001';
-- 删除数据
DELETE FROM 学生表
WHERE 学号 = '2021001';
🔑 核心要点:
-
数据库设计三要素:
- 主数据文件(.mdf):存储数据
- 日志文件(.ldf):记录事务
- 合理的初始大小和增长设置
-
表设计核心原则:
- 必须有主键(唯一标识)
- 建立合适的外键关系
- 选择合适的数据类型
- 添加必要的约束
-
最常用的SQL操作:
- INSERT:添加数据
- UPDATE:修改数据
- DELETE:删除数据
2. 数据类型和查询
让我们学习最常用的数据类型和SELECT查询:
sql
-- 1. 最常用数据类型示例
CREATE TABLE 数据类型示例
(
-- 整数类型(最常用)
ID INT IDENTITY(1,1), -- 自增整数,常用主键
数量 SMALLINT, -- 较小范围整数
-- 精确数值(金融计算必用)
金额 DECIMAL(12,2), -- 总12位,小数2位
单价 MONEY, -- 专用于金融计算
-- 字符串(最常用)
名称 NVARCHAR(50), -- Unicode变长,最常用
编号 CHAR(10), -- 定长,如学号工号等
描述 VARCHAR(MAX), -- 大文本数据
-- 日期时间(最常用)
创建日期 DATE, -- 仅日期
更新时间 DATETIME2 -- 日期时间,推荐使用
);
-- 2. 核心查询语句
-- 基础查询(最常用)
SELECT 学号, 姓名, 成绩
FROM 学生表
WHERE 班级 = '计算机1班'
ORDER BY 成绩 DESC;
-- 多表联接(重要)
SELECT s.姓名, c.课程名, g.成绩
FROM 学生表 s
INNER JOIN 成绩表 g ON s.学号 = g.学号
INNER JOIN 课程表 c ON g.课程号 = c.课程号
WHERE g.成绩 >= 60;
-- 分组统计(常用)
SELECT 班级,
COUNT(*) AS 人数,
AVG(成绩) AS 平均分,
MAX(成绩) AS 最高分
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
GROUP BY 班级
HAVING AVG(成绩) >= 60;
-- 子查询(重要)
SELECT 姓名, 成绩
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
WHERE 成绩 > (
SELECT AVG(成绩)
FROM 成绩表
);
📝 查询要点:
-
SELECT语句核心组成(按执行顺序):
- FROM:指定数据来源
- WHERE:行级过滤
- GROUP BY:分组
- HAVING:组级过滤
- ORDER BY:排序
-
常用联接类型:
- INNER JOIN:内联接(最常用)
- LEFT JOIN:左外联接(保留左表所有行)
- RIGHT JOIN:右外联接(保留右表所有行)
-
常用聚合函数:
- COUNT():计数
- SUM():求和
- AVG():平均值
- MAX()/MIN():最大/最小值
-
性能优化要点:
- 只查询需要的列
- 合理使用索引
- 避免SELECT *
- 适当使用WHERE条件
3. 索引和性能优化
让我们学习最核心的性能优化技术:
sql
-- 1. 创建最常用的索引类型
-- 聚集索引(主键,每表仅一个)
CREATE TABLE 订单表
(
订单号 INT PRIMARY KEY, -- 自动创建聚集索引
客户ID INT,
订单日期 DATE,
总金额 DECIMAL(12,2)
);
-- 非聚集索引(最常用的查询优化方式)
CREATE NONCLUSTERED INDEX IX_订单表_客户ID
ON 订单表(客户ID);
-- 覆盖索引(包含所有需要的列)
CREATE NONCLUSTERED INDEX IX_订单表_日期_金额
ON 订单表(订单日期)
INCLUDE (总金额);
-- 2. 查看索引使用情况
-- 查看索引的使用统计
SELECT
OBJECT_NAME(i.object_id) AS 表名,
i.name AS 索引名,
ius.user_seeks + ius.user_scans AS 使用次数,
ius.last_user_seek AS 最后查询时间
FROM sys.dm_db_index_usage_stats ius
JOIN sys.indexes i ON ius.object_id = i.object_id
AND ius.index_id = i.index_id
WHERE database_id = DB_ID();
-- 3. 性能诊断(最常用)
-- 查看执行计划
SET STATISTICS IO ON;
SET STATISTICS TIME ON;
GO
-- 慢查询示例
SELECT * FROM 订单表
WHERE 订单日期 BETWEEN '2024-01-01' AND '2024-01-31';
-- 优化后的查询
SELECT 订单号, 订单日期, 总金额
FROM 订单表 WITH(INDEX(IX_订单表_日期_金额))
WHERE 订单日期 BETWEEN '2024-01-01' AND '2024-01-31';
🚀 性能优化核心要点:
-
索引使用原则:
- 经常查询的列建立索引
- 外键列必建索引
- 避免对频繁更新的列建索引
- 选择性高的列适合建索引
-
最重要的优化技巧:
- 使用覆盖索引避免回表
- 避免索引列上使用函数
- 避免隐式类型转换
- 合理使用索引提示
-
常见性能问题:
- 索引碎片化:定期重建或重组
- 统计信息过期:更新统计信息
- 参数嗅探:使用OPTIMIZE FOR
- 死锁:合理的事务处理
-
性能监控工具:
- 执行计划
- STATISTICS IO/TIME
- sys.dm_db_index_usage_stats
- 数据库引擎优化顾问
4. 事务和并发控制
让我们学习如何保证数据的一致性:
sql
-- 1. 基本事务处理(最常用)
-- 转账示例
BEGIN TRY
BEGIN TRANSACTION;
-- 从账户A扣款
UPDATE 账户表
SET 余额 = 余额 - 1000
WHERE 账户ID = 'A';
-- 给账户B存款
UPDATE 账户表
SET 余额 = 余额 + 1000
WHERE 账户ID = 'B';
-- 记录交易日志
INSERT INTO 交易日志(交易类型, 金额, 时间)
VALUES ('转账', 1000, GETDATE());
COMMIT TRANSACTION;
END TRY
BEGIN CATCH
ROLLBACK TRANSACTION;
INSERT INTO 错误日志(错误信息, 时间)
VALUES (ERROR_MESSAGE(), GETDATE());
END CATCH;
-- 2. 事务隔离级别(重要)
-- 设置隔离级别
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
-- 处理并发访问
BEGIN TRANSACTION;
-- 使用锁提示
SELECT * FROM 订单表 WITH (UPDLOCK, ROWLOCK)
WHERE 订单号 = '001';
-- 更新订单
UPDATE 订单表
SET 状态 = '已处理'
WHERE 订单号 = '001';
COMMIT TRANSACTION;
-- 3. 死锁处理(常见问题)
-- 设置死锁优先级
SET DEADLOCK_PRIORITY HIGH;
-- 使用表锁提示避免死锁
UPDATE 订单表 WITH (ROWLOCK)
SET 状态 = '处理中'
WHERE 订单号 = '001';
-- 4. 并发控制最佳实践
-- 使用乐观并发控制
CREATE TABLE 商品表
(
商品ID INT PRIMARY KEY,
名称 NVARCHAR(50),
库存 INT,
版本号 ROWVERSION -- 用于乐观并发控制
);
-- 乐观并发更新示例
UPDATE 商品表
SET 库存 = 库存 - 1
WHERE 商品ID = 1
AND 版本号 = @原版本号; -- 确保数据未被其他事务修改
🔒 事务管理核心要点:
-
事务ACID特性:
- 原子性:要么全做要么全不做
- 一致性:保持数据完整
- 隔离性:事务间互不干扰
- 持久性:提交后永久保存
-
最常用的隔离级别:
- READ COMMITTED(默认):防止脏读
- REPEATABLE READ:防止不可重复读
- SERIALIZABLE:最高隔离级别
- READ UNCOMMITTED:性能最好但不安全
-
并发控制策略:
- 悲观锁:适用于高并发更新
- 乐观锁:适用于读多写少
- 行级锁:粒度小,并发高
- 表级锁:粒度大,阻塞多
-
实践建议:
- 事务尽可能短小
- 合理设置隔离级别
- 避免长时间持有锁
- 正确的错误处理
5. 备份和恢复
让我们学习如何保护数据安全:
sql
-- 1. 完整备份(最基础最重要)
-- 创建完整备份
BACKUP DATABASE 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Full.bak'
WITH
COMPRESSION, -- 启用压缩
CHECKSUM, -- 验证备份完整性
DESCRIPTION = '完整备份'; -- 备份描述
-- 2. 差异备份(节省空间和时间)
BACKUP DATABASE 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Diff.bak'
WITH
DIFFERENTIAL, -- 差异备份
COMPRESSION;
-- 3. 日志备份(保证时间点恢复)
BACKUP LOG 学生管理系统
TO DISK = 'D:\Backup\学生管理系统_Log.bak'
WITH COMPRESSION;
-- 4. 数据库恢复(最常用场景)
-- 完整恢复
RESTORE DATABASE 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Full.bak'
WITH NORECOVERY; -- 允许继续还原其他备份
-- 还原差异备份
RESTORE DATABASE 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Diff.bak'
WITH NORECOVERY;
-- 还原日志备份到指定时间点
RESTORE LOG 学生管理系统
FROM DISK = 'D:\Backup\学生管理系统_Log.bak'
WITH
STOPAT = '2024-01-15 14:30:00', -- 指定恢复时间点
RECOVERY; -- 完成恢复,数据库可用
-- 5. 自动化备份维护(生产环境必备)
-- 清理过期备份文件
DECLARE @cmd NVARCHAR(500);
SET @cmd = 'forfiles /p "D:\Backup" /s /m *.bak /d -30 /c "cmd /c del @path"';
EXEC xp_cmdshell @cmd;
-- 验证备份有效性
RESTORE VERIFYONLY
FROM DISK = 'D:\Backup\学生管理系统_Full.bak';
💾 备份恢复核心要点:
-
三种主要备份类型:
- 完整备份:整个数据库的完整副本
- 差异备份:自上次完整备份后的变化
- 日志备份:记录详细的事务日志
-
常用备份策略(最佳实践):
- 每周一次完整备份
- 每天一次差异备份
- 每小时一次日志备份
- 定期验证备份有效性
-
关键恢复场景:
- 系统崩溃:使用最新的一致备份
- 数据误删:使用时间点恢复
- 硬件故障:完整恢复流程
- 测试环境:快速还原生产数据
-
备份管理要点:
- 异地存储重要备份
- 定期清理过期备份
- 监控备份执行状态
- 测试恢复流程
6. 安全管理
让我们学习如何保护数据库安全:
sql
-- 1. 用户和角色管理(基础安全)
-- 创建登录名
CREATE LOGIN 教师登录
WITH PASSWORD = 'P@ssw0rd123',
CHECK_POLICY = ON; -- 启用密码策略
-- 创建数据库用户
USE 学生管理系统;
CREATE USER 教师用户 FOR LOGIN 教师登录;
-- 创建角色并分配权限
CREATE ROLE 教师角色;
GRANT SELECT, UPDATE ON 成绩表 TO 教师角色;
GRANT SELECT ON 学生表 TO 教师角色;
-- 将用户添加到角色
ALTER ROLE 教师角色 ADD MEMBER 教师用户;
-- 2. 数据加密(敏感数据保护)
-- 创建主密钥
CREATE MASTER KEY ENCRYPTION
BY PASSWORD = 'YourStr0ngP@ssw0rd';
-- 创建证书
CREATE CERTIFICATE 学生信息证书
WITH SUBJECT = '学生敏感信息加密证书';
-- 创建加密密钥
CREATE SYMMETRIC KEY 学生信息加密密钥
WITH ALGORITHM = AES_256
ENCRYPTION BY CERTIFICATE 学生信息证书;
-- 加密数据示例
CREATE TABLE 学生敏感信息
(
学号 CHAR(10) PRIMARY KEY,
姓名 NVARCHAR(20),
身份证号 VARBINARY(256), -- 加密存储
联系电话 VARBINARY(256) -- 加密存储
);
-- 插入加密数据
OPEN SYMMETRIC KEY 学生信息加密密钥
DECRYPTION BY CERTIFICATE 学生信息证书;
INSERT INTO 学生敏感信息
VALUES ('2021001', '张三',
EncryptByKey(Key_GUID('学生信息加密密钥'), '320123199901011234'),
EncryptByKey(Key_GUID('学生信息加密密钥'), '13912345678')
);
CLOSE SYMMETRIC KEY 学生信息加密密钥;
-- 3. 审计跟踪(最重要的安全措施)
-- 创建服务器审计
CREATE SERVER AUDIT 数据库审计
TO FILE (FILEPATH = 'D:\Audit\');
-- 创建数据库审计规范
CREATE DATABASE AUDIT SPECIFICATION 学生数据审计
FOR SERVER AUDIT 数据库审计
ADD (SELECT, UPDATE, DELETE ON 学生表 BY PUBLIC),
ADD (SELECT, UPDATE ON 成绩表 BY PUBLIC);
-- 启用审计
ALTER SERVER AUDIT 数据库审计 WITH (STATE = ON);
ALTER DATABASE AUDIT SPECIFICATION 学生数据审计 WITH (STATE = ON);
-- 查看审计日志
SELECT * FROM fn_get_audit_file
('D:\Audit\*', DEFAULT, DEFAULT);
-- 4. 安全最佳实践
-- 定期修改密码
ALTER LOGIN 教师登录
WITH PASSWORD = 'NewP@ssw0rd456';
-- 禁用不用的账户
ALTER LOGIN 教师登录 DISABLE;
-- 回收不需要的权限
REVOKE UPDATE ON 成绩表 FROM 教师角色;
-- 监控登录失败
SELECT * FROM sys.dm_exec_sessions
WHERE login_time > DATEADD(HOUR, -1, GETDATE())
AND login_name = '教师登录';
🔐 安全管理核心要点:
-
访问控制基础:
- 最小权限原则
- 基于角色的授权
- 定期审查权限
- 密码策略管理
-
数据加密策略:
- 敏感数据加密存储
- 传输数据加密
- 密钥定期轮换
- 证书安全管理
-
审计要点:
- 重要操作必须审计
- 定期检查审计日志
- 异常行为告警
- 审计日志安全存储
-
安全维护:
- 定期安全评估
- 及时安装补丁
- 监控可疑活动
- 制定应急预案
二、高级特性
让我们学习SQL Server最常用的高级功能:
1. 存储过程和函数
sql
-- 1. 存储过程(最常用的封装方式)
-- 创建成绩统计存储过程
CREATE PROCEDURE sp_统计学生成绩
@班级 NVARCHAR(20),
@及格率 DECIMAL(5,2) OUTPUT
AS
BEGIN
SET NOCOUNT ON;
-- 计算及格率
SELECT @及格率 =
CONVERT(DECIMAL(5,2),
SUM(CASE WHEN 成绩 >= 60 THEN 1 ELSE 0 END) * 100.0 /
COUNT(*))
FROM 成绩表 g
JOIN 学生表 s ON g.学号 = s.学号
WHERE s.班级 = @班级;
-- 返回详细统计
SELECT
COUNT(*) AS 总人数,
AVG(成绩) AS 平均分,
MAX(成绩) AS 最高分,
MIN(成绩) AS 最低分
FROM 成绩表 g
JOIN 学生表 s ON g.学号 = s.学号
WHERE s.班级 = @班级;
END;
-- 调用存储过程
DECLARE @及格率 DECIMAL(5,2);
EXEC sp_统计学生成绩
@班级 = '计算机1班',
@及格率 = @及格率 OUTPUT;
PRINT '及格率: ' + CAST(@及格率 AS VARCHAR(10)) + '%';
-- 2. 自定义函数(常用计算封装)
-- 创建年龄计算函数
CREATE FUNCTION fn_计算年龄
(
@出生日期 DATE
)
RETURNS INT
AS
BEGIN
RETURN DATEDIFF(YEAR, @出生日期, GETDATE()) -
CASE
WHEN DATEADD(YEAR, DATEDIFF(YEAR, @出生日期, GETDATE()), @出生日期) > GETDATE()
THEN 1
ELSE 0
END;
END;
-- 创建成绩等级函数
CREATE FUNCTION fn_计算等级
(
@成绩 DECIMAL(5,2)
)
RETURNS CHAR(1)
AS
BEGIN
RETURN
CASE
WHEN @成绩 >= 90 THEN 'A'
WHEN @成绩 >= 80 THEN 'B'
WHEN @成绩 >= 70 THEN 'C'
WHEN @成绩 >= 60 THEN 'D'
ELSE 'F'
END;
END;
-- 使用函数
SELECT
姓名,
dbo.fn_计算年龄(出生日期) AS 年龄,
成绩,
dbo.fn_计算等级(成绩) AS 等级
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号;
📦 存储过程和函数要点:
-
存储过程优势:
- 减少网络流量
- 重用业务逻辑
- 提高执行效率
- 增强安全性
-
函数使用场景:
- 复杂计算封装
- 数据转换处理
- 业务规则统一
- 代码重用
2. 触发器
sql
-- 1. 数据审计触发器(最常用)
CREATE TRIGGER tr_学生表_审计
ON 学生表
AFTER INSERT, UPDATE, DELETE
AS
BEGIN
SET NOCOUNT ON;
-- 插入操作审计
INSERT INTO 审计日志(表名, 操作类型, 操作时间, 操作用户, 数据)
SELECT
'学生表',
'INSERT',
GETDATE(),
SYSTEM_USER,
(SELECT * FROM inserted FOR JSON AUTO)
FROM inserted
WHERE EXISTS (SELECT 1 FROM inserted);
-- 删除操作审计
INSERT INTO 审计日志(表名, 操作类型, 操作时间, 操作用户, 数据)
SELECT
'学生表',
'DELETE',
GETDATE(),
SYSTEM_USER,
(SELECT * FROM deleted FOR JSON AUTO)
FROM deleted
WHERE EXISTS (SELECT 1 FROM deleted);
END;
-- 2. 业务规则触发器(数据验证)
CREATE TRIGGER tr_成绩表_验证
ON 成绩表
INSTEAD OF INSERT
AS
BEGIN
SET NOCOUNT ON;
-- 验证成绩范围
IF EXISTS (
SELECT 1 FROM inserted
WHERE 成绩 < 0 OR 成绩 > 100
)
BEGIN
RAISERROR ('成绩必须在0-100之间', 16, 1);
RETURN;
END;
-- 验证通过后插入数据
INSERT INTO 成绩表(学号, 课程号, 成绩)
SELECT 学号, 课程号, 成绩
FROM inserted;
END;
🔄 触发器使用要点:
-
常用场景:
- 数据审计跟踪
- 业务规则验证
- 数据同步更新
- 自动计算汇总
-
设计原则:
- 触发器要简单
- 避免长事务
- 注意性能影响
- 合理使用事务
3. 视图
让我们继续学习视图的应用:
sql
-- 1. 基础视图(最常用)
-- 创建学生成绩汇总视图
CREATE VIEW v_学生成绩汇总
AS
SELECT
s.学号,
s.姓名,
s.班级,
COUNT(g.课程号) AS 课程数,
AVG(g.成绩) AS 平均分,
SUM(CASE WHEN g.成绩 >= 60 THEN 1 ELSE 0 END) AS 及格课程数
FROM 学生表 s
LEFT JOIN 成绩表 g ON s.学号 = g.学号
GROUP BY s.学号, s.姓名, s.班级;
-- 2. 带检查选项的视图(数据验证)
CREATE VIEW v_优秀学生
WITH SCHEMABINDING
AS
SELECT 学号, 姓名, 班级, 成绩
FROM dbo.成绩表 g
JOIN dbo.学生表 s ON g.学号 = s.学号
WHERE 成绩 >= 90
WITH CHECK OPTION;
-- 3. 索引视图(提高查询性能)
CREATE VIEW v_课程平均分
WITH SCHEMABINDING
AS
SELECT
课程号,
COUNT_BIG(*) AS 学生数,
AVG(CONVERT(DECIMAL(5,2), 成绩)) AS 平均分
FROM dbo.成绩表
GROUP BY 课程号;
-- 在视图上创建唯一聚集索引
CREATE UNIQUE CLUSTERED INDEX IX_课程平均分
ON v_课程平均分(课程号);
-- 4. 分区视图(大表分区)
-- 创建分区表
CREATE TABLE 历史成绩表_2023
(
学号 CHAR(10),
课程号 CHAR(5),
成绩 DECIMAL(5,2),
学年 CHAR(4) CHECK (学年 = '2023')
);
CREATE TABLE 历史成绩表_2024
(
学号 CHAR(10),
课程号 CHAR(5),
成绩 DECIMAL(5,2),
学年 CHAR(4) CHECK (学年 = '2024')
);
-- 创建分区视图
CREATE VIEW v_历史成绩
AS
SELECT * FROM 历史成绩表_2023
UNION ALL
SELECT * FROM 历史成绩表_2024;
-- 5. 视图的使用示例
-- 查询优秀学生
SELECT * FROM v_优秀学生
WHERE 班级 = '计算机1班'
ORDER BY 成绩 DESC;
-- 更新视图数据
UPDATE v_学生成绩汇总
SET 班级 = '计算机2班'
WHERE 学号 = '2021001';
-- 通过视图插入数据
INSERT INTO v_优秀学生(学号, 姓名, 班级, 成绩)
VALUES ('2021010', '李四', '计算机1班', 95);
👁️ 视图使用要点:
-
视图的优势:
- 简化复杂查询
- 控制数据访问
- 提供数据独立性
- 实现数据安全
-
常用视图类型:
- 基础视图:简化查询
- 索引视图:提升性能
- 分区视图:管理大数据
- 更新视图:维护数据
-
设计原则:
- 避免过于复杂的视图
- 合理使用索引视图
- 注意更新限制
- 控制视图嵌套层数
-
性能考虑:
- 适当使用SCHEMABINDING
- 避免使用SELECT *
- 合理使用索引
- 控制视图复杂度
4. XML和JSON
让我们学习如何处理结构化数据:
sql
-- 1. XML数据处理(常用于数据交换)
-- 创建包含XML列的表
CREATE TABLE 学生档案
(
学号 CHAR(10) PRIMARY KEY,
基本信息 XML,
成绩记录 XML
);
-- 插入XML数据
INSERT INTO 学生档案(学号, 基本信息)
VALUES (
'2021001',
'<学生>
<姓名>张三</姓名>
<性别>男</性别>
<联系方式>
<电话>13912345678</电话>
<邮箱>zhangsan@example.com</邮箱>
</联系方式>
</学生>'
);
-- 查询XML数据
SELECT
学号,
基本信息.value('(/学生/姓名)[1]', 'NVARCHAR(20)') AS 姓名,
基本信息.value('(/学生/联系方式/电话)[1]', 'VARCHAR(20)') AS 联系电话
FROM 学生档案;
-- 使用XML索引提高查询性能
CREATE PRIMARY XML INDEX PX_学生档案_基本信息
ON 学生档案(基本信息);
-- 2. JSON数据处理(更现代的选择)
-- 将查询结果转为JSON
SELECT
学号,
姓名,
班级,
成绩
FROM 学生表 s
JOIN 成绩表 g ON s.学号 = g.学号
FOR JSON PATH;
-- 创建包含JSON的表
CREATE TABLE 学生信息扩展
(
学号 CHAR(10) PRIMARY KEY,
扩展信息 NVARCHAR(MAX)
CHECK (ISJSON(扩展信息) = 1) -- 确保是有效的JSON
);
-- 插入JSON数据
INSERT INTO 学生信息扩展
VALUES (
'2021001',
'{
"兴趣爱好": ["编程", "篮球", "音乐"],
"获奖记录": [
{"时间": "2023-06", "奖项": "编程大赛一等奖"},
{"时间": "2023-12", "奖项": "优秀学生"}
],
"实习经历": {
"公司": "科技公司",
"职位": "开发实习生",
"时间": "2023-07至2023-09"
}
}'
);
-- 查询JSON数据
SELECT
学号,
JSON_VALUE(扩展信息, '$.实习经历.公司') AS 实习公司,
JSON_QUERY(扩展信息, '$.兴趣爱好') AS 兴趣爱好
FROM 学生信息扩展;
-- 3. 结构化数据转换(常用场景)
-- 行转列(XML方式)
SELECT
学号,
姓名,
(
SELECT 课程号 AS '@课程', 成绩 AS '@分数'
FROM 成绩表
WHERE 学号 = s.学号
FOR XML PATH('课程'), ROOT('成绩记录')
) AS 成绩XML
FROM 学生表 s;
-- 行转列(JSON方式)
SELECT
学号,
姓名,
(
SELECT 课程号, 成绩
FROM 成绩表
WHERE 学号 = s.学号
FOR JSON PATH
) AS 成绩JSON
FROM 学生表 s;
-- 4. 数据导入导出
-- 导出XML数据
SELECT 学号, 姓名, 班级
FROM 学生表
FOR XML PATH('学生'), ROOT('学生列表');
-- 导出JSON数据
SELECT 学号, 姓名, 班级
FROM 学生表
FOR JSON PATH, ROOT('学生列表');
-- 解析JSON数组
SELECT
学号,
兴趣
FROM 学生信息扩展
CROSS APPLY OPENJSON(扩展信息, '$.兴趣爱好')
WITH (兴趣 NVARCHAR(50) '$');
📊 结构化数据处理要点:
-
XML使用场景:
- 数据交换接口
- 配置文件存储
- 复杂数据结构
- 遗留系统集成
-
JSON优势:
- 更轻量级的格式
- 更好的可读性
- 前后端数据传输
- 现代API集成
-
性能考虑:
- 适当使用XML索引
- JSON数据类型验证
- 避免过大的文档
- 合理的查询方式
-
最佳实践:
- 选择合适的格式
- 规范的数据结构
- 有效的错误处理
- 定期数据维护
5. 全文检索
让我们学习如何实现高效的文本搜索:
sql
-- 1. 全文检索配置(基础设置)
-- 创建全文目录
CREATE FULLTEXT CATALOG 文章目录
WITH ACCENT_SENSITIVITY = OFF
AS DEFAULT;
-- 创建包含大文本的表
CREATE TABLE 文章表
(
文章ID INT PRIMARY KEY,
标题 NVARCHAR(200),
内容 NVARCHAR(MAX),
作者 NVARCHAR(50),
发布时间 DATETIME2
);
-- 创建全文索引
CREATE FULLTEXT INDEX ON 文章表
(
标题 LANGUAGE 2052, -- 简体中文
内容 LANGUAGE 2052
)
KEY INDEX PK__文章表__ID
ON 文章目录
WITH CHANGE_TRACKING AUTO;
-- 2. 基本全文搜索(最常用)
-- 简单匹配
SELECT 文章ID, 标题, 作者
FROM 文章表
WHERE CONTAINS(内容, '数据库');
-- 多个关键词(任意匹配)
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, 'SQL OR 数据库');
-- 精确短语匹配
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, '"SQL Server 优化"');
-- 3. 高级搜索功能
-- 近似匹配
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, 'NEAR((数据库, 优化), 10)');
-- 通配符搜索
SELECT 文章ID, 标题
FROM 文章表
WHERE CONTAINS(内容, '"SQL*"');
-- 加权搜索
SELECT 文章ID, 标题,
RANK
FROM 文章表
INNER JOIN CONTAINSTABLE(文章表, (标题, 内容),
'数据库 OR 优化',
LANGUAGE 2052
) AS KEY_TBL
ON 文章表.文章ID = KEY_TBL.[KEY]
ORDER BY RANK DESC;
-- 4. 全文搜索最佳实践
-- 创建复合全文索引
CREATE FULLTEXT INDEX ON 文章表
(
标题 LANGUAGE 2052 STATISTICAL_SEMANTICS,
内容 LANGUAGE 2052 STATISTICAL_SEMANTICS,
作者 LANGUAGE 2052
)
KEY INDEX PK__文章表__ID
ON 文章目录
WITH CHANGE_TRACKING AUTO;
-- 使用停用词
CREATE FULLTEXT STOPLIST 自定义停用词
FROM SYSTEM STOPLIST;
ALTER FULLTEXT STOPLIST 自定义停用词
ADD '的' LANGUAGE 2052;
-- 更新全文索引
ALTER FULLTEXT INDEX ON 文章表
SET STOPLIST 自定义停用词;
-- 5. 性能优化示例
-- 重建全文索引
ALTER FULLTEXT INDEX ON 文章表
START FULL POPULATION;
-- 增量更新
ALTER FULLTEXT INDEX ON 文章表
START INCREMENTAL POPULATION;
-- 查看索引状态
SELECT
OBJECT_NAME(object_id) AS 表名,
FULLTEXTCATALOGPROPERTY('文章目录', 'ItemCount') AS 索引文档数,
FULLTEXTCATALOGPROPERTY('文章目录', 'PopulateStatus') AS 填充状态
FROM sys.fulltext_indexes
WHERE object_id = OBJECT_ID('文章表');
🔍 全文检索核心要点:
-
基础配置:
- 创建全文目录
- 配置全文索引
- 设置语言选项
- 管理停用词
-
搜索功能:
- 简单关键词搜索
- 精确短语匹配
- 近似词搜索
- 加权排序结果
-
性能优化:
- 合理使用索引
- 定期重建索引
- 增量更新策略
- 监控索引状态
-
使用建议:
- 选择合适的列
- 控制索引大小
- 优化搜索语句
- 定期维护索引
以上就是全部内容了,如果各位大佬有任何疑问,欢迎在评论区留言,你的点赞收藏我创作的最大动力!🥰🥰🥰