专转本计算机(三天后权限改为vip)
第一部分:计算机基础知识
计算机发展与分类
发展历程
- 四代计算机特征对比
您提供的表格内容总体准确,结构清晰。仅对个别细节进行优化,使其在时间表述和技术特点上更为精确。
| 代际 | 时间范围 | 核心元件 | 代表技术 | 主要特点 | 标志性成果 |
|---|---|---|---|---|---|
| 第一代 | 1940s中后期-1950s中期 | 电子管 | 机器语言、汇编语言 | 体积庞大、功耗极高、发热量大、速度慢(每秒数千次)、可靠性低、成本高昂 | ENIAC(世界上第一台通用电子计算机) |
| 第二代 | 1950s中期-1960s中期 | 晶体管 | 高级语言(如FORTRAN、COBOL)、监控程序(操作系统雏形) | 体积、功耗、发热显著减小,速度提升(每秒数十万次),可靠性提高,开始用于商业与科学计算 | IBM 7090、CDC 1604等大型晶体管计算机 |
| 第三代 | 1960s中期-1970s早期 | 中小规模集成电路 | 操作系统成熟(多道、分时)、高级语言普及、微程序技术 | 小型化、功耗进一步降低,计算能力大幅增强(每秒百万次),可靠性高,软件产业兴起 | IBM System/360系列(确立了兼容性概念) |
| 第四代 | 1970s早期-至今 | (超)大规模集成电路 | 微处理器、个人计算机、图形用户界面、互联网、人工智能 | 高度集成化、体积微型化、成本极低、性能按指数级增长(摩尔定律),普及至个人与社会方方面面 | 个人电脑(PC) (如IBM PC)、智能手机 、云计算基础设施 |
- 未来发展趋势:量子计算(量子比特存储数据,并行计算能力突破)、生物计算(基于生物分子的计算模式)、光子计算(利用光信号传输和处理数据)、边缘计算(靠近数据源头的分布式计算)
计算机分类
-
按用途:通用计算机(个人电脑、服务器、工作站)、专用计算机(工业控制计算机、航天测控计算机、医疗专用设备)
-
按规模:巨型机(超级计算机,用于气象预测、核模拟)、大型机(企业级数据处理,如银行核心系统)、小型机(部门级应用)、微型机(个人计算机、笔记本、平板)
计算机中信息的表示
数制转换
-
基本数制:二进制(0-1,计算机唯一能直接识别)、十进制(0-9,人类常用)、八进制(0-7,二进制的缩写形式)、十六进制(0-9,A-F,二进制的紧凑表示)
-
转换规则:
-
十进制→二进制:除 2 取余法(整数部分,逆序取余)、乘 2 取整法(小数部分,顺序取整),例:(13.25)₁₀=(1101.01)₂
-
二进制→十进制:按权展开求和,例:1011.101B=1×2³+0×2²+1×2¹+1×2⁰+1×2⁻¹+0×2⁻²+1×2⁻³=11.625D
-
二进制→八进制:3 位一组分组(整数从右、小数从左),不足补 0,例:1101011B=153O
-
二进制→十六进制:4 位一组分组,不足补 0,例:11010110B=D6H
-
八进制 / 十六进制→十进制:按权展开,例:25O=2×8¹+5×8⁰=21D;1AH=1×16¹+10×16⁰=26D
字符编码
- ASCII 码:
-
7 位编码,共 128 个字符(0-127),占 1 字节(最高位为 0)
-
控制字符(0-31、127):不可显示,用于控制设备(如换行 LF、回车 CR、退格 BS)
-
普通字符(32-126):空格(32)、数字('0'-'9':48-57)、大写字母('A'-'Z':65-90)、小写字母('a'-'z':97-122),大小写字母 ASCII 码差值为 32
- Unicode 编码:
-
兼容 ASCII,解决多语言字符表示问题,编码空间 0-0x10FFFF(可容纳百万级字符)
-
常见实现:UTF-8(1-4 字节,网页默认编码)、UTF-16(2 或 4 字节,Windows 系统常用)、UTF-32(4 字节,固定长度)
- 汉字编码:
-
GB2312(1980):收录 6763 个简体汉字,双字节编码
-
GBK(1995):兼容 GB2312,收录 21003 个汉字,支持繁体
-
GB18030(2000):兼容 GBK,收录 7 万 + 汉字,支持少数民族文字,是我国强制标准
数值在计算机中的存储
- 原码、反码、补码:
-
原码:符号位(最高位)+ 数值位,正数符号位 0,负数 1,例:+3 原码 00000011,-3 原码 10000011(8 位表示)
-
反码:正数与原码相同;负数符号位不变,数值位按位取反,例:-3 反码 11111100
-
补码:正数与原码相同;负数 = 反码 + 1,例:-3 补码 11111101
-
核心优势:计算机仅需加法器即可实现加减运算(减法转换为加负数补码),无正负零二义性(补码中零只有一种表示:00000000)
- 定点数与浮点数:
-
定点数:小数点位置固定,分为定点整数(小数点在末尾)和定点小数(小数点在符号位后),表示范围有限,适用于简单计算
-
浮点数:N = 尾数 ×2^ 指数(类似科学计数法),尾数决定精度(位数越多精度越高),指数决定表示范围,例:(101.101)₂=1.01101×2²,尾数 1.01101(规格化形式,整数部分为 1),指数 2
-
IEEE 754 标准:单精度浮点数(32 位):符号位 1 位 + 指数位 8 位 + 尾数位 23 位;双精度(64 位):符号位 1 位 + 指数位 11 位 + 尾数位 52 位
计算机系统组成
硬件系统
-
冯・诺依曼体系结构:核心思想 "存储程序",由运算器、控制器、存储器、输入设备、输出设备五大部件组成,程序和数据以二进制形式存储在存储器中
-
硬件系统层次:核心部件(CPU、内存)→ 外围设备(外存、I/O 设备)→ 总线(连接各部件)→ 接口(设备与总线的桥梁)
软件系统
-
系统软件:操作系统、语言处理程序(编译器、解释器、汇编器)、数据库管理系统(DBMS)、系统工具(杀毒软件、磁盘工具)
-
应用软件:通用软件、专用软件(详见第三部分)
-
软件与硬件的关系:硬件是基础,软件是灵魂;软件依赖硬件运行,硬件通过软件实现功能扩展
第二部分:计算机硬件
中央处理器(CPU)
CPU 的组成:
-
运算器:负责执行算术运算(加、减、乘、除)和逻辑运算(与、或、非、异或、比较),是计算机实际执行数据处理的部件。核心组件包括算术逻辑单元(ALU,执行具体运算)、累加器(暂存运算结果和操作数)、状态寄存器(记录运算状态,如进位 C、溢出 O、零标志 Z)。
-
控制器:计算机的 "指挥中心",负责从内存中取指令、分析指令,并产生一系列控制信号,协调计算机各部件有条不紊地工作。核心组件包括程序计数器(PC,存储下一条要执行指令的地址,自动递增)、指令寄存器(IR,暂存当前正在执行的指令)、指令译码器(ID,解析指令的操作码和操作数)、时序发生器(产生同步时钟信号)。
-
寄存器:CPU 内部的高速存储单元(速度是内存的数十倍),用于临时存储指令、数据和地址。常见类型:
-
数据寄存器(DR):暂存操作数和运算结果
-
地址寄存器(AR):存储要访问的内存地址
-
通用寄存器(如 AX、BX、CX、DX):可灵活存储数据或地址,减少对内存的访问
-
控制寄存器(如 CR0、CR1):存储 CPU 的控制信息和状态
多核技术:
现代 CPU 将两个或多个独立的处理核心(Core)集成在一个芯片上,每个核心都包含完整的运算器、控制器和寄存器组,能独立执行指令流。操作系统通过任务调度器将不同线程分配给不同核心并行执行,例如四核 CPU 可同时处理四个线程,大幅提升多任务处理效率(如同时运行浏览器、办公软件、视频播放器)。多核技术的关键是缓存一致性协议(如 MESI),确保多个核心访问共享数据时的一致性。
主频与睿频:
-
主频:CPU 时钟频率,指 CPU 每秒钟完成的时钟周期数,单位为赫兹(Hz),常用吉赫兹(GHz=10⁹Hz)。主频越高,单位时间内执行的指令越多,例:3.0GHz CPU 每秒完成 30 亿个时钟周期。
-
睿频(Turbo Boost):Intel 的动态超频技术,当 CPU 负载较高且散热允许时,自动提升核心主频,例:基础主频 2.8GHz 的 CPU,睿频可达到 4.0GHz,临时提升单任务性能。
-
注意:主频不是性能唯一指标,需结合架构(如 x86-64、ARMv8)、IPC(每时钟周期执行指令数)、核心数综合判断,例:ARM 架构 CPU 主频低于 x86,但 IPC 高、功耗低,适合移动设备。
字长与寻址能力:
-
字长:CPU 一次能并行处理的二进制位数,等于数据总线宽度,常见 32 位、64 位。
-
32 位 CPU:一次处理 4 字节数据,最大寻址空间 4GB(2³² 字节),无法直接支持超过 4GB 的内存。
-
64 位 CPU:一次处理 8 字节数据,理论最大寻址空间 16EB(2⁶⁴字节),兼容 32 位程序(需操作系统支持),是当前主流。
-
应用影响:64 位操作系统需搭配 64 位 CPU 才能发挥性能,32 位操作系统最大仅能识别 3.2-3.5GB 内存。
CPU 性能影响因素:
-
缓存容量:L1(核心内置,16-64KB / 核心)、L2(核心专属,256KB-2MB / 核心)、L3(多核共享,4-64MB),缓存容量越大,命中率越高,减少 CPU 访问内存的延迟。
-
指令集:
-
CISC(复杂指令集):x86 架构,指令丰富(千余种),兼容性强,适用于桌面和服务器。
-
RISC(精简指令集):ARM、MIPS 架构,指令简洁(百余种),执行效率高、功耗低,适用于移动设备和嵌入式系统。
-
扩展指令集:SSE、AVX(多媒体处理)、AES-NI(加密加速),提升特定场景性能。
-
制程工艺:芯片制造的纳米数(如 7nm、5nm、3nm),制程越先进,芯片集成度越高、功耗越低、发热越少,例:5nm CPU 相比 7nm,同功耗下性能提升 20%,同性能下功耗降低 40%。
-
核心数与线程数:物理核心数是实际处理单元,线程数是逻辑处理单元,超线程技术(Hyper-Threading)使一个物理核心模拟两个逻辑线程,提升并行处理能力(如 6 核心 12 线程 CPU)。
存储器系统
存储器的层次结构(核心考点):
| 层次 | 名称 | 特点 | 作用 | 访问速度 | 容量 | 成本 |
|---|---|---|---|---|---|---|
| 1 | 寄存器 | 高速、CPU 内置 | 暂存当前指令和数据 | 1-3ns | 几十 KB | 最高 |
| 2 | 缓存(L1/L2/L3) | 高速、SRAM | 存储 CPU 近期可能访问的数据 / 指令 | 3-20ns | 几 MB - 几十 MB | 高 |
| 3 | 内存(主存) | 中速、DRAM | 存储当前运行的程序和数据 | 50-100ns | 8GB-64GB | 中 |
| 4 | 外存(辅存) | 低速、HDD/SSD | 长期存储程序、数据、文件 | 1ms-100μs | 500GB-4TB | 低 |
- 层次结构设计目的:通过高速缓存缓解 CPU 与内存的速度差异,通过虚拟内存缓解内存与外存的容量差异,平衡速度、容量和成本。
RAM 与 ROM 的区别及类型:
| 特性 | RAM(随机存取存储器) | ROM(只读存储器) |
|---|---|---|
| 读写能力 | 可读可写 | 常态只读,特殊类型可写入(如 EEPROM) |
| 易失性 | 易失性(断电数据丢失) | 非易失性(断电数据保留) |
| 核心类型 | DRAM(动态 RAM)、SRAM(静态 RAM) | PROM、EPROM、EEPROM、Flash ROM |
| 工作原理 | DRAM 靠电容存储电荷(需刷新,每几 ms);SRAM 靠触发器(无需刷新) | PROM 一次性写入;EPROM 紫外线擦除;EEPROM 电擦除;Flash ROM(闪存)电擦除,按块操作 |
| 用途 | DRAM:内存(主存);SRAM:缓存(L1/L2/L3) | BIOS、固件、U 盘、SSD、手机存储 |
| 速度对比 | SRAM > DRAM > ROM | - |
| 成本对比 | SRAM > DRAM > ROM | - |
虚拟内存(核心考点):
-
定义:操作系统将内存与硬盘上的一块空间(页面文件 / 交换分区)逻辑结合,形成 "虚拟内存空间",当物理内存不足时,将部分不活跃的程序页面(4KB/8KB)换出到虚拟内存,释放物理内存供当前活跃程序使用。
-
工作过程:
-
页面置换:当内存不足时,操作系统选择部分页面换出到硬盘(页面文件),需要时再换入内存。
-
缺页中断:当 CPU 访问的页面不在内存时,触发缺页中断,操作系统将该页面从外存调入内存。
- 页面置换算法(考纲重点):
-
LRU(最近最少使用):置换最长时间未被访问的页面,命中率最高,实际应用最广(如 Windows、Linux 默认算法)。
-
FIFO(先进先出):置换最早进入内存的页面,算法简单,但可能出现 "Belady 异常"(内存容量增大,缺页率反而上升)。
-
OPT(最佳置换):置换未来最长时间不会被访问的页面,命中率最高,但无法实现(需预知未来访问序列),仅作为理论参考。
- 优缺点:
-
优点:扩展了可用内存空间,允许运行超出物理内存容量的程序。
-
缺点:依赖硬盘读写(速度慢),频繁置换会导致 "抖动"(Thrashing),系统性能大幅下降。
硬盘与存储设备细节:
- HDD(机械硬盘):
-
核心组件:盘片(磁性涂层,存储数据)、读写磁头(悬浮在盘片上方,间距 0nm)、主轴电机(带动盘片旋转,转速 5400/7200/10000 转 / 分)、磁头臂(带动磁头移动)。
-
关键参数:转速(7200 转 / 分比 5400 转快)、缓存容量(8MB/16MB/64MB,缓存越大,突发传输越快)、单碟容量(越大,密度越高,速度越快)。
-
性能瓶颈:磁头寻道时间(5-10ms)和盘片旋转延迟(4-6ms),随机读写速度慢(约 100IOPS)。
- SSD(固态硬盘):
-
核心组件:NAND 闪存芯片(存储数据)、主控芯片(管理闪存,处理读写请求)、缓存芯片(部分型号,加速读写)。
-
闪存类型:
-
SLC(单级单元):1 个单元存 1 位,寿命长(10 万次写入)、速度快、价格高(企业级应用)。
-
MLC(多级单元):1 个单元存 2 位,寿命中等(1 万次)、性价比高(已逐步淘汰)。
-
TLC(三级单元):1 个单元存 3 位,寿命(3000-10000 次)、价格低(消费级主流)。
-
QLC(四级单元):1 个单元存 4 位,寿命低(1000 次左右)、容量大、价格极低(大容量存储)。
-
-
关键参数:连续读写速度(顺序传输,如 3000MB/s)、4K 随机读写速度(小文件传输,如 500MB/s)、TBW(总写入字节数,寿命指标)。
- 接口与协议对比(考纲重点):
| 接口 / 协议 | 理论传输速度 (单通道/单向) | 适用设备 | 主要特点 |
|---|---|---|---|
| SATA 3.0 | 6 Gbps(约 600 MB/s) | 传统 HDD、入门/主流级 SATA SSD、2.5英寸/光驱位硬盘 | 兼容性极佳、普及度高、价格低廉、使用独立线缆连接 |
| NVMe (PCIe 3.0 x4) | 约 32 Gbps(约 3500 MB/s) | 主流/中高端 M.2 NVMe SSD | 专为闪存设计,通过PCIe通道直连CPU/芯片组,队列深度高,延迟极低 |
| NVMe (PCIe 4.0 x4) | 约 64 Gbps(约 7000 MB/s) | 高性能/旗舰级 M.2 NVMe SSD | 速度相较PCIe 3.0翻倍,带宽更大,支持NVMe 1.4协议的新特性 |
| M.2 | 取决于所走协议通道 (SATA或NVMe) | 笔记本电脑、迷你主机、台式机(主流形态)的SSD | 物理接口和外形规格,而非传输协议。常见尺寸为2280(22mm宽,80mm长),无需线缆,直接插拔。 |
- 其他存储设备:
-
U 盘:基于 Flash ROM,接口为 USB 2.0/3.2,便携性强,适用于小容量数据传输。
-
移动硬盘:分为 HDD 移动硬盘(容量大、价格低)和 SSD 移动硬盘(速度快、抗震),接口为 USB 3.2/Type-C。
-
光盘:CD(700MB)、DVD(4.7GB/8.5GB)、Blu-ray(25GB/50GB),非易失性,适用于数据备份(逐渐淘汰)。
存储容量单位换算(必考):
-
二进制换算(计算机内部):1B=8bit;1KB=1024B;1MB=1024KB;1GB=1024MB;1TB=1024GB;1PB=1024TB
-
十进制换算(厂商标注):1KB=1000B;1GB=1000MB;1TB=1000GB
-
实际容量计算:标称 1TB 的硬盘,实际容量 = 1000³MB / 1024² ≈ 931GB(考点:用户看到的容量小于标称容量的原因)
输入 / 输出设备
常见设备及工作原理(考纲重点):
- 键盘与鼠标:
-
键盘:矩阵式按键,按下时触发对应扫描码,键盘控制器将扫描码转换为 ASCII 码 / Unicode 码,通过 USB 接口传输给 CPU。类型:机械键盘(Cherry MX 轴,寿命 5000 万次)、薄膜键盘(成本低、静音)、静电容键盘(手感介于两者之间)。
-
鼠标:
-
光学鼠标:LED 光源照射表面,CMOS 传感器捕捉反射图像,分析图像位移计算移动距离,采样率(DPI, dots per inch)越高,精度越高(如 1600DPI)。
-
激光鼠标:激光光源,可在玻璃等光滑表面使用,精度更高。
-
无线鼠标:蓝牙(传输距离 10 米)或 2.4GHz 无线(需接收器,传输距离 10-30 米)。
-
- 显示器(核心考点):
-
核心参数:
-
分辨率:屏幕像素总数,如 1920×1080(1080P)、2560×1440(2K)、3840×2160(4K)、7680×4320(8K),分辨率越高,图像越清晰。
-
刷新率:屏幕每秒刷新次数(Hz),60Hz(普通)、144Hz(游戏)、240Hz(高端游戏),刷新率越高,动态画面越流畅。
-
响应时间:像素从一种颜色切换到另一种颜色的时间(ms),5ms(普通)、1ms(游戏),响应时间越短,拖影越少。
-
色域:显示颜色的范围,sRGB(标准)、DCI-P3(影视)、Adobe RGB(设计),色域覆盖率越高,色彩越准确。
-
-
面板类型对比:
| 面板类型 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
| IPS | 色彩准确、色域广,可视角度大(通常178°) | 原生对比度较低(通常1000:1),可能有轻微漏光,响应时间较TN面板慢 | 专业设计、图像处理、办公、影音娱乐 |
| VA | 原生对比度高(通常3000:1起),色彩表现较好,黑色更纯净 | 响应时间最慢(尤其是深色转换),低端型号容易出现拖影,可视角度略逊于IPS | 影音娱乐、日常办公、非竞技类游戏 |
| TN | 响应时间极快(常标称1ms),刷新率高,成本低 | 色彩表现差,可视角度小,屏幕发白,观感不佳 | 专业电竞、追求极致响应速度的FPS游戏玩家 |
- 打印机(考纲重点):
-
激光打印机:
-
工作流程:充电(感光鼓带静电)→ 曝光(激光束形成潜像)→ 显影(吸附碳粉)→ 转印(碳粉转移到纸)→ 定影(加热固化)→ 清洁(残留碳粉)。
-
关键参数:打印分辨率(600dpi/1200dpi)、打印速度(ppm,页 / 分钟)、硒鼓寿命(数千页)。
-
优点:速度快、分辨率高、耗材成本低;缺点:价格高、不适合彩色照片打印。
-
-
喷墨打印机:
-
工作原理:热气泡式(加热墨水产生气泡,挤压墨水喷出)、压电式(电压控制压电晶体变形,喷射墨水)。
-
优点:价格低、彩色打印效果好(照片级);缺点:墨水消耗快、打印速度慢、长期不用易堵喷头。
-
-
针式打印机:
-
工作原理:打印针撞击色带,在纸上形成点阵字符 / 图形。
-
优点:可打印多联纸(发票、快递单)、耐环境性强、耗材便宜;缺点:噪音大、分辨率低、速度慢。
-
I/O 接口技术(必考):
-
接口的作用:解决 CPU、内存与外部设备之间的速度匹配、信号转换、数据格式转换问题,是设备与计算机通信的桥梁。
-
常见接口对比(考纲重点):
| 接口类型 | 理论传输速度 | 主要特点 | 典型应用设备 |
|---|---|---|---|
| USB 2.0 | 480 Mbps (约 60 MB/s) | 即插即用、热插拔、支持供电、普及度高 | 键盘、鼠标、U盘、打印机、低速外设 |
| USB 3.2 Gen 1 (原 USB 3.0) | 5 Gbps (约 625 MB/s) | 向下兼容 USB 2.0,全双工传输,端口通常为蓝色 | 移动硬盘、中速外置 SSD、扫描仪、摄像头 |
| USB 3.2 Gen 2 (原 USB 3.1 Gen 2) | 10 Gbps (约 1250 MB/s) | 高性能、支持 100W PD 供电、常用 Type-C 形态 | 高速外置 SSD、高速集线器、高端外设 |
| USB 3.2 Gen 2x2 | 20 Gbps (约 2500 MB/s) | 双通道传输、仅限 Type-C 接口 | 旗舰级外置 SSD、专业高速存储设备 |
| USB4 | 20 / 40 Gbps (可选速率) | 基于雷电 3 协议,兼容雷电 3/DisplayPort 视频/高功率充电 | 高端笔记本、扩展坞、外置显卡坞、超高速存储 |
| Type-C | 取决于搭载的协议 (USB 2.0/3.2/USB4/雷电) | 物理接口形态,正反可插,集数据/视频/充电于一体 | 智能手机、平板、笔记本、显示器、移动硬盘等 |
| HDMI 2.0 | 18 Gbps | 支持 4K@60Hz、HDR、音频回传通道 (ARC)、广泛普及 | 显示器、电视机、投影仪、游戏主机 |
| HDMI 2.1 | 48 Gbps | 支持 8K@60Hz、4K@120Hz、动态 HDR、可变刷新率 (VRR) | 高端游戏电视/显示器、新一代游戏主机、PC |
| DisplayPort 2.1 | 80 Gbps (UHBR20) | 超高带宽,支持双屏 8K@120Hz、16K@60Hz,功能全面 | 专业/高性能显示器、工作站显卡、游戏设备 |
| VGA | 模拟信号 (最高约 2048×1536@85Hz) | 模拟传输、易受干扰、仅视频、体积大、已淘汰 | 老式显示器、投影仪 (历史遗留设备) |
| Audio Jack (3.5mm) | 模拟音频信号 | 通用音频接口、支持立体声/麦克风输入、简单可靠 | 耳机、扬声器、麦克风、便携音响 |
| RJ-45 (以太网) | 10/100/1000 Mbps (千兆) 至 10 Gbps+ (万兆) | 有线网络连接、稳定低延迟、需布线、支持 PoE 供电 | 网卡、路由器、交换机、网络存储 (NAS)、IP摄像机 |
总线技术:
-
总线的定义:计算机各部件之间传输信息的公共通道,由数据线、地址线、控制线、电源线组成,减少部件间的连线复杂度,提高系统扩展性。
-
总线分类(考纲重点):
-
数据总线(DB):双向传输数据,宽度 = CPU 字长(32 位 / 64 位),决定一次传输的数据量。
-
地址总线(AB):单向传输内存 / IO 设备地址,宽度决定寻址空间(32 位地址总线→4GB 寻址)。
-
控制总线(CB):传输控制信号和状态信号,如读(RD)、写(WR)、中断请求(IRQ)、时钟信号(CLK)。
- 常见系统总线:
-
PCI:32 位总线,速度 133MB/s(已淘汰)。
-
PCI Express(PCIe):串行总线,按通道数(x1/x4/x8/x16)划分,PCIe 3.0 x16 速度 = 16GB/s,是当前主流(显卡、SSD、网卡均使用)。
-
AGP:专门用于显卡的总线(已被 PCIe 取代)。
性能指标(必考)
- CPU 性能指标:
-
主频 / 睿频:直接影响指令执行速度。
-
字长:影响数据处理能力和寻址范围。
-
核心数 / 线程数:影响多任务并行处理能力。
-
缓存容量(L1/L2/L3):缓存越大,命中率越高,性能越好。
-
IPC(每时钟周期执行指令数):架构效率指标,IPC 越高,同主频下性能越强。
-
运算速度(MIPS/GFLOPS):MIPS(百万条指令 / 秒),GFLOPS(十亿次浮点运算 / 秒,科学计算场景)。
- 内存性能指标:
-
容量:8GB/16GB/32GB,容量越大,可同时运行的程序越多。
-
频率:DDR4 2400MHz/3200MHz,DDR5 4800MHz/6400MHz,频率越高,数据传输速度越快。
-
时序(CL):内存延迟指标,CL 值越小,延迟越低(如 DDR4 3200 CL16)。
- 存储设备性能指标:
-
连续读写速度:顺序传输大文件(如电影)的速度,HDD 约 100-200MB/s,SSD 约 1000-7000MB/s。
-
随机读写速度(4K):传输小文件(如文档)的速度,HDD 约 1-10MB/s,SSD 约 100-1000MB/s。
-
存取周期(内存):完成一次读 / 写操作的时间(50-100ns)。
-
IOPS(SSD/HDD):每秒输入 / 输出操作数,SSD 可达数十万 IOPS,HDD 仅数百 IOPS。
- 整机性能指标:
-
响应时间:从用户操作到系统响应的时间。
-
吞吐量:单位时间内完成的任务数。
-
基准测试分数:如鲁大师、Cinebench、3DMark 分数,用于横向对比整机性能。
第三部分:计算机软件
系统软件
操作系统的定义与功能(核心考点):
操作系统(OS)是管理计算机硬件与软件资源的系统软件,是用户、应用程序与硬件之间的接口,核心作用是 "资源管理" 和 "提供用户接口"。
处理器管理(进程与线程)
- 进程与线程的区别(必考):
| 特性 | 进程 | 线程 |
|---|---|---|
| 定义 | 资源分配的基本单位,拥有独立的内存空间、PCB | CPU 调度的基本单位,共享所属进程的资源,拥有独立的TCB |
| 资源占用 | 独立占用内存、文件句柄等系统资源,开销大 | 共享所属进程的资源,开销小 |
| 切换开销 | 大(需切换内存空间、完整上下文) | 小(仅切换少量寄存器、程序计数器等) |
| 通信方式 | 复杂,需通过进程间通信(IPC)机制 | 简单,可直接读写共享内存变量 |
| 可靠性 | 相互隔离,一个进程崩溃不影响其他进程 | 一个线程崩溃可能导致整个进程崩溃 |
| 并发性 | 进程间并发,上下文切换成本高 | 线程间并发,切换成本低,并发度高 |
| 生命周期 | 较长,创建和销毁成本高 | 较短,依赖进程存在 |
- 进程状态转换(考纲重点):
-
就绪态:进程已分配到除 CPU 外的所有资源,等待 CPU 调度。
-
运行态:进程占用 CPU,正在执行指令。
-
阻塞态(等待态):进程因等待某事件(如 IO 完成、资源申请)而暂停执行。
-
转换流程:就绪→运行(CPU 调度);运行→就绪(时间片用完);运行→阻塞(等待事件);阻塞→就绪(事件完成)。
- 进程调度算法(必考):
-
先来先服务(FCFS):按进程到达顺序调度,算法简单,对长进程有利,短进程等待时间长("饥饿")。
-
短作业优先(SJF):选择估计运行时间最短的进程先执行,提高短进程效率,长进程可能 "饥饿"。
-
时间片轮转(RR):将 CPU 时间划分为固定时间片(如 10ms),按顺序轮流分配给就绪进程,兼顾公平性和响应速度(分时系统常用)。
-
优先级调度:为进程分配优先级,高优先级进程先执行,可分为抢占式(高优先级进程打断低优先级)和非抢占式(低优先级进程执行完再调度),需防止低优先级进程 "饥饿"(解决方案:老化机制,优先级随等待时间增长)。
- 死锁(考纲重点):
-
定义:多个进程相互等待对方占用的资源,导致所有进程都无法继续执行的状态。
-
产生条件(四大必要条件,缺一不可):
-
资源互斥:资源只能被一个进程占用。
-
持有并等待:进程持有部分资源,同时等待其他进程的资源。
-
不可剥夺:资源一旦分配,不能被强制剥夺。
-
循环等待:多个进程形成资源等待循环(如 A 等 B 的资源,B 等 A 的资源)。
-
死锁处理:
-
预防:破坏任一必要条件(如资源预分配、按顺序分配资源)。
-
避免:银行家算法(动态检测资源分配安全性,确保不进入死锁状态)。
-
检测与解除:定期检测死锁,若发生则剥夺资源或终止部分进程。
-
存储管理(核心考点)
- 内存分配方式:
-
单一连续分配:整个内存分为系统区和用户区,仅允许一个用户进程运行(单道程序设计,已淘汰)。
-
分区分配:
-
固定分区:内存划分为多个固定大小的分区,多道程序并发,分区大小固定,利用率低。
-
动态分区:根据进程需求动态分配内存,利用率高,但会产生碎片(外部碎片:未分配的零散空间;内部碎片:分区内未使用的空间)。
-
-
分页存储管理:将内存和进程划分为大小相等的页面(如 4KB),内存按页面分配,无外部碎片,通过页表实现逻辑地址→物理地址转换。
-
分段存储管理:按进程的逻辑结构(如代码段、数据段、堆栈段)划分段,段大小不固定,便于共享和保护,会产生外部碎片。
-
段页式存储管理:先分段,再分页,结合分段和分页的优点(共享保护 + 无外部碎片),是现代操作系统的主流方式。
- 地址映射(必考):
-
逻辑地址(虚拟地址):程序中使用的地址,由段号 + 页号 + 页内偏移组成。
-
物理地址:内存实际地址,由帧号 + 页内偏移组成。
-
映射过程:CPU 发出逻辑地址→段表寄存器找到段表→段表找到页表→页表找到物理帧号→帧号 + 页内偏移 = 物理地址。
- 内存保护:
-
越界检查:通过段表 / 页表中的段长 / 页长字段,检查逻辑地址是否超出范围。
-
权限保护:段表 / 页表中设置读写执行权限(如代码段只读,数据段可读写),防止非法访问。
文件管理(考纲重点)
- 文件的逻辑结构:
-
顺序文件:文件数据按顺序存储,适合顺序访问(如文本文件、视频文件)。
-
索引文件:为文件建立索引表,记录数据块位置,适合随机访问(如数据库文件)。
-
链接文件:文件数据块通过指针链接,适合追加操作,随机访问效率低(如 FAT 文件系统)。
- 文件目录结构:
-
单级目录:所有文件放在一个目录下,无重名,适用于单用户(已淘汰)。
-
两级目录:分为用户目录和文件目录,解决单用户重名问题,适用于多用户(如早期 DOS)。
-
树形目录:根目录→子目录→文件,层次清晰,支持重名(不同目录下),是现代操作系统的标准(如 Windows、Linux)。
-
路径:绝对路径(从根目录开始,如 C:\Users\Document\file.txt)、相对路径(从当前目录开始,如.../file.txt)。
- 文件系统对比(必考):
| 文件系统 | 最大单个文件 | 最大分区容量 | 主要特点 | 适用场景 |
|---|---|---|---|---|
| FAT32 | 4 GB | 32 GB | 兼容性极佳(几乎所有系统都支持),结构简单;不支持文件权限、加密或日志功能 | 小容量U盘、SD卡,以及需要跨旧操作系统(如老式游戏机、车载设备)使用的设备 |
| NTFS | 16 EB | 256 TB | 支持权限控制、加密(EFS)、压缩、日志(保证数据一致性)、磁盘配额;是Windows的默认现代文件系统 | Windows系统盘,内置机械硬盘和SSD,以及主要在Windows环境中使用的大容量存储设备 |
| exFAT | 16 EB | 128 PB | 专为闪存设计,无4GB文件限制;兼容Windows和macOS(原生读写);结构简单,无日志和权限功能 | 大容量U盘、移动硬盘、SD卡(尤其是用于跨平台(Win/macOS) 交换大文件) |
| ext4 | 16 TB | 1 EB | 日志文件系统,支持配额、延迟分配、inode扩展、更大的文件系统尺寸;是多数Linux发行版的默认文件系统 | Linux系统盘,服务器,工作站,以及主要在Linux环境下使用的大容量存储 |
操作系统实操(考纲新增重点)
- 文件操作:
-
基本操作:创建、复制(Ctrl+C)、移动(Ctrl+X)、删除(Delete/Shift+Delete)、重命名(F2)、属性设置(只读 / 隐藏 / 系统)。
-
搜索文件:按名称、类型、大小、修改时间搜索(Windows 资源管理器 / Linux find 命令)。
-
压缩与解压:WinRAR/7-Zip,支持 ZIP/RAR/7Z 格式,压缩分为有损(如图片)和无损(如文档)。
- 磁盘管理:
-
磁盘分区:MBR 分区表(支持 4 个主分区或 3 个主分区 + 1 个扩展分区)、GPT 分区表(支持无限个主分区,适用于大容量硬盘)。
-
格式化:快速格式化(仅清除目录,不检查坏道)、完全格式化(清除目录 + 检查坏道),格式化会破坏数据(可通过数据恢复软件恢复)。
-
磁盘清理:删除临时文件、回收站文件、系统更新缓存(Windows 磁盘清理工具)。
-
碎片整理:合并机械硬盘的外部碎片,提高读写速度(SSD 无需碎片整理,反而会损耗寿命)。
- 任务与服务管理:
-
任务管理器(Windows)/htop(Linux):查看进程 CPU / 内存 / 磁盘占用,终止无响应进程(结束任务)。
-
系统服务:通过服务管理器(services.msc)启动 / 停止 / 禁用系统服务(如 Windows Update、防火墙服务)。
-
开机启动项:禁用不必要的开机启动程序,缩短开机时间(任务管理器→启动选项卡)。
常见操作系统类型与特点(必考)
| 操作系统 | 内核类型 | 特点 | 代表版本 | 适用场景 |
|---|---|---|---|---|
| Windows | 宏内核 | 图形界面友好、软件生态丰富、兼容性强、易上手 | Windows 10/11 | 个人电脑、办公、游戏 |
| Linux | 宏内核(部分模块化) | 开源免费、稳定性高、安全性强、可定制性强、命令行强大 | Ubuntu/CentOS/Debian | 服务器、嵌入式系统、开发 |
| macOS | XNU(混合内核) | 图形界面精美、稳定性高、与苹果硬件深度集成、安全性强 | macOS Ventura/Sonoma | 苹果 Mac 设备、设计、开发 |
| 移动 OS | 微内核 / 混合内核 | 触控优化、功耗低、移动应用丰富 | iOS(苹果)、Android(谷歌) | 智能手机、平板电脑 |
| 嵌入式 OS | 实时内核 | 实时响应、功耗低、体积小 | VxWorks、RT-Thread | 工业控制、智能设备、汽车电子 |
数据结构与算法(核心考点)
数据结构的定义与分类
数据结构是计算机存储、组织数据的方式,研究数据元素之间的关系(逻辑结构)和数据的存储方式(物理结构),核心目标是提高程序的时间效率和空间效率。
- 逻辑结构:
-
线性结构:数据元素一对一关系(数组、链表、栈、队列)。
-
非线性结构:数据元素一对多(树)或多对多(图)关系。
- 物理结构(存储结构):
-
顺序存储:数据元素存储在连续的内存空间(数组、顺序表),随机访问效率高,插入删除效率低。
-
链式存储:数据元素存储在非连续的内存空间,通过指针链接(链表),插入删除效率高,随机访问效率低。
-
索引存储:为数据建立索引表,提高查找效率(索引文件)。
-
散列存储(哈希存储):通过哈希函数将关键字映射到存储地址(哈希表),查找效率高(平均 O (1))。
核心数据结构详解(必考)
- 线性结构:
-
数组(顺序表):
-
特点:连续存储、随机访问(O (1))、插入删除(O (n),需移动元素)。
-
应用:存储固定大小的同类型数据(如成绩数组、颜色数组)。
-
扩展:动态数组(ArrayList),支持自动扩容,兼顾数组和链表的优点。
-
-
链表:
-
单链表:每个节点含数据域和下一个节点指针,只能从表头遍历。
-
双向链表:每个节点含数据域、前驱指针和后继指针,可双向遍历,插入删除更灵活。
-
循环链表:尾节点指针指向头节点,形成循环,适用于环形队列、约瑟夫问题。
-
应用:链表无固定大小,适合频繁插入删除的场景(如消息队列、LRU 缓存)。
-
-
栈(LIFO):
-
操作:压栈(push,入栈)、弹栈(pop,出栈)、取栈顶(top)、判空(isEmpty)。
-
实现:顺序栈(数组实现)、链栈(链表实现)。
-
应用:函数调用栈(保存返回地址)、表达式求值(后缀表达式转换)、括号匹配、回溯算法(如迷宫求解)。
-
-
队列(FIFO):
-
操作:入队(enqueue)、出队(dequeue)、取队头(front)、判空(isEmpty)。
-
实现:顺序队列(数组实现,易产生假溢出)、循环队列(数组实现,解决假溢出)、链队列(链表实现)。
-
特殊队列:
-
优先级队列:按优先级出队(堆实现),应用于任务调度、Dijkstra 算法。
-
双端队列(Deque):两端均可入队出队,应用于滑动窗口算法。
-
-
应用:任务调度(如打印机队列)、消息队列、缓冲区(如键盘输入缓冲区)、广度优先搜索(BFS)。
-
- 树形结构:
- 二叉树的性质(必考):
-
第 i 层最多有 2^(i-1) 个节点(i≥1)。
-
深度为 k 的二叉树最多有 2^k -1 个节点(k≥1)。
-
任意二叉树,度为 0 的节点数(叶子节点)= 度为 2 的节点数 + 1(n0 = n2 +1)。
-
完全二叉树:除最后一层外,每一层节点数均满,最后一层节点从左到右连续(适合数组存储)。
-
满二叉树:每一层节点数均满(完全二叉树的特例)。
-
二叉树遍历(必考):
-
前序遍历(根 - 左 - 右):递归实现:visit (root) → 前序 (left) → 前序 (right);应用:复制二叉树、前缀表达式。
-
中序遍历(左 - 根 - 右):递归实现:中序 (left) → visit (root) → 中序 (right);应用:二叉搜索树排序(中序遍历结果有序)。
-
后序遍历(左 - 右 - 根):递归实现:后序 (left) → 后序 (right) → visit (root);应用:删除二叉树、后缀表达式。
-
层序遍历(按层次):队列实现,从上到下、从左到右;应用:求二叉树深度、广度优先搜索。
-
-
二叉搜索树(BST):
-
性质:左子树所有节点值 ;右子树所有节点值 > 根节点值;左右子树均为 BST。
-
操作:
-
查找:从根节点开始,比根小则左移,比根大则右移(平均 O (logn),最坏 O (n))。
-
插入:按查找路径找到插入位置(叶子节点),保持 BST 性质。
-
删除:分三种情况(叶子节点、单孩子节点、双孩子节点),双孩子节点需用中序后继(右子树最小节点)或中序前驱(左子树最大节点)替换。
-
-
缺陷:易退化为链表(如有序插入),导致操作效率下降。
-
-
平衡二叉树(AVL 树):
-
性质:左右子树高度差(平衡因子)的绝对值 ≤1(平衡因子 = 左子树高度 - 右子树高度)。
-
平衡调整:当插入 / 删除导致失衡时,通过旋转操作(LL、RR、LR、RL)恢复平衡。
-
优点:保持树的高度为 O (logn),确保查找、插入、删除操作效率为 O (logn)。
-
-
红黑树:
- 性质:
-
每个节点为红色或黑色。
-
根节点为黑色。
-
所有叶子节点(NIL)为黑色。
-
红色节点的父节点为黑色(无连续红色节点)。
-
从任意节点到其叶子节点的所有路径包含相同数量的黑色节点。
- 优点:平衡要求低于 AVL 树,插入删除的旋转操作更少,效率更高,是 STL(C++)、Java 集合(TreeMap)的底层实现。
-
堆:
-
性质:完全二叉树,大顶堆(父节点≥子节点)、小顶堆(父节点≤子节点)。
-
操作:
-
建堆:将无序数组调整为堆(O (n))。
-
堆化(上浮 / 下沉):插入元素后上浮,删除堆顶后下沉(O (logn))。
-
-
应用:堆排序(O (nlogn))、优先级队列、TopK 问题(如前 10 大元素)。
-
- 图形结构:
-
图的基本概念:
-
顶点(Vertex):数据元素;边(Edge):顶点之间的关系。
-
有向图:边有方向(如 A→B);无向图:边无方向(如 A-B)。
-
权重:边的数值(如距离、成本);带权图(网):边带权重的图。
-
度:无向图中顶点的边数;有向图中分为入度(指向顶点的边数)和出度(离开顶点的边数)。
-
连通图:无向图中任意两个顶点之间有路径;强连通图:有向图中任意两个顶点之间有双向路径。
-
-
图的存储方式(必考):
-
邻接矩阵:二维数组 adj [i][j] 表示顶点 i 和 j 之间的关系(0/1 或权重),适合稠密图(边数多),空间复杂度 O (n²)。
-
邻接表:链表数组,每个顶点对应一个链表,存储其邻接顶点,适合稀疏图(边数少),空间复杂度 O (n+e)(n 为顶点数,e 为边数)。
-
-
图的遍历(必考):
-
深度优先搜索(DFS):递归或栈实现,类似树的前序遍历,优先访问深度方向的顶点,应用于路径查找、拓扑排序。
-
广度优先搜索(BFS):队列实现,类似树的层序遍历,优先访问广度方向的顶点,应用于最短路径(无权图)、连通分量查找。
-
-
最短路径算法(考纲重点):
-
Dijkstra 算法:解决带权无负权边图的单源最短路径(从一个顶点到其他所有顶点),贪心算法,时间复杂度 O (n²)(邻接矩阵)/O (m logn)(邻接表 + 优先队列)。
-
Floyd-Warshall 算法:解决带权图的多源最短路径(所有顶点之间),动态规划,时间复杂度 O (n³),适用于小规模图。
-
-
拓扑排序:
-
定义:对有向无环图(DAG)的顶点进行排序,使得对于每一条有向边 A→B,A 在排序中位于 B 之前。
-
实现:Kahn 算法(入度为 0 的顶点入队)、DFS-based 算法,应用于任务调度(如课程安排、项目依赖)。
-
算法基础(必考)
- 算法的特性:
-
有穷性:执行有限步骤后终止(不能无限循环)。
-
确定性:每个步骤有明确含义,无歧义(如 "将 x 加 1" 而非 "将 x 处理一下")。
-
可行性:步骤可通过有限次基本操作实现(如不能要求 "计算所有质数")。
-
输入:零个或多个输入(如排序算法需输入待排序数组)。
-
输出:一个或多个输出(如排序算法输出排序后的数组)。
- 算法复杂度分析(核心考点):
-
时间复杂度(T (n)):
-
定义:衡量算法执行时间随输入规模 n 增长的变化趋势,用大 O 表示法(只保留最高阶项,忽略常数和低阶项)。
-
计算方法:统计关键操作的执行次数(如比较、赋值),例:冒泡排序的关键操作是比较和交换,执行次数为 O (n²)。
-
常见时间复杂度(从优到劣):
-
O (1):常数时间(如数组访问、哈希表查找)。
-
O (logn):对数时间(如二分查找、二叉树遍历)。
-
O (n):线性时间(如顺序查找、数组遍历)。
-
O (nlogn):线性对数时间(如快速排序、归并排序、堆排序)。
-
O (n²):平方时间(如冒泡排序、选择排序、插入排序)。
-
O (n³):立方时间(如 Floyd 算法)。
-
O (2ⁿ):指数时间(如递归解决汉诺塔问题)。
-
O (n!):阶乘时间(如全排列枚举)。
-
-
注意:时间复杂度是趋势,不是具体执行时间,例:O (n) 算法在 n=1000 时可能比 O (logn) 慢(因常数项大),但 n 足够大时 O (n) 必然更慢。
-
-
空间复杂度(S (n)):
-
定义:衡量算法执行过程中所需额外存储空间(不包括输入数据本身)随 n 增长的变化趋势。
-
常见空间复杂度:
-
O (1):常数空间(如变量、临时变量,不随 n 变化)。
-
O (n):线性空间(如数组、链表,大小随 n 变化)。
-
O (logn):对数空间(如递归栈,深度为 logn)。
-
O (n²):平方空间(如二维数组)。
-
-
注意:递归算法的空间复杂度需考虑递归栈的深度(如递归实现的斐波那契数列空间复杂度为 O (n),迭代实现为 O (1))。
-
常用算法(必考):
查找算法(考纲重点):
| 算法 | 时间复杂度 | 空间复杂度 | 适用场景 | 核心原理 |
|---|---|---|---|---|
| 顺序查找 | O(n) | O(1) | 无序数组、链表 | 逐一遍历元素,匹配目标值 |
| 二分查找(折半查找) | O(logn) | O (1)(迭代)/O (logn)(递归) | 有序数组、有序顺序表 | 每次取中间元素对比,缩小查找区间(左闭右闭 / 左闭右开) |
| 插值查找 | O (loglogn)(平均)/O (n)(最坏) | O(1) | 有序且数据分布均匀的数组 | 按目标值比例计算查找位置(mid = low + (key - arr [low])/(arr [high]-arr [low])×(high-low)) |
| 斐波那契查找 | O(logn) | O(1) | 有序数组、不希望频繁除法运算场景 | 基于斐波那契数列分割区间,减少除法操作 |
| 哈希查找 | O (1)(平均)/O (n)(最坏) | O(n) | 大规模数据快速查找 | 哈希函数映射关键字到存储地址,解决冲突(链地址法、开放定址法) |
| 二叉搜索树查找 | O (logn)(平均)/O (n)(最坏) | O (logn)(递归栈) | 动态数据集合(插入删除频繁) | 利用 BST 性质,左小右大,递归遍历查找 |
补充说明(高频考点):
-
二分查找边界条件 :需明确区间定义(如左闭右闭
[low, h``igh],终止条件low > high;左闭右开[low, high),终止条件low == high),是专转本选择题、编程题常考考点。 -
哈希冲突解决:
-
链地址法:冲突元素构成链表,适用于冲突频繁场景(如 Java HashMap 底层)。
-
开放定址法:线性探测(冲突后顺序找下一个空位置)、二次探测(冲突后按平方步长查找)、再哈希法(更换哈希函数)。
- 查找算法对比:二分查找效率高于顺序查找,但依赖有序结构;哈希查找效率最高,但需额外空间且存在冲突;二叉搜索树查找适合动态数据,平衡后效率最优。
多媒体技术基础(考纲新增模块):
多媒体概念与特征:
-
定义:融合文本、图形、图像、音频、视频、动画等多种媒体形式,通过计算机进行采集、处理、存储、传输和展示的技术。
-
核心特征:集成性(多种媒体融合)、交互性(用户可控制媒体播放)、实时性(媒体传输和展示无延迟)、数据量大(如视频、音频文件)。
多媒体数据压缩技术(必考):
-
压缩必要性:多媒体数据量大(如未经压缩的 1080P 视频每秒约 200MB),存储和传输成本高,需通过压缩降低数据量。
-
压缩分类:
-
无损压缩:压缩后可完全恢复原始数据,无失真,适用于文本、程序、珍贵图像(如 PNG、GIF、ZIP、RAR)。
-
有损压缩:牺牲部分数据换取高压缩比,解压后无法完全恢复原始数据,适用于音频、视频、普通图像(如 JPEG、MP3、MP4)。
- 常用压缩标准:
-
图像压缩:JPEG(有损,适用于照片)、PNG(无损,适用于透明图像、图标)、GIF(无损,支持动画,最多 256 色)。
-
音频压缩:MP3(有损,压缩比 10:1,主流音频格式)、WAV(无损,未压缩,音质好但文件大)、AAC(有损,比 MP3 音质好,压缩比更高)。
-
视频压缩:MPEG-4(有损,支持流媒体,如 MP4 格式)、H.264(高效压缩,广泛用于视频网站、监控)、H.265(HEVC,压缩比是 H.264 的 2 倍,支持 4K/8K 视频)。
多媒体文件格式与设备:
- 文件格式对比:
| 媒体类型 | 格式 | 特性描述 | 典型应用场景 |
|---|---|---|---|
| 图像 | JPEG | 有损压缩/色彩表现力强 | 摄影作品/网页图像 |
| 图像 | PNG | 无损压缩/支持透明通道 | 品牌标识/透明背景设计 |
| 图像 | GIF | 无损压缩/支持动画/256色限制 | 动态表情/简易动画 |
| 音频 | MP3 | 有损压缩/高压缩比 | 音乐播放/语音传输 |
| 音频 | WAV | 无损格式/原始音质 | 专业音频制作/录音母带 |
| 视频 | MP4 | 有损压缩/流媒体兼容 | 在线视频/移动端播放 |
| 视频 | AVI | 无压缩/高保真 | 视频后期制作/本地存储 |
| 动画 | SWF | 矢量格式/文件小巧 | 网页交互元素(渐趋淘汰) |
| 动画 | GIF | 帧动画/透明背景支持 | 网页微动画/动态图标 |
- 多媒体设备:
-
输入设备:扫描仪(图像输入)、数码相机(图像 / 视频输入)、麦克风(音频输入)、摄像头(视频输入)。
-
输出设备:显示器(图像 / 视频输出)、音箱(音频输出)、打印机(图像输出)、投影仪(图像 / 视频输出)。
-
处理设备:显卡(图形 / 视频渲染)、声卡(音频处理)。
计算机网络基础(考纲核心模块):
.
网络基本概念与分类:
-
定义:将地理上分散的、具有独立功能的计算机系统,通过通信设备和通信线路连接,由网络操作系统和网络协议管理,实现资源共享和信息交换的系统。
-
核心功能:资源共享(硬件、软件、数据)、信息交换(邮件、即时通讯)、分布式处理(协同完成复杂任务)、负载均衡(分散任务到多个节点)。
-
分类:
-
按地理范围:
-
局域网(LAN):范围小(如校园网、企业网),距离≤1km,速率高(100Mbps-10Gbps),延迟低。
-
城域网(MAN):范围中等(如城市范围),距离 1-100km,速率 10-100Mbps。
-
广域网(WAN):范围大(如互联网),距离 > 100km,速率较低(1Mbps-1Gbps),延迟高。
-
-
按拓扑结构(考纲重点):
-
总线型:所有节点连接到一条总线,结构简单、成本低,故障影响整个网络(已淘汰)。
-
星型:所有节点连接到中心设备(交换机、路由器),结构稳定、故障易排查,是当前主流(如家庭网络)。
-
环型:节点连成环形,数据沿环传输,适用于令牌环网,故障影响整个网络(较少用)。
-
树型:层次化结构(如校园网的主干网 - 子网),易扩展、管理方便。
-
网状型:每个节点与多个节点连接,可靠性高、容错性强,适用于骨干网(如互联网核心层)。
-
-
按传输介质:有线网络(双绞线、同轴电缆、光纤)、无线网络(WiFi、蓝牙、5G)。
OSI/RM 与 TCP/IP 参考模型(必考):
- OSI/RM(开放式系统互联参考模型):7 层结构,从下到上:
-
物理层:传输比特流(0/1),定义硬件接口(如网线、网卡、RJ45 接口),协议:RS-232、RJ45。
-
数据链路层:传输帧,实现差错检测与纠正(如 CRC 校验)、MAC 地址寻址,协议:以太网(Ethernet)、PPP。
-
网络层:传输分组,实现路由选择(跨网络传输)、IP 地址寻址,协议:IP、ICMP、ARP。
-
传输层:传输段 / 报文,实现端到端可靠传输、流量控制、差错恢复,协议:TCP(可靠)、UDP(不可靠)。
-
会话层:建立、管理和终止会话(如连接建立),协议:RPC、SQL。
-
表示层:数据格式转换(如加密、解密、压缩、解压)、编码转换(如 ASCII→Unicode)。
-
应用层:为应用程序提供网络服务,协议:HTTP、FTP、SMTP、DNS、Telnet。
- TCP/IP 参考模型:4 层结构(实际应用主流),与 OSI 对应关系:
-
网络接口层(物理层 + 数据链路层):处理硬件接口和帧传输。
-
网络层(互联网层):IP 地址、路由选择,核心协议 IP。
-
传输层:TCP、UDP 协议,端到端传输。
-
应用层(会话层 + 表示层 + 应用层):HTTP、FTP 等应用协议。
- 核心区别:OSI 分层清晰但复杂,未广泛应用;TCP/IP 简洁实用,是互联网的实际标准。
网络协议与核心技术(必考):
- IP 地址与子网掩码:
-
IP 地址:32 位二进制数,分为 IPv4(32 位,如 192.168.1.1)和 IPv6(128 位,解决 IPv4 地址枯竭)。
-
IPv4 地址分类:
-
A 类:1.0.0.0-126.255.255.255,默认子网掩码 255.0.0.0,适用于大型网络。
-
B 类:128.0.0.0-191.255.255.255,默认子网掩码 255.255.0.0,适用于中型网络。
-
C 类:192.0.0.0-223.255.255.255,默认子网掩码 255.255.255.0,适用于小型网络(如家庭、企业)。
-
D 类:224.0.0.0-239.255.255.255,用于组播。
-
E 类:240.0.0.0-255.255.255.255,保留用于科研。
-
-
子网掩码:用于区分 IP 地址的网络位和主机位,如 C 类地址子网掩码 255.255.255.0,前 24 位为网络位,后 8 位为主机位。
-
私有 IP 地址(局域网使用,不能直接访问互联网):
-
A 类:10.0.0.0-10.255.255.255。
-
B 类:172.16.0.0-172.31.255.255。
-
C 类:192.168.0.0-192.168.255.255。
-
- TCP 与 UDP 协议对比:
| 协议 | 可靠性 | 连接性 | 流量控制 | 拥塞控制 | 传输速度 | 典型应用场景 |
|---|---|---|---|---|---|---|
| TCP | 高可靠性(三次握手确认,自动重传机制) | 面向连接(需三次握手建立连接,四次挥手断开) | 支持(滑动窗口机制) | 支持 | 较慢 | 网页浏览(HTTP)、文件传输(FTP)、电子邮件(SMTP) |
| UDP | 无可靠性保证(无连接建立,不保证送达) | 无连接 | 不支持 | 不支持 | 极快 | 实时视频流、语音通话(VoIP)、在线游戏、DNS查询 |
- 常用应用层协议:
-
HTTP(超文本传输协议):端口 80,用于网页传输(明文传输,不安全)。
-
HTTPS(HTTP+SSL/TLS):端口 443,加密传输,安全(如网银、购物网站)。
-
FTP(文件传输协议):端口 21(控制)、20(数据),用于文件上传下载。
-
SMTP(简单邮件传输协议):端口 25,用于发送邮件。
-
POP3(邮局协议版本 3):端口 110,用于接收邮件。
-
DNS(域名系统):端口 53,将域名(如www.baidu.com)解析为 IP 地址。
-
Telnet:端口 23,远程登录(明文传输,不安全,已被 SSH 替代)。
- 网络设备(考纲重点):
-
网卡(NIC):计算机连接网络的硬件接口,有唯一 MAC 地址(48 位二进制数,如 00-1A-2B-3C-4D-5E)。
-
交换机(Switch):数据链路层设备,基于 MAC 地址转发帧,分割冲突域,提高网络速率(如千兆交换机)。
-
路由器(Router):网络层设备,基于 IP 地址转发分组,实现跨网络路由选择,分割广播域(如家庭路由器连接局域网和互联网)。
-
网关(Gateway):连接不同协议的网络,实现协议转换(如局域网与互联网的网关)。
-
集线器(Hub):物理层设备,共享带宽,所有节点在同一冲突域,已淘汰。
网络安全(考纲新增重点):
- 网络安全威胁:
-
恶意攻击:病毒(自我复制,破坏文件)、蠕虫(无需宿主,主动传播)、木马(伪装正常程序,窃取信息)、勒索病毒(加密文件,索要赎金)。
-
网络攻击:黑客入侵(未经授权访问)、DDoS 攻击(分布式拒绝服务,占用服务器资源)、ARP 欺骗(伪造 MAC 地址,窃取数据)、SQL 注入(利用 SQL 漏洞获取数据库信息)、XSS 攻击(跨站脚本攻击,注入恶意脚本)。
-
信息泄露:密码泄露、数据窃取(如用户信息泄露)。
- 网络安全防护技术:
-
防火墙(Firewall):隔离内部网络和外部网络,按规则允许 / 拒绝数据传输(如阻止非法端口访问)。
-
加密技术:对称加密(如 AES,加密解密用同一密钥,速度快)、非对称加密(如 RSA,公钥加密,私钥解密,安全但速度慢)。
-
杀毒软件 / 安全软件:检测和清除病毒、木马,实时防护(如 360 安全卫士、卡巴斯基)。
-
访问控制:设置用户名密码、权限管理(如 Windows 用户账户控制)、双因素认证(密码 + 验证码)。
-
数据备份与恢复:定期备份重要数据,防止数据丢失(如本地备份、云备份)。
-
安全协议:HTTPS、SSH、IPsec 等,加密传输数据。
- 网络安全策略:定期更新系统和软件补丁、使用强密码、不打开可疑邮件和附件、避免公共 WiFi 下传输敏感信息。
。
专转本计算机信息导论
一、信息和信息系统(基础核心考点)
(一)信息
- 定义深度解析
-
本质:信息是数据经过加工处理后形成的、对接收者决策或行动具有实际价值的知识或情报。数据是信息的 "原材料",信息是数据的 "成品",二者关系可总结为:数据 → 加工处理(分类、分析、解释)→ 信息 → 应用(决策、控制)→ 价值。
-
示例:
-
数据:"2024 年 3 月江苏某高校专转本报考人数 12000 人,录取人数 3000 人"(原始事实,无明确意义);
-
信息:"2024 年 3 月江苏某高校专转本录取率 25%,竞争较激烈,需重点备考核心考点"(经计算、解读后对考生有决策价值的内容)。
-
-
考纲易错点:区分 "数据" 与 "信息" 的核心在于 "是否有价值""是否经过加工",选择题常考二者定义辨析。
- 特征细化与实例
-
可共享性:信息可被多个主体同时获取和使用,且共享过程中不会产生损耗(与物质资源的 "独占性" 相反)。
示例:一本备考资料可被多名考生同时阅读,每个考生获得的价值不受影响;网课视频可被无数用户观看,资源本身无消耗。
-
可传递性:信息可通过多种媒介(文字、声音、图像、网络)在不同空间和时间传递,传递速度决定信息价值发挥的效率。
示例:专转本考试大纲通过教育厅官网、培训机构通知等渠道快速传递给全省考生;实时疫情数据通过新闻、APP 推送传递给公众。
-
可处理性:信息可通过分类、排序、筛选、压缩、转换、分析等方式优化,提升其价值密度。
示例:将零散的考点按 "考纲频率" 分类排序,形成高频考点清单;对海量真题数据进行统计分析,找出命题规律。
-
时效性:信息的价值随时间推移而衰减,不同信息的时效周期差异显著。
示例:专转本考试真题的价值在考试前最高,考试结束后价值大幅降低;天气预报的价值集中在预报时段内,过时后无实际意义。
-
真伪性:信息存在真实与虚假之分,需通过权威来源、逻辑验证等方式辨别,虚假信息可能导致决策失误。
示例:官方发布的考纲是真实信息,网传 "内部押题卷" 可能为虚假信息;虚假的就业数据会误导考生专业选择。
-
依附性:信息必须依附于特定的载体(物质或非物质)才能存在和传递,无载体的信息无法被感知和使用。
示例:备考知识点依附于教材、笔记、网课视频等载体;口头通知依附于声音载体;电子文档依附于计算机硬盘、U 盘等存储载体。
-
考纲重点:特征类题目常以 "下列属于信息特征的是""下列不属于信息特征的是" 形式考查,需结合实例记忆,避免混淆 "依附性" 与 "可共享性"。
- 生命周期全流程拆解(考纲新增细节考点)
-
收集:核心是 "获取原始数据",需保证数据的准确性、完整性和时效性,是信息生命周期的基础。
方法:调查法(问卷调查、访谈)、观测法(现场记录)、传感法(传感器采集)、网络爬虫(获取网络数据)、数据库提取(从已有系统导出)。
示例:备考时收集历年真题(网络爬虫 + 官方渠道)、考点分布数据(培训机构统计)。
-
传输:将收集到的原始数据或初步处理的信息通过通信媒介传递到目标终端,需解决 "传输速度""传输安全""传输准确性" 问题。
传输媒介:有线(双绞线、光纤、网线)、无线(WiFi、5G、蓝牙)、存储介质(U 盘、移动硬盘)。
关键技术:加密传输(防止信息泄露)、差错控制(如校验码,避免传输过程中数据丢失或出错)。
-
处理:信息生命周期的核心环节,通过多种技术手段将原始数据转化为有价值的信息。
具体操作:
-
预处理:数据清洗(去除重复、错误数据)、数据转换(统一格式,如将文本数据转为数值数据);
-
深度处理:分类(按考点类型分类)、排序(按考频排序)、统计分析(计算录取率、考点出现频次)、数据挖掘(找出考点关联规律)。
-
-
存储:将处理后的信息长期或临时保存,以便后续使用,需考虑 "存储容量""存储安全""存取速度"。
存储方式:
-
本地存储:计算机硬盘、U 盘、移动硬盘(优点:存取快,缺点:容量有限、易损坏);
-
网络存储:云存储(阿里云、百度云)、服务器存储(优点:容量大、可远程访问,缺点:依赖网络)。
存储技术:RAID(磁盘阵列,提高存储可靠性和读写速度)、数据备份(定期备份防止数据丢失)。
-
-
使用:信息价值实现的最终环节,将信息应用于具体场景,支持决策、控制、交流等活动。
示例:考生使用 "考点频率统计信息" 制定备考计划(决策);企业使用 "用户消费信息" 优化产品推荐(控制);师生通过 "知识点讲解信息" 交流学习(交流)。
-
销毁:对不再需要的信息进行安全处置,防止信息泄露,尤其针对敏感信息(如个人隐私、商业机密)。
销毁方式:
-
物理销毁:硬盘粉碎、U 盘折断(针对本地存储介质);
-
逻辑销毁:数据覆盖、加密删除(针对网络存储或电子文档),避免简单删除后被恢复。
-
-
考纲考点:信息生命周期的 "处理""存储" 环节是选择题、填空题高频考点,需掌握核心操作和技术手段。
(二)信息系统
- 定义深度拆解
-
核心要素:"人、硬件、软件、数据、规程" 缺一不可,是一个有机整体,而非孤立组件的堆砌。
-
核心目标:"支持组织决策、协调和控制",本质是为了解决特定问题(如企业管理、教育备考、政务处理)而构建的工具。
-
示例:专转本备考信息系统,由 "考生(人)、计算机 / 手机(硬件)、备考 APP / 网课软件(软件)、考点数据 / 真题数据(数据)、使用规则 / 备考流程(规程)" 组成,目标是帮助考生高效备考、提高录取率。
- 基本组成细化与功能
-
人(核心参与者):
-
使用者:直接操作信息系统的主体(如考生、企业员工、政务人员);
-
管理者:负责系统的日常运维、权限分配、故障处理(如学校信息中心管理员、企业 IT 运维人员);
-
开发者:设计、开发、升级信息系统的技术人员(如软件工程师、数据分析师)。
考纲易错点:信息系统的 "人" 不仅指使用者,还包括管理者和开发者,选择题常考 "信息系统组成是否包含人"(必包含)。
-
-
硬件(物理基础):
-
计算机设备:服务器(存储和处理数据的核心设备,如备考 APP 的后台服务器)、终端设备(个人电脑、手机、平板,考生直接操作的设备);
-
网络设备:交换机(连接局域网内设备)、路由器(连接不同网络,如考生手机通过路由器访问备考服务器)、网卡(设备接入网络的接口);
-
外围设备:打印机(打印备考资料)、扫描仪(扫描纸质真题转为电子数据)、存储设备(U 盘、移动硬盘)。
-
-
软件(核心功能载体):
-
系统软件:支撑信息系统运行的基础软件,无需用户自主开发,包括操作系统(Windows、iOS、Android)、数据库管理系统(MySQL、Oracle,用于管理数据)、驱动程序(使硬件正常工作的软件);
-
应用软件:为特定需求开发的专用软件,直接满足用户需求,如备考 APP(提供考点、真题、刷题功能)、企业 ERP 系统(管理采购、销售、库存)、政务办公系统(处理公文流转)。
-
-
数据(核心处理对象):
-
输入数据:进入系统的原始数据(如考生输入的刷题记录、企业录入的销售数据);
-
处理数据:正在系统中被加工的中间数据(如备考 APP 统计的考生错题类型、企业计算的月度销售额);
-
输出数据:系统处理后产生的结果数据(如考生的备考报告、企业的销售分析报表)。
数据类型:结构化数据(数据库表、Excel 表格,如考点清单)、半结构化数据(JSON、XML,如 APP 接口返回的数据)、非结构化数据(文本、图像、视频,如真题解析视频)。
-
-
规程(运行保障):
-
规则:系统使用的权限规则(如考生只能查看自己的备考数据,管理员可查看所有数据)、数据安全规则(如密码加密存储、敏感数据脱敏);
-
政策:与系统相关的管理制度(如企业数据保密政策、学校信息系统使用规范);
-
流程:信息处理的标准化步骤(如备考 APP"刷题→错题统计→考点强化" 流程、企业 "销售数据录入→审核→统计分析" 流程)。
-
- 主要类型深度解析(考纲高频考点)
-
事务处理系统(TPS):
-
定义:面向基层业务人员,处理日常重复性、结构化的业务事务,核心是 "数据记录与处理",确保业务流程的高效、准确运行。
-
核心特征:处理量大、速度快、准确性要求高、流程固定。
-
典型示例:
-
企业:销售订单系统(记录客户订单信息)、库存管理系统(记录商品入库 / 出库数据)、工资发放系统(计算和记录员工工资);
-
教育:学校教务系统(记录学生选课、成绩录入)、专转本报名系统(记录考生报名信息、审核状态)。
-
-
考纲考点:TPS 的 "结构化事务处理""基层用户" 是核心识别点,选择题常考类型判断。
-
-
管理信息系统(MIS):
-
定义:面向中层管理者,以 TPS 的数据为基础,通过汇总、统计、分析生成定期报表(如日报、周报、月报),支持中层管理者的结构化决策(决策目标明确、流程固定)。
-
核心特征:数据来源于 TPS、输出形式为报表、支持结构化决策、面向中层管理。
-
典型示例:
-
企业:销售管理系统(生成月度销售报表、区域销售排名)、财务分析系统(生成月度收支报表);
-
教育:高校招生管理系统(生成各专业报考人数、录取率报表)、班级成绩管理系统(生成班级平均分、及格率报表)。
-
-
与 TPS 的区别:TPS 侧重 "记录事务",MIS 侧重 "分析事务数据并生成报表",选择题常考二者功能对比。
-
-
决策支持系统(DSS):
-
定义:面向高层管理者,整合多个系统(TPS、MIS)的数据,提供灵活的分析工具(如数据挖掘、模型计算),支持半结构化和非结构化决策(决策目标模糊、流程不固定)。
-
核心特征:数据来源广泛、分析工具灵活、支持非结构化决策、面向高层管理。
-
典型示例:
-
企业:市场战略决策系统(分析市场趋势、竞争对手数据,辅助制定年度市场策略)、投资决策系统(分析项目收益、风险,辅助决定是否投资);
-
教育:教育部门招生计划决策系统(分析历年报考数据、就业数据,辅助制定下一年度专转本招生计划)。
-
-
与 MIS 的区别:MIS 提供 "固定报表",支持 "结构化决策";DSS 提供 "灵活分析工具",支持 "非结构化决策",是考纲重点对比考点。
-
-
专家系统(ES):
-
定义:一种智能信息系统,模拟特定领域人类专家的知识和推理过程,能够解决该领域的复杂问题,核心是 "知识库" 和 "推理机"。
-
核心组成:
-
知识库:存储领域专家的知识(如医学诊断规则、法律条文、备考考点解题技巧);
-
推理机:根据用户输入的问题,调用知识库中的知识进行逻辑推理,得出结论或解决方案。
-
-
典型示例:
-
医疗:疾病诊断专家系统(输入患者症状,推理可能的疾病及治疗方案);
-
教育:专转本考点答疑专家系统(输入题目,推理解题思路和考点关联);
-
其他:法律咨询专家系统、故障诊断专家系统(如汽车故障诊断)。
-
-
-
办公自动化系统(OAS):
-
定义:面向办公人员,整合文字处理、文件管理、通信协作等功能,实现办公流程的自动化、数字化,提高办公效率。
-
核心功能:文字处理(Word)、表格处理(Excel)、邮件收发(Outlook)、日程安排、公文流转、文件共享(如企业微信、钉钉的办公功能)。
-
典型示例:学校的教务办公系统(教师提交教学计划、审核教案)、企业的 OA 系统(员工提交请假申请、报销流程)。
- 数据管理发展阶段:
-
-
人工管理阶段(无数据库,数据与程序绑定,冗余大)。
-
文件系统阶段(数据存储为文件,有冗余,独立性差)。
-
数据库系统阶段(数据结构化、共享性高、冗余低、独立性强、由 DBMS 统一管理)。
- 数据库系统组成:
-
硬件:计算机、存储设备(满足大数据存储和高并发访问)。
-
软件:数据库管理系统(DBMS,如 MySQL、SQL Server、Oracle)、操作系统、应用程序。
-
数据:数据库中存储的结构化数据集合(如学生表、成绩表)。
-
人员:数据库管理员(DBA,负责维护和管理数据库)、开发人员、用户。
- 核心概念:
-
数据库(DB):长期存储在计算机内的、有组织的、可共享的数据集合。
-
数据库管理系统(DBMS):管理数据库的软件,提供数据定义、查询、插入、删除、更新等功能。
-
数据库系统(DBS):DB + DBMS + 硬件 + 人员的总称。
-
数据模型:描述数据的结构和关系,分为概念模型(E-R 模型)和逻辑模型(层次模型、网状模型、关系模型)。
关系模型与 E-R 图(必考):
- 关系模型核心要素:
-
关系(表):由行(元组 / 记录)和列(属性 / 字段)组成,如
学生(学号, 姓名, 性别, 年龄)。 -
主键(PK):唯一标识表中记录的属性(组),如学号(唯一且非空)。
-
外键(FK):引用其他表主键的属性,用于建立表之间的关联,如成绩表中的学号(引用学生表的学号)。
-
域:属性的取值范围,如性别域为 {男,女}。
-
关系完整性:
-
实体完整性:主键非空且唯一。
-
参照完整性:外键必须引用其他表的主键值或为 NULL。
-
用户定义完整性:自定义规则(如年龄≥18、成绩 0-100 分)。
-
- E-R 模型(实体 - 联系模型):
-
实体:现实世界中的客观事物(如学生、课程,用矩形表示)。
-
属性:实体的特征(如学生的学号、姓名,用椭圆形表示,与实体用线连接)。
-
联系:实体之间的关系(用菱形表示,与实体用线连接,标注联系类型)。
-
联系类型:
-
一对一(1:1):如学生与身份证号(一个学生对应一个身份证号,一个身份证号对应一个学生)。
-
一对多(1:N):如班级与学生(一个班级有多个学生,一个学生属于一个班级)。
-
多对多(M:N):如学生与课程(一个学生可选多门课程,一门课程可被多个学生选择,需通过中间表转换为两个一对多关系)。
-
- E-R 图转换为关系表规则:
-
实体→关系表(属性为表的字段,主键为实体的主键)。
-
1:1 联系:可在任一表中添加另一表的主键作为外键。
-
1:N 联系:在 N 端表中添加 1 端表的主键作为外键。
-
M:N 联系:创建中间表,包含两个实体的主键作为外键,中间表的主键可为两个外键的组合。
SQL 语言基础(必考):
- SQL 分类:
-
数据定义语言(DDL):创建、修改、删除数据库对象(表、视图、索引),关键字:CREATE、ALTER、DROP。
-
数据操纵语言(DML):插入、删除、更新数据,关键字:INSERT、DELETE、UPDATE。
-
数据查询语言(DQL):查询数据,关键字:SELECT(核心)。
-
数据控制语言(DCL):控制数据访问权限,关键字:GRANT、REVOKE。
-
核心 SQL 语句(考纲高频考点):
CREATE TABLE 学生(
学号 CHAR(10) PRIMARY KEY, -- 主键
姓名 VARCHAR(20) NOT NULL, -- 非空
性别 CHAR(2) CHECK(性别 IN ('男', '女')), -- 检查约束
年龄 INT DEFAULT 18, -- 默认值
班级号 CHAR(6),
FOREIGN KEY (班级号) REFERENCES 班级(班级号) -- 外键
);
-
创建表:
-
插入数据:
INSERT INTO 学生(学号, 姓名, 性别, 班级号) VALUES('2023001', '张三', '男', '230101');
-
更新数据:
UPDATE 学生 SET 年龄=20 WHERE 学号='2023001'; -- 必须加WHERE,否则更新所有记录
-
删除数据:
DELETE FROM 学生 WHERE 学号='2023001'; -- 必须加WHERE,否则删除所有记录
-
查询数据(重点):
-- 基本查询
SELECT 姓名, 年龄 FROM 学生 WHERE 班级号='230101' ORDER BY 年龄 DESC;
-- 聚合查询(COUNT/SUM/AVG/MAX/MIN)
SELECT 班级号, COUNT(学号) AS 人数, AVG(成绩) AS 平均分 FROM 成绩 GROUP BY 班级号 HAVING AVG(成绩)≥80;
-- 多表连接查询(内连接)
SELECT 学生.姓名, 课程.课程名, 成绩.分数 FROM 学生
JOIN 成绩 ON 学生.学号=成绩.学号
JOIN 课程 ON 成绩.课程号=课程.课程号
WHERE 成绩.分数≥90;
-- 子查询
SELECT 姓名 FROM 学生 WHERE 学号 IN (SELECT 学号 FROM 成绩 WHERE 分数≥90);
- SQL 高级特性:
-
视图:虚拟表,基于查询结果创建,简化查询,隐藏数据细节(
CREATE VIEW 优秀学生 AS SELECT * FROM 学生 WHERE 成绩≥85;)。 -
索引:提高查询效率,避免全表扫描(
CREATE INDEX idx_学生_班级号 ON 学生(班级号);),主键默认创建唯一索引。 -
事务:保证数据一致性,ACID 特性(原子性、一致性、隔离性、持久性),关键字:BEGIN TRANSACTION、COMMIT、ROLLBACK。
数据库设计规范(三大范式):
-
第一范式(1NF):列不可再分(原子性),如 "联系方式" 不能同时存储电话和邮箱,需拆分为 "电话" 和 "邮箱" 字段。
-
第二范式(2NF):在 1NF 基础上,消除部分函数依赖(非主键字段必须完全依赖主键,而非依赖主键的一部分),适用于复合主键场景。
-
第三范式(3NF):在 2NF 基础上,消除传递函数依赖(非主键字段不能依赖其他非主键字段),如学生表中不能包含 "班级名称"(应通过班级号关联班级表查询)。
- 补充:实际设计中可适当反范式化(如冗余部分字段),以提高查询效率。
二、物联网(IoT)(考纲高频考点,侧重架构与技术)
(一)核心概念深度解析
-
本质:"万物互联" 的核心是打破 "物" 与 "人""物" 与 "物" 之间的信息壁垒,让物理世界的 "物" 具备 "感知""通信""交互" 能力,实现物理世界与数字世界的融合。
-
关键要素:
-
连接对象:"任何物品"(实体物体,如家电、汽车、传感器、商品、设备);
-
连接方式:"按约定的协议"(如 WiFi、蓝牙、ZigBee、5G,确保不同设备之间能通信);
-
核心目标:"智能化识别、定位、跟踪、监控和管理"(从 "被动存在" 变为 "主动提供信息、接受控制")。
-
-
考纲易错点:物联网的连接对象不仅是 "物与人",还包括 "物与物"(如智能冰箱与超市服务器通信,自动下单补货),选择题常考这一核心本质。
(二)三层架构细化(必考考点,拆解每层技术与功能)
- 感知层(底层:数据采集层,物联网的 "五官")
-
核心功能:感知物理世界的状态、环境参数、物体标识等,将物理量转化为可传输的数字信号(或模拟信号),是物联网的数据来源。
-
关键设备与技术:
-
传感器:核心采集设备,能将温度、湿度、压力、光照、声音、位移等物理量转化为电信号(数字或模拟)。
分类及示例:
-
环境传感器:温度传感器(监测室内温度,用于智能家居温控)、湿度传感器(监测仓库湿度,防止商品受潮)、空气质量传感器(监测 PM2.5,用于环境监测系统);
-
运动传感器:加速度传感器(检测汽车碰撞,触发安全气囊)、陀螺仪(检测手机姿态,用于导航 APP);
-
其他传感器:压力传感器(监测管道压力,用于工业监控)、光照传感器(调节智能路灯亮度)。
-
-
RFID(射频识别技术):无需接触即可识别目标对象,核心由 "RFID 标签" 和 "RFID 读写器" 组成。
工作原理:读写器发射无线电波,标签接收后返回存储的信息(如商品 ID、生产日期),实现快速识别和数据读取。
典型应用:物流快递分拣(通过 RFID 标签识别包裹目的地)、商品防伪(正品贴 RFID 标签,扫码验证)、图书馆图书管理(图书贴标签,快速借还登记)。
-
二维码 / 条形码:低成本的物体标识技术,通过图形编码存储信息,需通过扫码设备(手机摄像头、扫码枪)读取。
区别:条形码只能存储少量字符(如商品编号),二维码可存储更多信息(文字、网址、图片,如健康码存储个人身份和核酸信息)。
应用:商品零售(超市扫码结账)、防疫健康码、景区门票核销。
-
摄像头 / 图像采集设备:采集图像或视频数据,用于视觉识别、监控跟踪。
应用:智能监控(识别异常行为)、人脸识别门禁(采集人脸图像比对身份)、交通违章抓拍(采集车辆图像识别车牌)。
-
GPS / 北斗定位:获取物体的地理位置信息,用于定位和跟踪。
应用:网约车定位(乘客实时查看司机位置)、物流车辆跟踪(监控货车行驶路线)、共享单车定位(用户查找附近车辆)。
-
-
考纲重点:感知层的核心设备(传感器、RFID、二维码)及其应用场景,是填空题、选择题高频考点,需准确对应。
- 网络层(中间层:数据传输层,物联网的 "神经网络")
-
核心功能:将感知层采集到的数据(数字信号)可靠、高效地传输到应用层,解决 "数据怎么传""传得快不快""传得安全不安全" 的问题。
-
关键技术与通信协议:
-
移动通信网络(4G/5G):支持远距离、高带宽、海量设备接入,是物联网的核心传输技术。
应用场景:车联网(自动驾驶车辆传输实时路况数据)、远程医疗(手术机器人传输高清视频)、智能城市(路灯、监控设备的远程数据传输)。
-
短距离无线通信技术:
-
WiFi:传输速率高(适合大数据量传输,如智能电视连接网络播放视频),但功耗较高;
-
蓝牙(Bluetooth):功耗低、距离近(10 米内),适合设备间近距离通信(如智能手环与手机同步数据、蓝牙音箱连接手机播放音乐);
-
ZigBee:低功耗、低速率、低复杂度,适合海量低功耗设备接入(如智能家居的灯光、窗帘、传感器之间的通信);
-
LoRa:低功耗、远距离(几公里),适合户外物联网设备(如农田传感器传输土壤湿度数据)。
-
-
网关(协议转换器):物联网设备种类多,通信协议不同(如传感器用 ZigBee,手机用 WiFi),网关的作用是将不同协议的数据包转换为统一协议(如 TCP/IP),确保数据能在网络中传输。
示例:智能家居网关将灯光、窗帘的 ZigBee 信号转换为 WiFi 信号,与手机 APP 通信。
-
核心传输协议:TCP/IP 协议(互联网通用协议,确保跨网络传输)、MQTT 协议(轻量级协议,适合低功耗、低带宽设备,如传感器数据传输)。
-
-
考纲重点:短距离无线通信技术(WiFi、蓝牙、ZigBee)的区别与应用场景,网关的功能,是选择题常考考点。
- 应用层(顶层:数据处理与应用层,物联网的 "大脑")
-
核心功能:接收网络层传输的数据,通过计算、分析、处理,将数据转化为实际的智能服务或解决方案,是物联网价值实现的核心层。
-
关键支撑技术:
-
云计算:提供海量数据存储和强大的计算能力(如存储全国物联网设备的监控数据,分析城市交通流量);
-
大数据分析:挖掘数据中的规律和价值(如分析用户使用智能家电的习惯,优化能耗);
-
人工智能:实现自主决策和智能控制(如自动驾驶车辆根据路况数据自动调整车速、避让障碍物)。
-
-
典型应用场景深度解析:
-
智能家居:整合灯光、空调、冰箱、扫地机器人等设备,通过手机 APP 或语音控制,实现自动化场景(如 "回家模式":门锁解锁后,灯光自动打开、空调调至适宜温度、窗帘拉开);
-
智能交通:
-
车联网(V2X):车辆与车辆、车辆与道路设施、车辆与云端通信,实现自动驾驶、交通拥堵预警(如前方车辆急刹车,自动通知后方车辆);
-
智能红绿灯:根据实时车流量数据调整红绿灯时长,优化通行效率;
-
-
工业物联网(IIoT):工业设备(如机床、生产线)安装传感器,实时监测设备运行状态(温度、振动),预测设备故障,实现预防性维护(避免突然停机造成损失);
-
环境监测:在城市、农田、森林部署传感器,实时监测空气质量、土壤湿度、森林火情,数据传输到云端后,生成环境报告或触发预警(如森林火情传感器检测到高温,自动报警);
-
智慧医疗:可穿戴设备(如智能手环)监测患者心率、血压,数据实时传输到医院系统,医生远程监控患者健康状况,异常时及时干预。
-
-
考纲重点:应用层的典型应用场景(智能家居、智能交通、工业物联网),及其与云计算、大数据、AI 的结合,是简答题常考考点。
(三)关键技术补充(考纲延伸考点)
-
无线传感网络(WSN):由大量微型传感器节点(感知层设备)组成的自组织网络,节点之间通过无线通信协作,共同完成数据采集和传输。
特点:节点数量多、分布广、功耗低、自组织(无需人工部署网络拓扑),适用于大规模环境监测(如农田、森林)。
-
嵌入式系统:将计算机硬件和软件集成到物理设备中,实现对设备的智能控制,是物联网设备的 "核心控制器"。
示例:智能家电的控制芯片(控制家电运行)、自动驾驶车辆的嵌入式系统(处理传感器数据并控制车辆)。
-
M2M 通信(机器对机器通信):无需人工干预,设备之间自动进行数据交换和通信,是物联网的核心通信模式。
示例:智能冰箱监测到牛奶存量不足,自动与超市服务器通信,下单补货;工业传感器监测到设备故障,自动发送报警信息到管理员手机。
三、移动互联网(考纲新增考点,侧重技术与应用)
(一)概念深度解析
-
本质:移动互联网是互联网技术与移动通信技术的深度融合,核心变化是 "接入终端从固定 PC 变为移动终端(手机、平板)""接入方式从有线变为无线",实现 "随时随地访问互联网服务"。
-
核心区别于传统互联网:
| 对比维度 | 移动互联网 | 传统互联网 |
|---|---|---|
| 接入终端 | 手机、平板、智能手表(便携、移动) | PC、笔记本(固定、不便携) |
| 接入方式 | 无线(4G/5G、WiFi、蓝牙) | 有线(网线、光纤)为主 |
| 服务形态 | 即时性、个性化、碎片化(如短视频、移动支付) | 固定场景、批量服务(如网页浏览、下载) |
| 用户行为 | 随时随地使用(如通勤时刷视频、购物) | 固定地点使用(如办公室、家里) |
- 考纲易错点:移动互联网的核心特征是 "移动性" 和 "即时性",选择题常考与传统互联网的区别。
(二)核心支撑技术细化
- 移动通信技术(4G/5G)
-
4G(LTE):
-
核心参数:理论下行速度 100Mbps~1Gbps,延迟 50ms 左右,支持高清视频、在线游戏、移动支付等主流应用,是当前移动互联网的主流技术。
-
关键技术:正交频分复用(OFDM,提高频谱利用率)、多输入多输出(MIMO,提高传输速率)。
-
-
5G(第五代移动通信技术):
-
三大应用场景(考纲必考):
-
eMBB(增强移动宽带):高带宽,理论速度 10Gbps 以上,支持 4K/8K 视频、VR/AR、云游戏(如 VR 沉浸式网课);
-
uRLLC(超高可靠低时延):延迟低至 1ms,可靠性接近 100%,支持自动驾驶、远程医疗手术、工业自动化(如远程控制手术机器人);
-
mMTC(海量机器类通信):支持每平方公里 100 万个设备接入,适用于物联网(如智能城市的海量传感器、智能家电接入)。
-
-
核心优势:速率更高、延迟更低、连接数更多、能耗更低。
-
-
考纲重点:5G 的三大应用场景(eMBB/uRLLC/mMTC)及其对应应用,是填空题、选择题高频考点,需准确记忆。
- 智能终端操作系统
-
iOS:
-
开发商:苹果公司,闭源系统(代码不公开),仅用于苹果设备(iPhone、iPad、iPod);
-
特点:流畅性好、安全性高(封闭生态减少病毒)、生态系统完整(APP 质量高、适配性好)。
-
-
Android:
-
开发商:谷歌公司,开源系统(代码公开),适用于三星、华为、小米等大多数安卓手机;
-
特点:开放性高(厂商可自定义系统)、设备种类多、价格区间广、APP 资源丰富(但质量参差不齐)。
-
-
考纲考点:两大操作系统的开发商、核心特点,选择题常考 "下列属于开源移动操作系统的是"(答案:Android)。
- 基于位置的服务(LBS)
-
定义:通过移动终端的定位功能(GPS / 北斗、基站定位、WiFi 定位)获取用户的实时地理位置信息,结合地理信息系统(GIS)提供与位置相关的个性化服务。
-
核心技术:
-
定位技术:GPS / 北斗(室外定位,精度高)、基站定位(通过手机连接的基站信号强度定位,室内外均可,精度中等)、WiFi 定位(室内定位,利用周围 WiFi 信号强度定位);
-
地理信息系统(GIS):存储和管理地理数据(如地图、POI 兴趣点),支持位置查询、路径规划。
-
-
典型应用:
-
导航类:高德地图、百度地图(路径规划、实时导航);
-
生活服务类:美团外卖(查找附近商家、实时查看骑手位置)、大众点评(查找附近美食、酒店);
-
社交类:微信 "附近的人"、陌陌(基于位置的社交);
-
出行类:滴滴出行(根据用户位置匹配附近司机)。
-
-
考纲重点:LBS 的核心技术(定位技术、GIS)和典型应用,选择题常考应用场景对应。
(三)其他核心技术补充
-
移动 APP 开发技术:原生开发(针对 iOS/Android 分别开发,体验好,如微信、淘宝 APP)、混合开发(HTML5 + 原生技术,跨平台,开发效率高,如部分轻量级 APP);
-
小程序技术:无需安装,依托微信、支付宝等超级 APP 运行,如微信小程序(美团外卖小程序、核酸检测预约小程序),特点是 "即开即用、占用内存小";
-
移动支付技术:近场通信(NFC,如苹果 Pay、华为 Pay,手机贴近 POS 机支付)、二维码支付(微信支付、支付宝支付,扫码转账)、生物识别支付(指纹支付、人脸识别支付)。
四、云计算(考纲核心考点,侧重服务模式与部署模式)
(一)核心思想深度解析
-
本质:云计算的核心是 "资源集中化管理 + 按需分配 + 按量付费",将计算资源(服务器、存储、软件、网络)看作 "公共资源"(类似水电),用户无需自己购买和维护硬件,而是通过互联网向云服务商租用,按实际使用量付费,实现 "用多少付多少""无需关心底层架构"。
-
核心优势:解决传统 IT 模式的 "资源浪费""成本高""扩展性差" 问题(如企业传统模式需购买服务器,闲置时资源浪费,业务增长时服务器不够用;云计算可随时扩容或缩容)。
(二)服务模式细化(必考考点,拆解每层功能、用户、示例)
| 服务模式 | 核心定义 | 提供的资源 | 用户类型 | 典型示例 | 考纲易错点 |
|---|---|---|---|---|---|
| IaaS(基础设施即服务) | 云服务商提供底层 IT 基础设施(服务器、存储、网络、操作系统),用户自主部署中间件、应用程序 | 虚拟化服务器、存储空间、网络带宽、操作系统(如 Windows、Linux) | 企业 IT 部门、技术人员(需具备服务器管理、系统部署能力) | 亚马逊 AWS EC2、阿里云 ECS、腾讯云 CVM | 用户需自己管理操作系统和应用,云服务商仅负责硬件维护 |
| PaaS(平台即服务) | 云服务商提供开发、运行、部署应用的平台(操作系统、数据库、开发工具、中间件),用户无需关注底层基础设施,专注于应用程序开发 | 开发环境(如 Java、Python 运行环境)、数据库(如 MySQL、MongoDB)、Web 服务器、中间件(如 Tomcat) | 程序员、开发团队(专注开发,无需懂硬件和系统管理) | Google App Engine、Microsoft Azure App Service、华为云 PaaS | 平台已内置操作系统和数据库,用户无需额外部署 |
| SaaS(软件即服务) | 云服务商提供现成的软件应用,用户通过互联网(浏览器、客户端)直接使用,无需开发、安装、维护 | 完整的软件应用(如办公软件、CRM 系统、邮件系统) | 普通用户、中小企业(无需技术能力,直接使用) | Office 365、Salesforce CRM、Google Workspace(谷歌办公套件)、钉钉、企业微信 | 用户无需购买软件版权,按订阅制付费(如月度 / 年度付费) |
- 考纲重点:三大服务模式的核心区别 (提供的资源层级不同)、用户类型 、典型示例,是选择题、填空题、简答题高频考点,需通过表格对比记忆,避免混淆。
(三)部署模式细化(考纲重点)
- 公有云
-
定义:云服务商建设和运营的公共云平台,资源(服务器、存储)由多个用户共享,面向公众开放(企业、个人均可租用)。
-
特点:成本低(按使用量付费,无需自建机房)、扩展性强(随时扩容)、维护简单(云服务商负责运维);缺点:安全性相对较低(资源共享)、数据隐私可能受影响。
-
典型示例:阿里云、腾讯云、亚马逊 AWS、微软 Azure。
- 私有云
-
定义:为单一企业或组织专属建设的云平台,资源仅该组织使用,可部署在企业内部机房或由第三方服务商托管。
-
特点:安全性高(数据存储在内部,不与其他组织共享)、可控性强(企业可自定义配置和规则);缺点:成本高(需自建硬件、招聘运维人员)、扩展性受限于自身资源。
-
典型应用场景:大型企业(如银行、国企)、政府部门(存储敏感数据,如用户隐私、政务数据)。
- 混合云
-
定义:结合公有云和私有云的优势,将关键业务数据(如核心财务数据、用户隐私数据)存储在私有云(保障安全),非关键业务(如市场推广、员工办公)使用公有云(降低成本、提高扩展性),二者通过网络连接,数据可互通。
-
典型示例:某电商企业,核心交易数据存储在私有云,大促期间的流量峰值通过租用公有云服务器扩容;某医院,患者病历数据存储在私有云,在线挂号、咨询服务使用公有云。
-
考纲重点:三种部署模式的特点 和应用场景,选择题常考 "某企业需存储敏感数据,同时希望降低成本,应选择哪种部署模式"(答案:混合云)。
(四)核心技术支撑(考纲延伸考点)
-
虚拟化技术:将一台物理服务器虚拟化为多台虚拟机(VM),实现资源共享和高效利用(如一台物理服务器可同时为多个用户提供虚拟机服务);
-
分布式存储:将数据分散存储在多个服务器上,提高存储可靠性(某台服务器故障,数据不丢失)和读写速度(多台服务器同时处理读写请求),如 Hadoop HDFS、阿里云 OSS;
-
弹性计算:根据用户需求自动调整计算资源(如电商大促时自动增加服务器,大促结束后自动减少),实现 "按需扩展",避免资源浪费。
五、大数据(考纲核心考点,侧重特征、流程与技术)
(一)特征(4V)深度解析(必考考点,细化每个特征的技术挑战与应对)
- Volume(海量性)
-
定义:数据规模巨大,从传统的 GB、TB 级别跃升至 PB(1PB=1024TB)、EB(1EB=1024PB)甚至 ZB(1ZB=1024EB)级别,超出传统存储设备和软件的处理能力。
-
典型数据来源:互联网日志(如百度、淘宝的用户访问日志,每天产生 PB 级数据)、社交媒体数据(如抖音的视频、评论数据)、物联网传感器数据(如智能城市的监控、交通数据)、企业交易数据(如银行的转账记录)。
-
技术挑战:如何存储海量数据?
应对技术:分布式存储系统(如 Hadoop HDFS、云存储),将数据分散存储在成千上万台服务器上,解决单台服务器存储容量不足的问题。
- Velocity(高速性)
-
定义:数据产生和处理的速度极快,要求 "实时或近实时处理",否则数据价值会快速衰减。
-
典型场景:直播弹幕(每秒产生上万条弹幕,需实时展示)、股票交易数据(每秒产生大量交易记录,需实时分析涨跌趋势)、自动驾驶车辆的传感器数据(每秒产生 GB 级数据,需实时处理以做出决策)。
-
技术挑战:如何快速处理高速产生的数据?
应对技术:流处理框架(如 Apache Flink、Apache Storm),对连续产生的数据流进行实时处理,无需等待数据全部采集完成。
- Variety(多样性)
-
定义:数据类型不再局限于传统的结构化数据(数据库表、Excel 表格),而是包含大量半结构化数据和非结构化数据,格式复杂多样。
-
数据类型分类(考纲重点):
| 数据类型 | 定义 | 典型示例 | 存储技术 |
|---|---|---|---|
| 结构化数据 | 具有固定格式和 schema(字段定义),可直接存入数据库表 | 数据库中的用户信息表(学号、姓名、年龄)、Excel 销售报表 | 关系型数据库(MySQL、Oracle) |
| 半结构化数据 | 无固定格式,但有一定结构(如标签、键值对),无法直接存入关系型数据库 | JSON 数据({"姓名":"张三","年龄":20})、XML 数据、日志文件 | NoSQL 数据库(MongoDB)、Hadoop HDFS |
| 非结构化数据 | 无固定格式和结构,数据量大、形式多样 | 文本(新闻、论文)、图像(照片、监控视频帧)、音频(语音、音乐)、视频(电影、直播视频) | 云存储、分布式文件系统(HDFS) |
-
技术挑战:如何处理不同类型的数据?
应对技术:多源数据融合技术(如 ETL 工具,将不同类型数据转换为统一格式)、NoSQL 数据库(支持多种数据类型存储)。
- Value(价值密度低)
-
定义:海量数据中有用信息的占比极低,如同 "大海捞针",需要通过复杂的分析和挖掘才能提取出有价值的信息。
-
典型示例:一段 1 小时的监控视频,其中可能只有 10 秒包含异常行为(如盗窃、事故),其余 59 分 50 秒均为无用信息;互联网用户的浏览日志中,只有少数行为与购买决策相关。
-
技术挑战:如何从海量低价值数据中提取有用信息?
应对技术:数据挖掘算法(如关联规则挖掘、聚类分析)、机器学习模型(如分类、回归算法)、人工智能技术(如自然语言处理提取文本关键信息)。
-
考纲重点:4V 特征的定义、示例及对应的技术应对,是选择题、填空题、简答题高频考点,需逐一掌握。
(二)处理流程细化(考纲核心,拆解每个环节的技术、工具与功能)
- 数据采集
-
核心目标:从多种数据源获取原始数据,确保数据的完整性、准确性和时效性。
-
主要数据源:
-
互联网数据:网络爬虫(如 Scrapy 工具)爬取网页、社交媒体、电商平台数据;日志收集工具(Flume、Logstash)收集服务器日志、APP 用户行为日志;
-
物联网数据:传感器、RFID 标签采集的物理世界数据(如温度、位置);
-
企业内部数据:关系型数据库(MySQL)中的交易数据、ERP 系统中的管理数据;
-
其他数据:政府公开数据、第三方数据服务商提供的数据(如行业报告)。
-
-
关键工具:Flume(实时收集日志数据)、Logstash(多源数据采集与转换)、Scrapy(网络爬虫)、Kafka(数据缓冲队列,解决数据采集速度与处理速度不匹配的问题)。
- 数据存储与管理
-
核心目标:安全、高效地存储海量、多类型数据,支持快速查询和访问。
-
存储技术分类(考纲重点):
-
分布式文件系统:Hadoop HDFS(Hadoop 分布式文件系统),适用于存储海量非结构化数据和半结构化数据(如视频、日志文件),特点是高容错、高吞吐量;
-
NoSQL 数据库(非关系型数据库):
-
MongoDB:文档型数据库,适合存储 JSON、XML 等半结构化数据(如用户画像数据);
-
Cassandra:列族数据库,适合高并发、海量数据读写(如电商交易数据);
-
Redis:内存数据库,读写速度极快,适合存储热点数据(如电商商品详情、缓存数据);
-
-
关系型数据库(MySQL、Oracle):适合存储结构化数据(如用户基本信息、订单数据),支持复杂的 SQL 查询和事务处理;
-
数据仓库(如 Hive、Greenplum):用于存储经过清洗、整合的结构化数据,支持离线分析和报表生成(如企业年度销售分析)。
-
-
考纲易错点:区分 NoSQL 数据库与关系型数据库的适用场景,选择题常考 "存储用户行为日志(半结构化数据)应选择哪种数据库"(答案:MongoDB)。
- 数据处理与分析
-
核心目标:将原始数据转化为有价值的信息,包括数据清洗、转换、计算、挖掘等操作。
-
关键环节与技术:
-
数据预处理:数据清洗(去除重复数据、缺失值填充、异常值剔除,如用 Python 的 Pandas 库)、数据转换(将非结构化数据转为结构化数据,如文本分词、图像特征提取)、数据集成(合并多个数据源的数据);
-
数据计算:
-
批处理:对静态的海量数据集进行离线处理,适合处理历史数据(如分析过去一年的销售数据),工具:Hadoop MapReduce、Spark Core;
-
流处理:对连续的数据流进行实时处理,适合处理实时数据(如直播弹幕分析),工具:Apache Flink、Apache Storm;
-
-
数据挖掘:从数据中发现隐藏的模式、关联、趋势,核心算法:
-
关联规则挖掘:如 "购买面包的用户同时购买牛奶"(电商推荐系统的核心);
-
聚类分析:将相似数据分组(如用户分群,将消费习惯相似的用户归为一类);
-
分类分析:预测数据类别(如垃圾邮件分类、信用风险评估);
-
-
机器学习:构建模型让计算机自主学习数据规律,如线性回归(预测房价)、决策树(分类)、深度学习(处理图像、语音数据)。
-
-
考纲重点:批处理与流处理的区别、核心工具(MapReduce、Flink)、数据挖掘算法的应用场景,选择题常考。
- 数据可视化
-
核心目标:将分析结果以直观、易懂的图表形式展示,帮助用户快速理解数据价值("一图胜千言")。
-
常用工具与图表类型:
-
工具:Tableau(专业可视化工具,拖拽式操作)、ECharts(开源 JavaScript 可视化库,用于网页图表)、Python 的 Matplotlib/Seaborn 库(编程生成图表);
-
图表类型:折线图(展示趋势,如月度销售额变化)、柱状图(对比数据,如各产品销量对比)、饼图(展示占比,如各地区销售占比)、热力图(展示密度,如用户访问热度分布)、仪表盘(展示关键指标,如企业营收达成率)。
-
-
典型应用:企业的数据分析仪表盘(实时展示营收、销量、用户增长等关键指标)、政务大数据平台(展示城市交通流量、空气质量等数据)。
(三)应用深度解析(考纲重点,结合专转本备考与生活场景)
-
用户画像:通过分析用户的行为数据(浏览记录、购买记录、社交行为),构建用户的详细特征模型(如年龄、性别、消费能力、兴趣爱好),应用:电商精准营销(淘宝推荐你感兴趣的商品)、短视频推荐(抖音推荐你喜欢的视频);
-
精准营销:基于用户画像和数据挖掘,向目标用户推送个性化的广告或服务,如教育培训机构根据考生的备考数据推送针对性的考点课程;
-
风险预测:金融领域通过分析用户的信用数据、交易数据,预测信用风险(如银行贷款审批)、欺诈行为(如信用卡盗刷检测);
-
智慧城市:分析城市数据优化资源配置,如交通流量预测(调整红绿灯时长)、公共安全监控(识别异常行为)、水资源调度(根据降雨量和用水量调整供水);
-
医疗健康:分析患者的病历数据、基因数据,预测疾病风险(如癌症早期筛查)、制定个性化治疗方案(如根据患者体质调整用药)、优化医疗资源(如预测医院就诊高峰,合理安排医护人员)。
六、人工智能(AI)(考纲高频考点,侧重技术与应用)
(一)定义深度解析
-
本质:人工智能是研究如何让计算机模拟人类的智能行为(如感知、思考、学习、决策)的科学与技术,核心目标是 "让机器像人一样解决问题",但不等同于 "机器拥有人类的意识"。
-
关键区别:人工智能是 "模拟智能",而非 "复制意识",当前所有 AI 应用(如语音助手、人脸识别)均未具备人类的情感、自我认知等意识层面的能力。
(二)发展阶段细化(考纲考点)
| 发展阶段 | 核心特征 | 技术水平 | 典型示例 | 考纲易错点 |
|---|---|---|---|---|
| 弱人工智能(当前阶段) | 专注于特定领域的智能应用,只能解决某一类问题,无通用智能 | 窄域智能,无法跨领域解决问题 | 语音助手(Siri、小爱同学)、人脸识别、AlphaGo(围棋)、电商推荐系统 | 弱人工智能≠人类智能,仅能完成特定任务 |
| 强人工智能(未来目标) | 具备与人类相当的通用智能,能自主学习、跨领域解决问题、理解情感、拥有自我认知 | 通用智能,接近人类智能水平 | 科幻电影中的机器人(如《钢铁侠》的贾维斯) | 目前尚未实现,仅存在于理论和科幻作品中 |
| 超人工智能(理论阶段) | 智能水平远超人类,能自主进化,解决人类无法解决的复杂问题 | 智能水平超越人类 | 无实际示例,仅为理论预测 | 考纲不要求深入掌握,了解即可 |
(三)核心技术分支深度解析(必考考点)
- 机器学习(ML)
-
定义:机器学习是人工智能的核心技术,让计算机通过学习数据中的规律,无需显式编程就能完成特定任务("数据驱动" 而非 "指令驱动")。
-
核心思想:"从经验中学习",计算机通过大量数据训练,自动调整模型参数,提高任务完成的准确性。
-
主要类型(考纲重点):
-
监督学习:
-
定义:训练数据包含 "输入数据" 和 "标签(正确答案)",计算机通过学习输入与标签的对应关系,预测新数据的标签。
-
典型任务:分类(预测类别,如垃圾邮件分类、疾病诊断)、回归(预测连续值,如房价预测、销售额预测);
-
示例:用 "历史房价数据(输入:面积、地段)+ 实际房价(标签)" 训练模型,预测新房屋的房价;
-
-
无监督学习:
-
定义:训练数据只有 "输入数据",无标签,计算机自主发现数据中的隐藏结构(如聚类、关联)。
-
典型任务:聚类分析(如用户分群)、关联规则挖掘(如购物篮分析);
-
示例:用 "用户购买记录" 训练模型,发现 "购买 A 商品的用户常购买 B 商品" 的关联规则;
-
-
强化学习:
-
定义:智能体(如机器人、游戏角色)通过与环境交互,根据 "奖励" 或 "惩罚" 信号调整行为策略,逐步学习最优行为。
-
典型示例:AlphaGo(通过与自己对弈获得奖励信号,学习围棋策略)、自动驾驶车辆(通过行驶过程中的安全信号调整驾驶行为)。
-
-
-
考纲重点:监督学习与无监督学习的区别、典型任务,选择题常考。
- 深度学习(DL)
-
定义:深度学习是机器学习的子集,基于 "深度神经网络"(多层神经网络,通常≥3 层),擅长处理复杂的非结构化数据(图像、语音、文本),是当前 AI 技术爆发的核心驱动力。
-
核心优势:无需人工提取特征,能自动从数据中学习深层特征(如图像的边缘、纹理、物体形状)。
-
关键网络结构与应用(考纲重点):
-
CNN(卷积神经网络):擅长处理图像数据,核心是 "卷积操作"(提取图像局部特征),应用:人脸识别、图像分类(如识别猫 / 狗)、医疗影像诊断(如 CT 图像肿瘤检测)、自动驾驶图像识别(识别行人、车辆、交通灯);
-
RNN(循环神经网络):擅长处理序列数据(如文本、语音),核心是 "记忆单元"(保留历史数据的影响),应用:语音转文字、机器翻译、文本生成(如写作文、写诗);
-
Transformer(Transformer 模型):基于 "注意力机制",处理序列数据的效率和效果远超 RNN,是当前自然语言处理的主流模型(如 ChatGPT、百度文心一言的核心),应用:智能对话、机器翻译、文本摘要。
-
-
考纲易错点:深度学习是机器学习的 "子集",而非独立于机器学习的技术,选择题常考二者关系。
- 自然语言处理(NLP)
-
定义:让计算机理解、解释、生成人类语言(自然语言,如中文、英文)的技术,是 AI 与人类沟通的桥梁。
-
核心技术流程(考纲重点):
-
文本预处理:分词(将句子拆分为词语,如 "我喜欢人工智能"→"我 / 喜欢 / 人工智能")、词性标注(标注词语的词性,如名词、动词)、停用词去除(删除无意义的词,如 "的、地、得");
-
语义理解:分析文本的含义,如句法分析(分析句子结构,如主语、谓语、宾语)、语义角色标注(识别句子中的施事、受事,如 "小明吃苹果"→施事 "小明",受事 "苹果");
-
核心任务与应用:
-
机器翻译:如百度翻译、谷歌翻译(将中文译为英文,反之亦然);
-
情感分析:分析文本的情感倾向(正面 / 负面 / 中性,如分析用户对产品的评价是好评还是差评);
-
智能问答:如 Siri、小爱同学(回答用户的问题,如 "今天天气怎么样""专转本考哪些科目");
-
文本生成:如 ChatGPT 生成作文、报告,AI 写诗、写代码。
-
-
-
考纲重点:NLP 的核心任务(分词、机器翻译、情感分析)和应用,选择题常考。
- 计算机视觉(CV)
-
定义:让计算机 "看懂" 图像和视频的技术,模拟人类的视觉系统,从图像 / 视频中提取、分析、理解信息。
-
核心任务与应用(考纲重点):
-
图像分类:判断图像中的物体类别(如识别图片是猫、狗还是汽车),应用:照片分类、垃圾分拣机器人;
-
目标检测:定位图像中物体的位置并识别类别(如 "这张图片中有 2 个人、1 辆汽车,分别在什么位置"),应用:监控安防(识别异常人员)、自动驾驶(识别行人、车辆、交通标志);
-
人脸识别:识别图像中的人脸身份(如 "这个人是张三还是李四"),应用:门禁系统、手机解锁、支付认证;
-
图像分割:将图像按语义分割为不同区域(如将一张城市地图分割为道路、建筑、绿地),应用:自动驾驶(识别道路边界)、医疗影像分析(分割肿瘤区域);
-
视频分析:处理视频数据,如行为识别(识别监控中的异常行为,如打架、盗窃)、动作捕捉(如游戏中的动作模拟)。
-
-
考纲重点:计算机视觉的核心任务(目标检测、人脸识别)和应用场景,选择题常考。
- 知识图谱
-
定义:以 "图结构"(节点 + 边)的形式表示知识,其中 "节点" 代表实体(如人、物、概念),"边" 代表实体之间的关系(如 "张三"→"是"→"学生","苹果"→"属于"→"水果")。
-
核心作用:让计算机具备 "知识推理" 能力,理解实体之间的关联。
-
典型应用:
-
语义搜索:如百度搜索 "李白的出生地",知识图谱可直接返回 "绵阳"(无需用户点击网页查找);
-
智能问答:如 "孙悟空的师傅是谁",知识图谱可通过关系推理得出 "唐僧";
-
推荐系统:如 "喜欢《西游记》的用户还喜欢《三国演义》"(基于书籍之间的关联关系)。
-
(四)典型应用场景细化(考纲重点)
-
智能语音助手:Siri(苹果)、小爱同学(小米)、小度(百度),通过语音交互提供服务(如查询天气、设置闹钟、答疑解惑);
-
自动驾驶:特斯拉、华为自动驾驶车辆,通过传感器(摄像头、雷达)采集路况数据,计算机视觉识别道路、车辆、行人,机器学习模型做出驾驶决策(加速、刹车、转弯);
-
智能推荐系统:淘宝、京东的商品推荐,抖音、快手的视频推荐,基于用户行为数据和关联规则挖掘,推送用户感兴趣的内容;
-
医疗 AI:医疗影像诊断系统(如 CT 图像肿瘤检测)、智能问诊系统(输入症状推荐可能的疾病)、药物研发(通过 AI 模拟药物分子与靶点的结合,加速研发进程);
-
智能机器人:工业机器人(如富士康的焊接机器人、装配机器人)、服务机器人(如餐厅服务员机器人、酒店前台机器人)、医疗机器人(如手术机器人、康复机器人);
-
教育 AI:专转本智能备考 APP(根据考生错题数据推荐针对性考点)、AI 作文批改(自动批改作文并给出修改建议)、智能答疑系统(解答考生的考点疑问)。
"区块头" 和 "区块体",区块头存储前一个区块的哈希值、时间戳等信息,区块体存储具体的交易或
专转本计算机区块链技术
一、区块链核心概念(考纲基础考点)
(一)本质与核心目标
-
定义细化 :区块链是一种去中心化、分布式账本数据库,通过密码学技术将数据按时间顺序打包成连续的 "区块",并以链式结构串联存储,实现数据的 "不可篡改、全程留痕、可追溯、公开透明"。
-
核心逻辑:用技术手段替代传统 "中心机构" 的信任背书(如银行、政府),让参与网络的多个节点共同验证和记录数据,确保数据在无中心控制时依然真实可信。
-
通俗类比:相当于一个 "公开的共享账本",所有人都能查看账本内容,任何人都无法单独修改账本记录,修改需获得网络中多数节点的同意。
-
考纲易错点:区块链的核心是 "技术实现信任",而非 "加密货币"(加密货币是区块链的应用之一),选择题常考二者关系辨析。
(二)关键术语拆解
- 区块:账本的基本数据单元,每个区块包含两部分:
-
区块头:存储关键元数据,包括前一个区块的哈希值(形成链式结构的核心)、时间戳(数据记录时间)、 Merkle 根(区块体数据的哈希摘要)、共识机制相关信息(如挖矿难度)。
-
区块体:存储实际数据(如比特币的交易记录、供应链的商品流转信息),数据以交易列表或键值对形式存储。
- 哈希值:
-
定义:通过哈希函数(如 SHA - 256)将任意长度的输入数据转换为固定长度(如 256 位)的字符串,具有三大特性:
-
单向性:无法通过哈希值反推原始数据;
-
抗碰撞性:不同原始数据几乎不可能产生相同哈希值;
-
确定性:同一原始数据每次计算都得到相同哈希值。
-
-
核心作用:串联区块(每个区块包含前一区块哈希值,修改任一区块会导致后续所有区块哈希值失效)、验证数据完整性(对比哈希值判断数据是否被篡改)。
- 分布式账本:数据并非存储在单一中心服务器,而是同步存储在网络中的多个节点(如计算机、服务器)上,每个节点都拥有完整的账本副本。
-
优势:单个节点故障或被攻击不会影响整个系统,数据安全性更高;
-
考纲考点:分布式存储是区块链 "去中心化" 的基础,填空题常考。
二、区块链核心特征(考纲高频考点)
(一)六大核心特征(结合实例 + 考纲解读)
- 去中心化:
-
定义:无中心机构或第三方中介控制,网络中所有节点地位平等,共同参与数据验证和记录。
-
示例:比特币交易无需银行中转,交易双方直接通过区块链网络完成转账,交易记录由全网节点共同验证。
-
考纲重点:区分 "去中心化" 与 "分布式"(分布式是技术实现,去中心化是架构特征),选择题常考二者定义辨析。
- 不可篡改:
-
定义:数据一旦被记录到区块链,几乎无法被修改或删除。
-
技术原理:修改某一区块的数据会导致该区块的哈希值改变,而后续所有区块都包含前一区块的哈希值,需同时修改所有后续区块及全网多数节点的账本副本,难度极大(几乎不可能)。
-
示例:供应链中,商品的生产、运输、销售记录上链后,无法被篡改,确保商品溯源的真实性。
- 全程留痕与可追溯:
-
定义:所有数据按时间顺序记录,每个交易或操作都有明确的时间戳和区块位置,可逆向追溯至数据源头。
-
示例:食品溯源区块链中,消费者扫描商品二维码,可查看食品从种植、加工、物流到销售的全流程记录,确保食品安全。
-
考纲考点:"可追溯" 是区块链在供应链、金融等领域的核心优势,简答题常考应用场景。
- 公开透明:
-
定义:区块链网络的账本数据对所有参与节点公开(部分私有链可限制访问),任何人都可查看数据记录,确保数据无暗箱操作。
-
例外:数据公开但交易双方身份可匿名(如比特币用地址替代真实姓名),实现 "匿名公开"。
- 自治性:
-
定义:基于预设的规则(如共识机制、智能合约),区块链网络可自动运行,无需人工干预。
-
示例:智能合约中,当预设条件(如约定时间到期、付款完成)满足时,合约自动执行转账、履约等操作。
- 高安全性:
-
技术支撑:加密算法(哈希函数、非对称加密)、分布式存储(无单点故障)、共识机制(防止恶意节点攻击)。
-
对比传统系统:传统中心系统一旦中心服务器被攻击,数据易泄露或篡改;区块链需攻击多数节点才能破坏系统,安全性更高。
七、区块链关键技术(考纲核心考点)
(一)分布式存储技术
-
定义:将账本数据同步存储在网络中的多个节点(全节点),每个节点保存完整账本副本,部分节点(轻节点)仅保存关键索引数据。
-
核心优势:
-
容错性:单个或少数节点故障,其他节点仍能正常提供服务;
-
抗攻击性:无中心节点可被攻击,黑客需控制全网 51% 以上节点才能篡改数据(即 "51% 攻击",难度极高);
-
-
考纲易错点:分布式存储≠去中心化(私有链是分布式存储但可能是中心化管理),选择题常考二者关系。
(二)共识机制(必考考点)
-
定义:区块链网络中,多个节点为达成数据一致性而遵循的算法规则,核心是 "解决分布式系统中的信任问题",确保只有合法数据能被记录到账本。
-
三大主流共识机制(对比记忆):
| 共识机制 | 核心原理 | 优点 | 缺点 | 典型应用 | 考纲重点 |
|----------|----------|------|------|----------|----------|
| 工作量证明(PoW) | 节点通过解决复杂数学问题(如哈希碰撞)获得记账权,解题成功的节点生成新区块并获得奖励 | 安全性高、去中心化程度高 | 能耗极高、处理速度慢(比特币每秒仅 7 笔交易) | 比特币、以太坊(早期) | 核心是 "算力竞争",选择题常考能耗问题 |
| 权益证明(PoS) | 根据节点持有的代币数量和持有时间("币龄")分配记账权,持币越多、时间越长,记账概率越高 | 能耗低、处理速度较快 | 去中心化程度较低(持币多的节点话语权大) | 以太坊(升级后)、Cardano | 核心是 "权益占比",区别于 PoW 的 "算力占比" |
| 委托权益证明(DPoS) | 持币者投票选出一定数量的 "代表节点"(如 21 个、101 个),由代表节点轮流记账 | 能耗极低、处理速度快(每秒可达千笔以上) | 去中心化程度最低(代表节点集中) | EOS、TRON | 核心是 "投票委托",适用于高并发场景 |
-
考纲考点:三大共识机制的核心区别、优缺点、典型应用,选择题、填空题高频考查,需通过表格对比记忆。
(三)加密算法(考纲重点技术)
- 哈希函数:
-
常用算法:SHA - 256(比特币使用)、SHA - 384,核心作用如前所述(串联区块、验证数据完整性)。
-
考纲示例题:"区块链中用于验证数据未被篡改的技术是( )",答案:哈希函数。
- 非对称加密(公钥密码体制):
-
核心原理:使用一对密钥(公钥 + 私钥),公钥公开(可分享给他人),私钥保密(仅本人持有);公钥加密的数据只能用对应私钥解密,私钥签名的数据只能用对应公钥验证。
-
两大应用:
-
身份认证:用户用私钥对交易数据签名,其他人用公钥验证签名,确认交易是用户本人发起;
-
加密传输:发送方用接收方的公钥加密数据,接收方用自己的私钥解密,确保数据传输安全。
-
- 数字签名:
-
定义:用户用私钥对数据(如交易信息)进行加密处理,生成的字符串即为数字签名,是身份认证和数据完整性的核心保障。
-
验证流程:接收方获取数据、数字签名和发送方公钥,用公钥解密数字签名,对比解密结果与原始数据的哈希值,一致则说明数据未被篡改且发送方身份合法。
(四)智能合约(考纲新增考点)
-
定义:存储在区块链上的、可自动执行的计算机程序代码,当预设条件满足时,合约会自动执行相应条款,无需人工干预。
-
核心特点:
-
不可篡改:合约代码一旦部署到区块链,无法修改;
-
自动执行:条件触发后自动执行,无延迟、无人工干预;
-
透明公开:合约代码和执行结果对全网可见。
- 工作流程:
-
部署:开发者编写合约代码(如 Solidity 语言),部署到区块链网络,获得唯一合约地址;
-
触发:用户通过交易或事件触发合约(如转账达到约定金额、时间到期);
-
执行:区块链节点验证条件是否满足,满足则自动执行合约条款(如转账、记录数据)。
- 典型示例:
-
自动转账合约:约定 "2024 年 6 月 1 日,向 A 账户转账 1000 元",到约定时间后,合约自动执行转账;
-
供应链合约:约定 "供应商发货后,自动向其支付 50% 货款;买家确认收货后,支付剩余 50%",触发条件满足后自动履约。
- 考纲考点:智能合约的定义、核心特点、工作流程,选择题、简答题常考,需结合示例理解。
四、区块链分类(考纲重点)
(一)按部署模式分类(对比记忆)
| 分类 | 核心定义 | 参与权限 | 核心特点 | 典型应用场景 | 考纲易错点 |
|---|---|---|---|---|---|
| 公有云(公有链) | 面向公众开放的区块链网络,任何人都可参与节点运行、数据查看和交易 | 无权限限制,公开参与 | 去中心化程度高、安全性高、公开透明;处理速度慢、能耗高 | 加密货币(比特币、以太坊)、公开溯源(公益捐款溯源) | 公有链≠公有云,二者无关联,选择题常考混淆选项 |
| 私有链 | 为单一组织或机构专属构建的区块链,仅授权用户可参与,数据仅对内部开放 | 权限严格控制,仅限内部参与 | 安全性极高、处理速度快、可控性强;去中心化程度低(多为联盟管理) | 企业内部数据管理(如财务数据、员工档案)、政府政务数据存储 | 私有链的 "私有" 指参与权限,而非数据存储(仍为分布式存储) |
| 联盟链 | 由多个组织或机构共同组建的区块链,参与节点需获得联盟授权 | 半公开,授权参与 | 兼顾安全性和效率、去中心化程度中等;适合多机构协作 | 供应链金融(银行、企业、物流商协作)、跨境支付(多家银行联盟) | 联盟链是 "多中心",区别于公有链的 "无中心" 和私有链的 "单中心" |
(二)考纲题型应对
-
选择题常考:"某银行联盟构建的区块链网络,仅联盟内银行可参与,属于( )",答案:联盟链;
-
简答题常考:"简述公有链、私有链、联盟链的区别及适用场景",需从参与权限、特点、应用三方面对比。
五、典型应用场景(考纲重点,结合备考与实际)
(一)加密货币(最成熟应用)
-
定义:基于区块链技术发行的去中心化数字货币,无需央行发行和监管,交易记录公开透明、不可篡改。
-
典型示例:比特币(首个区块链应用)、以太坊(支持智能合约的加密货币)。
-
考纲注意:考纲仅要求掌握 "加密货币是区块链的应用",不涉及交易、投资相关内容,避免超纲。
(二)供应链溯源
-
核心逻辑:将商品从生产、加工、物流、销售到消费的全流程信息(如原材料产地、生产批次、物流轨迹)记录上链,实现 "来源可查、去向可追、责任可究"。
-
应用价值:解决商品造假、以次充好问题(如奢侈品防伪、农产品溯源)。
-
考纲示例题:"区块链在供应链中最核心的应用是( )",答案:溯源。
(三)金融领域应用
- 跨境支付:
-
优势:无需银行中转,交易速度快(传统跨境支付需 1 - 3 天,区块链仅需数分钟)、手续费低(传统手续费 1% - 3%,区块链仅 0.1% 左右)、公开透明。
-
典型案例:蚂蚁金服的跨境支付区块链、央行数字货币(CBDC)的跨境结算。
- 证券交易:
- 优势:自动清算交割(智能合约触发)、减少中间环节、降低交易风险。
- 保险理赔:
- 优势:理赔数据上链,自动验证理赔条件(如航班延误险,自动获取航班延误数据并赔付),减少欺诈、提高效率。
(四)数字版权保护
-
核心逻辑:创作者将作品(文字、图片、视频、音乐)的版权信息(作者、创作时间、作品内容)记录上链,生成唯一版权凭证,实现 "确权、维权、交易" 一体化。
-
应用价值:解决版权侵权、盗版问题,确保创作者权益(如自媒体文章版权、音乐版权)。
(五)身份认证
-
核心逻辑:用户将身份信息(身份证、学历、资质证书)上链,生成去中心化的身份凭证,无需第三方机构验证,保护个人隐私。
-
应用场景:政务办理(如社保查询、公积金提取)、在线教育(学历认证)、求职招聘(资质验证)。
六、考纲易错点与高频题型总结
(一)易错点辨析
-
区块链≠加密货币(加密货币是应用,区块链是技术);
-
去中心化≠无中心管理(联盟链、私有链仍有管理规则,只是无单一中心机构);
-
不可篡改≠绝对不能篡改(理论上控制 51% 以上节点可篡改,但实际难度极大);
-
智能合约≠法律合约(智能合约是代码执行,法律合约是法律约束,二者可结合)。