人工智能与机器学习单选题(50道)
1. 机器学习的核心目标是:
A. 通过硬编码规则解决问题
B. 从数据中自动学习模式
C. 提高计算机硬件性能
D. 优化数据库查询速度
2. 以下属于监督学习任务的是:
A. 聚类分析
B. 图像分类
C. 异常检测
D. 关联规则挖掘
3. 过拟合的典型表现是:
A. 训练误差和测试误差均高
B. 训练误差低,测试误差高
C. 训练误差高,测试误差低
D. 模型无法收敛
4. 以下哪种算法属于无监督学习?
A. 逻辑回归
B. K-Means聚类
C. 支持向量机(SVM)
D. 随机森林
5. 交叉验证的主要作用是:
A. 减少数据维度
B. 评估模型泛化能力
C. 加速训练过程
D. 生成合成数据
6. 随机森林的基分类器是:
A. 线性回归模型
B. 决策树
C. 神经网络
D. 贝叶斯网络
7. 深度学习中的"Dropout"技术用于:
A. 数据增强
B. 防止过拟合
C. 加速收敛
D. 特征提取
8. 分类问题中不常用的评价指标是:
A. 准确率
B. 均方误差(MSE)
C. F1分数
D. ROC-AUC
9. PCA(主成分分析)的核心目标是:
A. 分类数据
B. 降低数据维度
C. 生成新数据
D. 优化计算速度
10. 梯度下降算法用于:
A. 计算数据统计量
B. 优化模型参数
C. 可视化数据分布
D. 清洗噪声数据
11. 神经网络中反向传播的作用是:
A. 调整权重参数
B. 初始化网络结构
C. 标准化输入数据
D. 生成对抗样本
12. SVM(支持向量机)的核心是:
A. 最大化分类间隔
B. 最小化数据维度
C. 拟合多项式函数
D. 随机划分边界
13. 以下属于集成学习算法的是:
A. K近邻(KNN)
B. XGBoost
C. 单一决策树
D. 线性回归
14. 逻辑回归的输出范围是:
A. (-∞, +∞)
B. [0, 1]
C. 任意实数
D. 离散类别
15. 卷积神经网络(CNN)擅长的任务是:
A. 时间序列预测
B. 图像识别
C. 文本分类
D. 结构化数据回归
16. 以下哪个是回归问题的评价指标?
A. 精确率
B. 均方根误差(RMSE)
C. 召回率
D. 混淆矩阵
17. 决策树的划分标准不包括:
A. 信息增益
B. 欧氏距离
C. 基尼系数
D. 增益率
18. 朴素贝叶斯分类器的"朴素"是指:
A. 假设特征之间独立
B. 模型结构简单
C. 仅适用于二分类
D. 无需训练数据
19. 以下方法不能缓解过拟合的是:
A. 增加训练数据
B. 添加L1正则化
C. 减少模型层数
D. 使用更多特征
20. LSTM网络主要用于处理:
A. 图像数据
B. 序列数据(如文本、时间序列)
C. 表格数据
D. 高维稀疏数据
21. 强化学习的核心机制是:
A. 监督信号
B. 奖励与惩罚
C. 数据聚类
D. 特征降维
22. 生成对抗网络(GAN)包含的组件是:
A. 生成器与判别器
B. 编码器与解码器
C. 输入层与输出层
D. 支持向量与核函数
23. 以下不属于特征工程的是:
A. 数据标准化
B. 特征选择
C. 模型训练
D. 独热编码
24. K近邻(KNN)算法的分类依据是:
A. 数据分布的均值
B. 邻近样本的多数投票
C. 决策边界
D. 概率密度函数
25. 批量归一化(BatchNorm)的作用是:
A. 加速模型收敛
B. 增加数据量
C. 减少参数数量
D. 生成对抗样本
26. 关于损失函数的说法,错误的是:
A. 交叉熵常用于分类问题
B. 均方误差常用于回归问题
C. 损失函数值越小模型越好
D. 损失函数与模型性能无关
27. 模型泛化能力是指:
A. 在训练集上的表现
B. 在未见数据上的表现
C. 计算速度
D. 参数数量
28. 以下不属于深度学习模型的是:
A. 随机森林
B. 卷积神经网络(CNN)
C. Transformer
D. 循环神经网络(RNN)
29. 数据增强(Data Augmentation)的目的是:
A. 减少数据量
B. 提升模型鲁棒性
C. 降低计算成本
D. 删除噪声数据
30. 机器学习的"偏差-方差权衡"涉及:
A. 模型复杂度与泛化能力
B. 数据量与计算资源
C. 特征数量与存储空间
D. 学习率与迭代次数
31. 以下关于神经网络的描述,错误的是:
A. 深度网络可以自动提取特征
B. 参数量越多模型一定越好
C. 激活函数引入非线性
D. 需要大量数据训练
32. 目标检测任务常用的算法是:
A. YOLO
B. K-Means
C. PCA
D. 线性回归
33. 以下关于TensorFlow的描述,正确的是:
A. 仅支持Python语言
B. 由Facebook开发
C. 是一个开源深度学习框架
D. 不支持GPU加速
34. 混淆矩阵用于评估:
A. 回归模型
B. 分类模型
C. 聚类模型
D. 降维模型
35. 以下算法对缺失值敏感的是:
A. 决策树
B. 随机森林
C. K近邻(KNN)
D. 支持向量机(SVM)
36. 关于集成学习,说法正确的是:
A. 基模型之间必须高度相关
B. Bagging可以降低方差
C. Boosting会降低模型复杂度
D. 单一模型优于集成模型
37. 词嵌入(Word Embedding)用于:
A. 图像特征提取
B. 文本向量化表示
C. 数据降维
D. 模型压缩
38. 以下关于正则化的说法,错误的是:
A. L1正则化会产生稀疏解
B. L2正则化又称权重衰减
C. 正则化会增加模型偏差
D. 正则化旨在减少方差
39. 强化学习中的"探索-利用权衡"是指:
A. 尝试新动作与利用已知最优动作的平衡
B. 增加数据量与减少计算资源的平衡
C. 特征选择与模型训练的平衡
D. 监督与无监督学习的平衡
40. 关于PyTorch和TensorFlow,错误的是:
A. 两者均支持动态计算图
B. PyTorch更常用于研究
C. TensorFlow仅由Google维护
D. 均支持GPU加速
41. 以下任务适合用循环神经网络(RNN)的是:
A. 图像分类
B. 机器翻译
C. 聚类分析
D. 数据降维
42. 模型部署时,以下哪种方法可以减小模型体积?
A. 知识蒸馏
B. 增加网络层数
C. 使用更高精度浮点数
D. 禁用GPU加速
43. 关于迁移学习,错误的是:
A. 可以复用预训练模型
B. 仅适用于图像数据
C. 减少对小数据集的依赖
D. 微调(Fine-tuning)是常用方法
44. 以下关于注意力机制(Attention)的说法,正确的是:
A. 仅用于计算机视觉
B. 可以捕捉长距离依赖关系
C. 会增加模型训练时间但无法提升效果
D. 与Transformer无关
45. 以下场景不适合用机器学习的是:
A. 天气预报
B. 信用卡欺诈检测
C. 编写操作系统内核
D. 推荐系统
46. 关于模型解释性,说法正确的是:
A. 深度学习模型通常比决策树更易解释
B. SHAP是一种特征重要性分析方法
C. 模型复杂度与解释性正相关
D. 线性回归无法提供解释性
47. 以下关于大数据与机器学习的关系,错误的是:
A. 数据量越大模型性能一定越好
B. 数据质量影响模型效果
C. 特征工程在大数据中仍然重要
D. 分布式计算框架(如Spark)可用于训练
48. 关于AutoML,正确的是:
A. 仅用于自动化调参
B. 可以完全替代人工建模
C. 包括自动化特征工程和模型选择
D. 不适用于深度学习
49. 以下技术不属于深度学习优化方法的是:
A. 随机梯度下降(SGD)
B. 批量归一化(BatchNorm)
C. 主成分分析(PCA)
D. Adam优化器
50. 机器学习项目中最耗时的步骤通常是:
A. 模型训练
B. 数据清洗与特征工程
C. 模型部署
D. 编写算法代码
