每天一个数据分析题(一百五十五)

关于高维数据在模型建立中的处理,以下描述正确的是:

A. 在分类模型中通常不需要进行变量选择和降维,因为算法可以处理成千上万个变量。

B. 聚类模型中剔除不相关变量主要依赖于算法而不是分析师的经验和维度分析。

C. 特征选择指的是从相关性较强的变量中提取代表性的变量,还可以做多项式旋转会增加变量。

D. 在数据挖掘的实践中,最佳实践是建立一个包含所有变量的大模型来处理不同情况。

题目来源于CDA模拟题库

点击此处获取答案

相关推荐
菜鸟的人工智能之路29 分钟前
桑基图在医学数据分析中的更复杂应用示例
python·数据分析·健康医疗
阡之尘埃7 小时前
Python数据分析案例61——信贷风控评分卡模型(A卡)(scorecardpy 全面解析)
人工智能·python·机器学习·数据分析·智能风控·信贷风控
布说在见9 小时前
层次与网络的视觉对话:树图与力引导布局的双剑合璧
信息可视化·数据挖掘·数据分析
全栈开发圈16 小时前
新书速览|Spark SQL大数据分析快速上手
sql·数据分析·spark
spssau16 小时前
多分类logistic回归分析案例教程
分类·数据挖掘·数据分析·回归·回归分析·logistic回归·spssau
我就说好玩18 小时前
2020年美国总统大选数据分析与模型预测
大数据·python·数据挖掘·数据分析·pandas·sklearn
Aloudata19 小时前
在全域数据整合过程中,如何确保数据的一致性和准确性
大数据·数据库·人工智能·数据挖掘·数据分析
安静的_显眼包O_o19 小时前
【机器学习】连续属性离散化与sklearn.preprocessing.KBinsDiscretizer
数据挖掘·数据分析
叫我:松哥20 小时前
基于python多准则决策分析的汽车推荐算法设计与实现
python·算法·数据挖掘·数据分析·汽车·推荐算法
出发行进20 小时前
PySpark本地开发环境搭建
大数据·python·数据分析·spark·anaconda