技术栈

数据清理

悟乙己
21 天前
数据挖掘·数据分析·pyspark·eda·数据清理
PySpark EDA 完整案例介绍,附代码(三)本篇文章Why Most Data Scientists Are Wrong About PySpark EDA — And How to Do It Right适合希望高效处理大数据的从业者。文章的亮点在于强调了使用PySpark进行探索性数据分析(EDA)的重要性,避免了将Spark数据框转换为Pandas的低效做法。几点建议:
临床数据科学和人工智能兴趣组
1 年前
信息可视化·数据挖掘·数据分析·r语言·r·数据清理
用R语言运用 Shiny 包打造基于鸢尾花数据集的交互式数据可视化应用在数据科学中,数据的探索和可视化是分析的重要组成部分。R 语言提供了强大的工具来进行数据分析和可视化,其中 Shiny 包允许我们构建交互式的 Web 应用,使用户可以动态地探索数据。本文将详细介绍如何使用 Shiny 构建一个交互式的散点图应用,该应用允许用户选择鸢尾花数据集的不同变量进行可视化,并通过多种选项自定义图形。
我是有底线的