对数据分析行业的疑问

我之前是做大数据的开发的,当然也做业务比如Java、springcloud的后端开发、也做了ai的。

但是我一直没怎么做数据分析,当我加入了新公司后发现,现在做大数据的大部分都是数据分析,用python和sql。

我今天一看他们的统计,明知道客户的字段是错的,按照这个字段跑起来后,居然就直接把这个字段删了,也不去探究原因,查看为什么跑不起来。现在做分析都是只管速度,不管错误了吗?

那你提供的数据是错误的,最终合成的,以及基于你的数据分析的,也全是错误,包括以后的宽表之类的。做数据我一直的态度就是,即使慢,不能错,有问题就探究原因。

相关推荐
Apache Flink38 分钟前
京东物流基于Flink & StarRocks的湖仓建设实践
java·大数据·flink
董可伦40 分钟前
Flink 源码编译
大数据·flink·源码
努力犯错1 小时前
昆仑万维开源SkyReels-V2,解锁无限时长电影级创作,总分83.9%登顶V-Bench榜单
大数据·人工智能·语言模型·开源
Miu(数分版)2 小时前
PowerBi中REMOVEFILTERS怎么使用?
数据分析·产品运营·powerbi
lilye662 小时前
精益数据分析(18/126):权衡数据运用,精准把握创业方向
数据挖掘·数据分析
Leo.yuan2 小时前
数据仓库是什么?数据仓库架构有哪些?
大数据·数据库·数据仓库·架构·数据分析
Faith_xzc2 小时前
Hive 数据同步到 Doris 最佳实践方案:从场景适配到性能调优全解析
大数据·数据仓库·hive·hadoop·doris
MonkeyKing_sunyuhua3 小时前
4.4 记忆机制与上下文管理:短期与长期记忆的设计与应用
大数据·人工智能·agent
MaYuKang3 小时前
「ES数据迁移可视化工具(Python实现)」支持7.x索引数据互传
大数据·数据库·python·mysql·elasticsearch
企鹅不耐热.4 小时前
Spark-Streaming核心编程
大数据·分布式·spark