数据分析

databook11 小时前
数据结构·数据分析
搞懂“元数据”:给数据办一张“身份证”你是否经历过这样的场景:同事发给你一个 Excel 表格,文件名叫 data_final_v2.xlsx。
zzz大王11 小时前
数据挖掘·数据分析
精益数据分析 读书笔记第一章不是哥们,马工程之类的教材看多了,总觉得这些个人出版的书有些二流的感觉,说法夸张,总感觉无时无刻不在自我营销中。只不过,一本关于创业的书都无法做好自我营销,噱头不大,那也没什么看头。
相思半11 小时前
大数据·人工智能·python·深度学习·机器学习·数据分析
数据偏见去偏方法系统方法论学习(基础知识+实践运用)-新手友好版数据偏见(Data Bias)是导致机器学习模型在现实世界中产生不公平、不准确甚至有害结果的主要根源之一。训练数据中存在的偏差问题会直接影响模型学习到的模式,使其在部署时对某些群体或情况做出有偏见的决策。因此,在训练模型之前和之中,必须识别并采取系统化的去偏方法来减轻或消除这些偏见。去偏方法的选择取决于偏见的具体类型和所处的阶段(数据、算法、后处理)。下面将以类别不平衡(样本量差异)这一常见偏见类型为重点,并扩展到更广泛的数据偏见处理方法,形成一份完整的系统方法论思维导图。
非著名架构师13 小时前
人工智能·深度学习·机器学习·数据分析·风光功率预测·高精度气象数据·高精度天气预报数据
破解“AI幻觉”,锁定真实风险:专业气象模型如何为企业提供可信的极端天气决策依据?企业决策者面临的三大困境:预测准确性与决策风险的错配AI模型在训练集上表现优异,但在罕见极端天气事件中误差放大
EAIReport15 小时前
网络·数据挖掘·数据分析
合规风控:自动数据分析软件如何满足等保2.0要求等保2.0作为我国网络安全领域的核心制度,以动态防御、主动防护为核心,通过技术与管理双重维度构建安全体系。其核心目标包括分级保护、对象扩展和合规驱动。自动数据分析软件作为处理敏感数据的关键系统,需要特别关注等保2.0的相关要求。
写代码的【黑咖啡】16 小时前
hive·数据分析·spark
Hive on Spark:加速大数据分析的新引擎在大数据生态系统中,Apache Hive 长期以来是构建数据仓库和执行批处理查询的主流工具。然而,传统上 Hive 使用 MapReduce 作为其底层执行引擎,虽然稳定可靠,但在处理复杂查询时性能较低、延迟较高。为了解决这一问题,Hive on Spark 应运而生——它将 Apache Spark 强大的内存计算能力引入 Hive,显著提升了查询执行效率。
艾上编程17 小时前
python·数据分析·自动化
Python 跨场景实战:从爬虫采集到 AI 部署的落地指南Python 凭借简洁的语法、丰富的第三方库生态,成为从数据采集到 AI 模型部署全流程的首选语言。本文将以“电商评论数据采集→数据预处理→情感分析模型训练→模型部署”为完整链路,详解 Python 在跨场景下的实战落地方法,覆盖技术选型、核心代码、避坑要点,助力开发者打通从数据到应用的全流程。
python机器学习ML17 小时前
人工智能·机器学习·数据挖掘·数据分析·回归·scikit-learn·sklearn
机器学习——因果推断方法的DeepIV和因果森林双重机器学习(CausalForestDML)示例DeepIV 是什么?DeepIV(Deep Instrumental Variables)是一种用于因果推断的计量经济学和机器学习方法。它的核心目标是在存在**内生性(Endogeneity)**问题时,估计处理(Treatment)对结果(Outcome)的因果效应。
Ada大侦探17 小时前
人工智能·学习·数据分析·powerbi
新手小白学习PowerBI第四弹--------RFM模型建模以及饼图、分解树、树状图、增长趋势图的可视化恭喜宿主完成第一关的任务,接下来来到第二关吧。实话实说,咱这游戏太有技术含量了。第二关您获得的宝藏是对用户进行分群,获得高价值用户、潜在用户、流动风险用户,有了这些用户分群,我们可以对用户采取更好地营销策略,让我们和用户在金钱和服务上实现一个双赢。
EAIReport17 小时前
数据挖掘·数据分析
NLG技术在自动生成数据分析报告中的应用自然语言生成(NLG)作为人工智能的重要分支,能够将结构化数据转化为人类可理解的自然语言文本。其核心价值在于打破数据与决策之间的壁垒,让非技术人员也能快速理解复杂数据分析结果。NLG技术的工作流程主要包括三个阶段:
wirepuller_king18 小时前
开发语言·数据分析·r语言
数据统计分析及R语言编程-支付宝/微信消费账单数据分析这个比较简单,这里不多赘述。从微信导出账单信息(因为微信比支付宝导出账单比较简单)在微信底端“我的”-“服务”-“钱包”-“账单”
python机器学习ML18 小时前
人工智能·python·机器学习·数据挖掘·数据分析·scikit-learn·sklearn
EconML实战:使用DeepIV、DROrthoForest与CausalForestDML进行因果推断详解本项目旨在详细解释一系列用于因果推断的Python代码实现。内容面向有一定机器学习基础,但对因果推断领域尚不熟悉的读者。我们将深入探讨代码的每个阶段,解释其背后的原理、目的和具体实现细节。通过本项目,将能够理解这些复杂的因果模型是如何工作的,并具备将其应用于自己数据集的能力。
奥特曼_ it1 天前
python·算法·机器学习·数据分析·django·毕业设计·旅游
【机器学习】python旅游数据分析可视化协同过滤算法推荐系统(完整系统源码+数据库+开发笔记+详细部署教程)✅目录一、项目背景二、研究目的三、项目意义四、项目功能五、项目创新点六、开发技术介绍七、项目功能展示八、实战教学视频哔哩哔哩平台链接
Ada大侦探1 天前
学习·数据分析·powerbi
新手小白学习PowerBI第三弹--------获取项目数据源+KPI、折线图、地图、柱状图可视化展示欢迎各位朋友来到第三弹,恭喜你又又又升级啦,同时第一次来的那么刷到就是我们的缘分,在Power BI(以后简称PB)的学习过程中,你将获得利用PB清洗数据、可视化数据的全过程,并且后续也会有分析决策的内容,最重要的是,所有学习到的点,都是我们会用到的,同时,我们也会培养一个思维,那就是在实践中学习理论,这个方法论以后可以运用到其他生活中的方方面面。
派可数据BI可视化1 天前
大数据·信息可视化·数据分析
你知道 BI 是什么吗?关于 BI 系统的概述BI 作为信息化建设中的关键一环,在企业中通常起到承上启下的作用,下能连接打通企业业务系统数据库,将各部门数据分类分级统一储存到数据仓库,简化存储取数流程,减少人力、时间成本;上能提供数据可视化报表,通过数据可视化分析全面展现企业发展状况,追踪业务执行效果,促进业务健康发展,辅助进行管理决策等。今天我就来从多角度了解 BI 。
highreport2 天前
数据挖掘·数据分析·bi数据分析·bi图表分析·开源免费bi数据分析
开源免费BI数据分析软件HighBI数据分析自2022年开始研发BI数据分析定制产品,2025年研发2.0版本,目前进入产品测试阶段,推出开源永久免费BI数据分析功能。
咚咚王者2 天前
人工智能·数据分析·pandas
人工智能之数据分析 Pandas:第十一章 项目实践第十一章 项目实践本文通过一个完整的 Pandas 项目实践案例,从 数据加载 → 清洗 → 探索 → 分析 → 可视化 → 输出结论,全流程掌握 Pandas 在真实场景中的应用。
我是哈哈hh2 天前
开发语言·python·数据挖掘·数据分析
【Python数据分析】数据分析完整流程(全)目录一、 数据分析流程1. 数据的导入(pd.read_csv(【文件名】)) 和 导出(pd.to_csv(【文件名】))
咚咚王者2 天前
人工智能·数据分析·pandas
人工智能之数据分析 Pandas:第十章 知识总结第十章 知识总结本文是对Pandas 核心知识点的系统性总结,涵盖从基础到进阶的关键概念、常用操作和最佳实践,适合用于快速复习、面试准备或日常开发参考。
B站计算机毕业设计之家2 天前
大数据·爬虫·python·selenium·机器学习·数据分析·django
基于python京东商品销售数据分析可视化系统 Django框架 爬虫 大数据(源码)博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅