[Azure PL300 Certified] 数据分析概论与定义

1. 什么是数据分析

数据分析是标识、清除、转换和建模数据的过程,用于发现有意义和有用的信息。 然后通过报表将数据制作成故事进行分析,支持关键的决策过程。

2. 数据分析的核心部分

数据分析过程着重于清理、建模和可视化数据的任务,但数据分析的概念及其对企业的重要性不容小觑。 为了分析数据,分析的核心部分划分为以下几个类别:

  • 说明性 (也叫描述性分析)
  • 根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型语义模型,向利益干系人描述结果。
  • 通过开发关键绩效指标 (KPI),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业都使用了投资回报率 (ROI) 等指标,某些行业还开发了专门用于跟踪性能的指标。
  • 诊断性

使用统计技术来发现用以解释这些异常的关系和趋势。

对基本描述性分析的补充,通过使用描述性分析的结果来发现这些事件发生的原因。 然后,进一步调查绩效指标,以发现这些事件变得更好或更糟的原因。

  • 有助于解答事件发生原因相关问题
  • 通常分为三个步骤:
    • 确定数据中的异常。 这些异常可能是指标或特定市场中发生的意外变化。
    • 收集与这些异常相关的数据。
    • 使用统计技术来发现用以解释这些异常的关系和趋势。
  • 预测性

使用历史数据来确定趋势并确定它们是否有可能重复出现

提供将来可能发生什么的有价值见解。 技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。

  • 规范性

回答应采取哪些措施来实现目标的问题。 通过使用来自规范性分析的见解,组织可基于数据制定决策。

允许企业在面临不确定性时做出明智的决策。 规范性分析技术依赖于机器学习作为在大型语义模型中寻找模式的策略之一。 通过分析过去的决策和事件,组织可以估计不同结果的可能性。

  • 认知性

从现有数据和模式中进行推断,并基于现有知识库得出结论,然后将这些结果添加回知识库,以供将来进行推断,这是一个自学习反馈循环。 认知分析有助于了解如果情况发生变化可能发生什么,以及确定如何处理这些情况。

推断不是基于规则数据库的结构化查询,而是从多个源收集的非结构化假设,并以不同的置信度表示。 有效的认知分析取决于机器学习算法,并使用多种自然语言处理概念来利用以前未使用过的数据源,例如呼叫中心对话日志和产品评审。

3. 数据分析中的角色

  • 业务分析师 :解释来自可视化效果的数据的专家
  • 数据分析师:负责分析、清除和转换数据,负责设计和构建可缩放的高性能语义模型,在报表中启用和实现高级分析功能,用于分析报表,与相关利益干系人合作来确定合适且必要的数据和报表要求,然后将原始数据转换为相关且有意义的见解。
  • 数据分析师还负责管理 Power BI 资产,包括报表、仪表板、工作区和报表中使用的基础语义模型。
  • 与数据工程师合作,确认并找到满足利益干系人要求的合适数据源。
  • 与数据工程师和数据库管理员协作,确保分析师能够正确访问所需的数据源。
  • 与数据工程师合作来确定新的流程,或改善现有流程来收集数据以供分析。
  • 数据工程师:预配和设置本地和云中的数据平台技术,管理并保护来自多个源的结构化和非结构化数据流,确保数据服务安全且无缝地跨数据平台进行集成
  • 使用本地和云数据服务和工具来引入、传出和转换来自多个源的数据
  • 与业务利益干系人协作以识别和满足数据需求。 设计和实现解决方案
  • 数据科学家:执行高级分析,以从数据中提取价值
  • 数据库管理员:实施和管理 Microsoft Azure 数据服务和 Microsoft SQL Server 上构建的云原生和混合数据平台解决方案的操作方面,负责数据库解决方案的总体可用性及一致的性能和优化,为数据备份和恢复计划确定并实施策略、工具和过程
  • 数据库管理员监视和管理数据库及其所在的硬件的总体运行状况,而数据工程师涉及进行数据整理,即引入、转换、验证和清理数据以满足业务需求和要求的过程。
  • 数据库管理员还负责管理数据的总体安全性,根据业务需要和要求授予和限制用户对数据的访问权限和特权。
相关推荐
老吴学AI3 小时前
第 3 节 | 视觉魔术:Excel 如何用颜色和位置“控制”读者视线
信息可视化·数据分析·excel·职场·数据可视化·报表制作·用数据讲故事
满栀5853 小时前
企业后台管理系统菜单模块重构
microsoft·重构
Yeats_Liao3 小时前
星图平台快速搭建 Clawdbot:私有化本地 Qwen3-VL:30B 并接入飞书平台(上篇)
人工智能·microsoft·飞书
郝学胜-神的一滴3 小时前
特征选择利器:深入理解SelectKBest与单变量特征选择
人工智能·python·程序人生·机器学习·数据分析·scikit-learn·sklearn
范纹杉想快点毕业3 小时前
自学嵌入式系统架构设计:有限状态机入门完全指南,C语言,嵌入式,单片机,微控制器,CPU,微机原理,计算机组成原理
c语言·开发语言·单片机·算法·microsoft
2601_949146533 小时前
Go短信验证码接口开发实践:编写一个可直接运行的发送示例
服务器·microsoft·golang
xiangzhihong814 小时前
AI大模型面试总结
microsoft
Mikhail_G17 小时前
Mysql数据库操作指南——排序(零基础篇十)
大数据·数据库·sql·mysql·数据分析
云草桑18 小时前
.net AI开发04 第八章 引入RAG知识库与文档管理核心能力及事件总线
数据库·人工智能·microsoft·c#·asp.net·.net·rag
地球资源数据云20 小时前
【免费下载】中国5米分辨率坡度数据
数据分析·数据集·遥感数据