新书发布——《机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps》

内容简介

机器学习大数据平台的构建、任务实现与数据治理

你需要构建安全、稳定的数据平台,需要可以扩展到任何规模的工作负载。当项目从实验室进入生产环境时,你需要确信它可以应对现实工作中的挑战。本书能够帮助你实现这些需求,将讲述如何设计和实现基于云的、可以轻松监控、扩展和修改的数据基础设施。

通过本书,你将学到构建和维护大型企业大数据平台所需的技能。书中包括设置基础设施、编排、工作负载和治理,写作风格清晰、实用。在学习过程中,你将建立高效的机器学习管道,然后掌握省时的自动化和DevOps解决方案。书中基于Azure的示例很容易在其他云平台上实现。

编辑推荐

主要内容

● 数据字典和数据治理

● 数据质量管控、合规和分发

● 构建自动化管道以提高可靠性

● 数据摄取、存储和分发

● 支持生产环境中的数据建模、分析和机器学习

图书评价

◆◆◆◆◆ 有志于研究Azure数据平台和数据工程?本书将助你腾飞!

------valiant2ex

我目前从事与Azure和Azure数据工厂相关的工作。入职之初,我对这些知识一无所知。本书从数据工程的角度剖析Azure生态系统,使我的技术飞速提升。本书示例丰富,在学习之旅中,我备感愉悦轻松。

Azure是浩瀚的知识海洋,本书就像一盏明灯,将我们引向成功的彼岸。有本书在手,数据工程解决方案学习曲线将变得十分平缓。

◆◆◆◆◆ 关于Azure数据工程的重量级好书。

------Rodrigo de Moura Leite Proenca

我是一名从事数据工程工作的新软件工程师,此前曾读过另一本指南书籍。但遇到这本更好的书,我顿感眼前一亮,相见恨晚!本书知识内涵丰富,极具价值,不仅呈现理论概念,而且列举实例,帮助读者加深理解这些概念。

本书还提供一个GitHub Repo来帮助运行命令,可帮你省下大量时间!还有很棒的图表,让你更直观、更全面、更透彻地理解技术原理。

相关推荐
武子康1 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台2 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康2 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台3 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术3 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康3 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康4 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天4 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康6 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
小飞程序员7 天前
Docker本地部署gitlab实践(windows,linux)
devops