【for 字节跳动数据平台】数智化转型背景下的火山引擎大数据技术揭秘

摘要:线下面基+学习火山引擎大数据技术干货+精美礼品领取!快来报名参与吧!

今年4月,火山引擎在上海举办了春季 FORCE 原动力大会,正式提出了"数据飞轮"的数字化建设模式。

现如今,越来越多的企业也正围绕数据进行深度的价值挖掘,用数据全方位地驱动业务增长。如何让数据"说话",更好的帮助企业实现科学决策,并助力企业完成数字化转型?

9 月 16 日,火山引擎开发者社区 Meetup 第 12 期暨超话数据专场邀请到了火山引擎数据平台的 5 位专家,将从数据分析、数据治理、研发提效等角度,为大家带来干货分享,帮你全面了解数智化转型背景下的火山引擎数据飞轮模式在数据资产建设上的技术与实践。现场更有火山引擎定制双肩包、抱枕、水杯、帆布袋等超多精美礼品,线下参与才可领取哦,期待与大家现场面基!

⏰ 时间:2023/9/16(周六)14:00-17:30

📱形式:线下+线上直播

🚇 地点:深圳市南山区高新南九道深圳湾创新科技中心2栋B座F6-31&32(科苑地铁站C口步行340米)

精彩议程

DataSailCDC 数据整库实时入仓入湖实践》 李延加| 火山引擎 DataSail 高级研发工程师

演讲介绍: 在线数据库数据导入到数仓分析的链路已经存在多年,随着近年来实时计算的发展,业务希望有延迟更低、运维更便捷、效率更高的CDC同步通道。本次分享主要介绍DataSail实现CDC整库实时同步的技术方案和业务实践。

主要内容:

  1. CDC数据同步对业务的价值
  2. DataSail CDC同步实现技术方案
  3. 业务最佳实践

听众受益:

  1. 了解DataSail整库实时同步背后的技术

  2. 了解DataSail整库实时同步产品的能力

火山引擎 EMR 基于 Proton 的存算分离实践 》吴志平|火山引擎 EMR 研发工程师

演讲介绍: 基于对象存储的存算分离架构,在提升系统稳定性,提高资源利用率,降低运维成本的同时,在大数据量分析场景下也面临着一些核心挑战:HDFS与对象存储之间的语义差异;存算分离之后带来的较大性能损耗。

EMR团队针对这些挑战自研了Proton加速引擎,深度优化对象存储读写能力,与Hive/Spark/Trino等计算引擎集成后,在不改变用户使用习惯的前提条件下,可提供对象存储数据集的透明加速服务。在离线场景下,其性能基本持平存算一体架构。本次分享将介绍Proton技术能力和最佳实践。

主要内容:

  1. 存算分离的挑战以及解决方案
  2. Proton介绍以及原理分析
  3. Proton最佳实践

听众受益:

  1. 了解对象存储和HDFS的差异

  2. 了解Proton的基本能力以及实践方式

《字节跳动基于 DataLeap DataOps 实践》黄虹| 火山引擎 DataLeap 产品经理

演讲介绍: 随着数字化转型的推进以及业务数仓建设不断完善,大数据开发体量及复杂性逐步上升,如何保证数据稳定、正确、持续产出成为数据开发者核心诉求,也成为平台建设面临的挑战之一。本次分享主要介绍字节对于DataOps的理解 以及 DataOps在内部业务如何落地实践。

主要内容:

  1. 字节数据研发面临的挑战
  2. 字节 DataOps 定义
  3. DataOps 产品化方案
  4. 业务最佳实践

听众受益:

  1. 了解 DataOps 理念

  2. 了解 DataOps在字节业务的最佳实践

《基于 ByteHouse 引擎的增强型数据导入技术实践》孔柏林| 火山引擎 ByteHouse 产品经理

演讲介绍: ByteHouse基于自研HaMergeTree,构建增强型物化MySQL、HaKafka引擎,实现数据快速集成,加速业务数据分析性能与效率,本次talk主要介绍物化MySQL与HaKafka数据导入方案和业务实践。

主要内容:

  1. ByteHouse数据库架构演进 2. 增强HaKafka引擎实现方案 3. 增强MaterializedMySQL实现方案 4. 案例实践与未来展望

听众受益:

  1. 了解Bytehouse基于引擎层数据导入能力

  2. MaterializedMySQL和HaKafka在业务中的实践

湖仓 一体加速引擎 Bolt 及在 LAS 的应用实践》杨嘉义| 火山引擎 LAS 高级研发工程师

演讲介绍: Spark、Presto等引擎原Java执行的性能优化进入瓶颈期,而基于向量化和编译优化的native引擎,可获两倍性能加速比,降低资源成本。Bolt已经在字节跳动内部SparkSQL、Presto大规模上线,加速效果显著,其特色有:面向多场景统一加速、端到端向量化执行。本次分享将介绍Bolt的意义、架构和在LAS的应用实践。

主要内容:

  1. Bolt的背景和意义
  2. Bolt的架构设计
  3. Bolt的核心特色
  4. Bolt在湖仓一体产品LAS的实践

听众受益:

  1. 了解基于向量化和编译优化的Bolt加速引擎

  2. 了解Bolt在湖仓一体产品LAS的应用

扫码立即报名

扫码进入活动群

点击【阅读原文】也可以报名哦~快喊上更多小伙伴一起现场打卡吧!期待与大家深圳面基!

【阅读原文】链接:developer.volcengine.com/activities/...

相关推荐
PyAIGCMaster12 分钟前
文本模式下成功。ubuntu P104成功。
服务器·数据库·ubuntu
drebander24 分钟前
MySQL 查询优化案例分享
数据库·mysql
初晴~40 分钟前
【Redis分布式锁】高并发场景下秒杀业务的实现思路(集群模式)
java·数据库·redis·分布式·后端·spring·
DolphinScheduler社区43 分钟前
作业帮基于 Apache DolphinScheduler 3_0_0 的缺陷修复与优化
大数据
盖世英雄酱581361 小时前
InnoDB 的页分裂和页合并
数据库·后端
SeaTunnel1 小时前
京东科技基于 Apache SeaTunnel 复杂场景适配 #数据集成
大数据
喝醉酒的小白2 小时前
Elasticsearch 配置文件
大数据·elasticsearch·搜索引擎
一只敲代码的猪2 小时前
Llama 3 模型系列解析(一)
大数据·python·llama
YashanDB2 小时前
【YashanDB知识库】XMLAGG方法的兼容
数据库·yashandb·崖山数据库
智慧化智能化数字化方案2 小时前
深入解读数据资产化实践指南(2024年)
大数据·人工智能·数据资产管理·数据资产入表·数据资产化实践指南