【百度】B端数据中台组_大数据研发工程师(J68899)

北京市技术3人2023-12-14

工作职责:

  • 负责百家号和Feed相关大数据的基础建设
  • 负责数仓引擎、Spark底层的优化和基础建设
  • 为百度系APP相关业务分析及策略优化提供大数据支持
  • 参与百度系APP日志数据架构开发和APP端性能分析平台建设

职责要求:

  • 本科及以上学历,计算机相关专业
  • 熟练使用SQL,以及Scala/C++其中一种编程语言,对分布式架构和并行计算有较深刻理解
  • 熟悉Hadoop/Spark/HBase/Kylin/ClickHouse等大数据计算和存储技术栈,了解其工作原理,并有实际开发经验
  • 熟悉Spark Streaming/Flink等流式计算框架,以及Kafka等常见消息队列
相关推荐
智海观潮10 小时前
Unity Catalog与Apache Iceberg如何重塑Data+AI时代的企业数据架构
大数据·人工智能·ai·iceberg·catalog
柏峰电子11 小时前
市政道路积水监测系统:守护城市雨天出行安全的 “智慧防线”
大数据·人工智能·安全
威斯软科的老司机12 小时前
AR远程协作系统设计:虚实融合场景下的设备维护操作指引界面
大数据·ar·可视化
陆水A16 小时前
数仓主题域划分
大数据·数据仓库·数据库开发·etl·etl工程师
道一云黑板报16 小时前
Spark初探:揭秘速度优势与生态融合实践
大数据·分布式·spark·流式处理
字节跳动数据平台17 小时前
火山引擎多模态数据湖:AI时代的数据湖如何挖掘图片、视频、语音的“富矿”?
大数据
野生技术架构师17 小时前
系统改造:一次系统领域拆分的实战复盘
java·大数据·开发语言
时序数据说18 小时前
分布式时序数据库的特点解析
大数据·数据库·分布式·物联网·时序数据库·iotdb
WJ.Polar19 小时前
Python与Spark
大数据·分布式·spark
喻师傅19 小时前
Spark SQL 数组函数合集:array_agg、array_contains、array_sort…详解
大数据·hadoop·分布式·sql·spark