简历模板2——数据挖掘工程师5年经验

姓名 / Your Name

数据挖掘工程师 | 5年经验 | 推荐/风控/图模型

📞 138-XXXX-XXXX | ✉️ your.email@example.com | 🌐 github.com/yourname | 📍 北京


🎯 个人简介 / Summary

5年大厂数据挖掘经验,硕士学历。擅长推荐系统、用户画像、图神经网络及反欺诈建模,具备扎实的机器学习与工程实践能力。主导多个线上模型从0到1落地,提升业务核心指标。熟悉数据全流程处理,具备从特征设计到模型部署、AB测试的全链条经验。


💼 工作经历 / Work Experience

高级数据挖掘工程师

字节跳动 | 推荐技术部门

2021.08 -- 现今,北京

  • 参与短视频推荐排序算法设计与优化,主导多任务学习模型(DeepFM + MMoE)上线,点击率提升12.3%;
  • 构建用户画像系统,涵盖静态属性、兴趣聚类、动态行为标签,支撑推荐/广告/风控三大系统;
  • 联合平台团队建立特征服务系统,支持日均百亿级请求,稳定性达99.99%;
  • 跨部门推进 AB 实验平台优化,实现AB测试自动分流+指标归因分析。

数据挖掘工程师

美团 | 风控与调度技术组

2018.07 -- 2021.07,北京

  • 主导"虚假商户识别"图挖掘项目,引入 GAT 图神经网络,准确率提升至91%,上线后每月拦截恶意商户300+;
  • 参与骑手调度优化项目,构建包含天气/订单/区域热度等多源特征体系,提升调度模型效率,配送时间下降8.5%;
  • 搭建基于 Hive + Airflow 的特征流水线系统,实现建模样本生成标准化、自动化。

🧪 项目经历 / Selected Projects

内容推荐排序优化模型(字节跳动)

  • 建立基于用户短期兴趣的推荐排序模型,采用 Transformer + DeepFM 架构;
  • 通过样本采样、重加权缓解曝光偏差,模型效果稳定,AB实验点击率提升12%+;
  • 推动线上部署,模型影响覆盖日均用户超2亿。

用户画像系统重构(字节跳动)

  • 基于用户行为、社交关系构建图结构,用 GCN 聚类兴趣簇;
  • 标签系统统一30+维度,接入推荐、广告和反作弊系统;
  • 实现标签异步更新机制,降低资源开销30%。

虚假交易识别系统(美团)

  • 构建交易网络图,引入 GAT 进行节点表示学习;
  • 使用无监督图聚类方法发现潜在团伙,结合规则系统实时拦截;
  • 系统部署后,整体识别准确率提升至91%,极大降低用户投诉率。

🏆 竞赛经历 / Competitions & Awards

  • 🥈 Kaggle - Santander Customer Transaction Prediction (Top 2%)

    构建堆叠模型 + 特征组合策略,团队协作完成200+特征筛选与融合。

  • 🥉 阿里天池用户增长算法大赛 全国三等奖

    提出 LightGBM + 用户行为时间窗特征方案,精度显著优于baseline。

  • 🎖️ "中国研究生数学建模竞赛" 国家二等奖


🎓 教育背景 / Education

北京航空航天大学

硕士,计算机科学与技术 | 2016.09 -- 2018.06

山东大学

学士,信息管理与信息系统 | 2012.09 -- 2016.06


🧠 技能清单 / Skills

  • 编程语言:Python(Pandas, Numpy, Sklearn, PyTorch), SQL, Shell
  • 模型方法:XGBoost, LightGBM, DeepFM, GNN(GAT/GCN), MMoE, Transformer
  • 平台工具:Hive, Spark, Airflow, TensorFlow Serving, Docker, Faiss, Kafka
  • 领域经验:推荐系统、反欺诈检测、图建模、特征工程、AB实验

📃 补充信息 / Additional

  • 英语水平:CET-6,具备良好的技术文档阅读能力;
  • 技术博客作者,撰写30+篇机器学习实战笔记(yourblog.com);
  • 开源项目参与者,贡献于 RecBole / DGL 图学习框架。
相关推荐
蓝速科技几秒前
蓝速科技视觉 3D 全息舱 AI 数字人一体机带灯与无灯款深度评测
人工智能·科技·3d
武子康8 分钟前
调查研究-213 UBTech U1:当人形机器人从“听懂指令“走向“情绪陪伴“
人工智能·机器人·agent
xyz_CDragon9 分钟前
OpenAI发布首款自研芯片Jalapeño:9个月流片,AI设计芯片的时代来了
人工智能·单片机·深度学习·神经网络·芯片设计
gooxi_hui15 分钟前
海量存力,智驭未来丨国鑫4U60盘位高密度存储服务器SL401-G4重磅上市
运维·服务器·人工智能
太子釢17 分钟前
Claude Code 工具调用机制详解
人工智能
ksueh23 分钟前
AI写小说接入文心一言教程:千帆API+向量记忆系统实现百万字长篇智能创作
人工智能·ai助手
不焦躁的程序员27 分钟前
程序员该补获客能力了
人工智能·程序员
AI科技星28 分钟前
基于32维Cayley_Dickson超复数的全域拓扑统一场论——反重力、真空自持供能、维度瞬移与星际宇宙脑秩序体系
人工智能·学习·算法·机器学习·数据挖掘
星马梦缘32 分钟前
机器学习与模式识别 第十四章 神经网络中的反向传播 模拟卷及答案
人工智能·神经网络·机器学习·微分·反向传播
吴bug35 分钟前
认识 Open-ACE — AI 编程智能体的工作空间
人工智能·ai·ai编程