姓名 / Your Name
数据挖掘工程师 | 5年经验 | 推荐/风控/图模型
📞 138-XXXX-XXXX | ✉️ [email protected] | 🌐 github.com/yourname | 📍 北京
🎯 个人简介 / Summary
5年大厂数据挖掘经验,硕士学历。擅长推荐系统、用户画像、图神经网络及反欺诈建模,具备扎实的机器学习与工程实践能力。主导多个线上模型从0到1落地,提升业务核心指标。熟悉数据全流程处理,具备从特征设计到模型部署、AB测试的全链条经验。
💼 工作经历 / Work Experience
高级数据挖掘工程师
字节跳动 | 推荐技术部门
2021.08 -- 现今,北京
- 参与短视频推荐排序算法设计与优化,主导多任务学习模型(DeepFM + MMoE)上线,点击率提升12.3%;
- 构建用户画像系统,涵盖静态属性、兴趣聚类、动态行为标签,支撑推荐/广告/风控三大系统;
- 联合平台团队建立特征服务系统,支持日均百亿级请求,稳定性达99.99%;
- 跨部门推进 AB 实验平台优化,实现AB测试自动分流+指标归因分析。
数据挖掘工程师
美团 | 风控与调度技术组
2018.07 -- 2021.07,北京
- 主导"虚假商户识别"图挖掘项目,引入 GAT 图神经网络,准确率提升至91%,上线后每月拦截恶意商户300+;
- 参与骑手调度优化项目,构建包含天气/订单/区域热度等多源特征体系,提升调度模型效率,配送时间下降8.5%;
- 搭建基于 Hive + Airflow 的特征流水线系统,实现建模样本生成标准化、自动化。
🧪 项目经历 / Selected Projects
内容推荐排序优化模型(字节跳动)
- 建立基于用户短期兴趣的推荐排序模型,采用 Transformer + DeepFM 架构;
- 通过样本采样、重加权缓解曝光偏差,模型效果稳定,AB实验点击率提升12%+;
- 推动线上部署,模型影响覆盖日均用户超2亿。
用户画像系统重构(字节跳动)
- 基于用户行为、社交关系构建图结构,用 GCN 聚类兴趣簇;
- 标签系统统一30+维度,接入推荐、广告和反作弊系统;
- 实现标签异步更新机制,降低资源开销30%。
虚假交易识别系统(美团)
- 构建交易网络图,引入 GAT 进行节点表示学习;
- 使用无监督图聚类方法发现潜在团伙,结合规则系统实时拦截;
- 系统部署后,整体识别准确率提升至91%,极大降低用户投诉率。
🏆 竞赛经历 / Competitions & Awards
-
🥈 Kaggle - Santander Customer Transaction Prediction (Top 2%)
构建堆叠模型 + 特征组合策略,团队协作完成200+特征筛选与融合。
-
🥉 阿里天池用户增长算法大赛 全国三等奖
提出 LightGBM + 用户行为时间窗特征方案,精度显著优于baseline。
-
🎖️ "中国研究生数学建模竞赛" 国家二等奖
🎓 教育背景 / Education
北京航空航天大学
硕士,计算机科学与技术 | 2016.09 -- 2018.06
山东大学
学士,信息管理与信息系统 | 2012.09 -- 2016.06
🧠 技能清单 / Skills
- 编程语言:Python(Pandas, Numpy, Sklearn, PyTorch), SQL, Shell
- 模型方法:XGBoost, LightGBM, DeepFM, GNN(GAT/GCN), MMoE, Transformer
- 平台工具:Hive, Spark, Airflow, TensorFlow Serving, Docker, Faiss, Kafka
- 领域经验:推荐系统、反欺诈检测、图建模、特征工程、AB实验
📃 补充信息 / Additional
- 英语水平:CET-6,具备良好的技术文档阅读能力;
- 技术博客作者,撰写30+篇机器学习实战笔记(yourblog.com);
- 开源项目参与者,贡献于 RecBole / DGL 图学习框架。