2025个人学习与实践总结
2025年,我通过系统性课程学习与算法竞赛实践,在人工智能领域完成了快速入门与积累。
本总结旨在复盘学习路径、提炼技术洞察,并规划未来的发展方向。
系统性学习路径
我采用"框架学习 + 实战驱动"的策略,确保知识体系与应用能力同步构建:
知识输入:通过国内外优质平台课程建立理论框架,同时将官方技术文档作为解决具体问题的首要工具。
实战闭环:以竞赛打榜作为核心验证手段,在真实数据与问题中迭代,将理论知识转化为解决复杂场景问题的能力。
赛事汇总
2025年我累计参与十多场AI比赛,覆盖多模态、自然语言处理、电商及金融场景、AI安全等核心方向,并在多个赛事中取得Top 10%的优异成绩。
| 平台 | 比赛 | 时间 | 成绩百分位 |
|---|---|---|---|
| 阿里天池 | WWW2025 多模态对话系统意图识别挑战赛 | 2025-01 | 初赛: Top 16.9% |
| 阿里天池 | Data-juicer 系列学习赛:FT-Data Ranker_大语言模型微调数据赛(1B赛道) | 2025-02 | 第13名,Top 6.8% |
| 阿里天池 | Data-juicer 系列学习赛:FT-Data Ranker_大语言模型微调数据赛(7B赛道) | 2025-03 | 第9名,Top 9.5% |
| 阿里天池 | CCL25-Eval 任务5:第一届中文古诗词赏析评测 | 2025-04 | 第9名,Top 1.9% |
| 阿里天池 | CCL25-Eval 任务8:中文电子病历ICD诊断编码评测 | 2025-04 | B榜: Top 5.8% |
| 阿里天池 | CCL25-Eval 任务10:细粒度中文仇恨识别评测 | 2025-04 | 初赛: Top 3.8% |
| 阿里天池 | AFAC2025 挑战组 - 赛题一:基金产品的长周期申购和赎回预测 | 2025-06 | 第34名,B榜: Top 3.2% |
| 阿里天池 | AFAC2025 挑战组 - 赛题二:金融保险场景下多源文件长上下文一致性校验 | 2025-06 | 第30名,B榜: Top 2.9% |
| 阿里天池 | AFAC2025 挑战组 - 赛题三:金融领域中的长思维链压缩 | 2025-06 | Top 8.8% |
| 科大讯飞 | 用户新增预测挑战赛赛季3 | 2025-07 | 初赛: 第60名,Top 1.8% |
| 科大讯飞 | 基于结构化数据的用户意图理解和知识问答挑战赛 | 2025-07 | 初赛: Top 7.6% |
| 阿里天池 | 2025全球AI攻防挑战赛 - 赛道一:图片全要素交互认证-生成赛 | 2025-08 | Top 8.5% |
| 阿里天池 | 2025天池极客挑战赛 - 用户购买行为预测 | 2025-11 | 第20名,Top 1.3% |
比赛心得
从2025年初次接触天池AI大赛,到全年参与十余场算法竞赛,我最大的体会是:高效的实战依赖于对数据算法认知和精准的工具和平台选型。
对于绝大多数竞赛场景,需要完成特定任务。大参数模型优于小参数量模型。微调后的开源大模型结果一般会优于原始模型。我运用 llama-factory结合deepspeed等工具进行高效微调。在第一届中文古诗词赏析评测中使用趋动云微调了一个13B的模型。我还深入实践了 Data-juicer 这样的一站式数据处理系统,也亲身体验了其对计算资源的严苛要求,这让我对大数据工程的实际挑战深入体会,优质的数据是模型成功的基础。
同时,我并未盲目选择大模型。在金融预测、用户行为分析等任务中,传统机器学习算法因其出色的可解释性和极低的资源消耗,往往能更直接、更经济地解决问题。一次经历是,在"用户新增预测挑战赛"中,我仅通过5行代码进行关键特征筛选,就将这个二分类模型准确率提升至0.96。这说明在复杂数据中,精准的洞察和清洗往往比堆砌复杂模型更能决定成败,大部分数据的价值隐藏在高维冗余之下。
在多模态生成技术迅猛发展的当下,我亲身参与了AI安全攻防赛,这让我切实意识到,图像、音频、视频的深度伪造已成为严峻挑战,如何发展可靠的识别与防御技术,是行业必须共同面对的一个关键课题。
2025年AI发展迅猛,国内外各大厂商都发布了自己的AI编程工具,氛围编程极大的降低了开发者的门槛,同时也提高了竞赛效率。我仅使用了一个GPT-5 mini小模型,半小时提交赛题,没有写一行代码,也没有对代码进行优化迭代,最终拿了一个天池小布袋。我是不是应该把这个奖品赏给AI呢?所以未来的编程方向大概率是人机协同,人指挥AI干活。人的主要工作就是做复杂的意图识别。
规划与展望
我是一个IT爱好者,想要自己开发产品,技术上还是有很大的缺口。
2025年即将过去,在新的一年里,我计划继续深入学习人工智能。
- 提高自己的上层应用开发能力,加强从模型到产品的工程化能力。
- 底层继续加强数学基础,提高模型构建的能力。