【2025】个人学习与实践总结

2025个人学习与实践总结

2025年，我通过系统性课程学习与算法竞赛实践，在人工智能领域完成了快速入门与积累。

本总结旨在复盘学习路径、提炼技术洞察，并规划未来的发展方向。

系统性学习路径

我采用"框架学习 + 实战驱动"的策略，确保知识体系与应用能力同步构建：

知识输入：通过国内外优质平台课程建立理论框架，同时将官方技术文档作为解决具体问题的首要工具。

实战闭环：以竞赛打榜作为核心验证手段，在真实数据与问题中迭代，将理论知识转化为解决复杂场景问题的能力。

赛事汇总

2025年我累计参与十多场AI比赛，覆盖多模态、自然语言处理、电商及金融场景、AI安全等核心方向，并在多个赛事中取得Top 10%的优异成绩。

平台	比赛	时间	成绩百分位
阿里天池	WWW2025 多模态对话系统意图识别挑战赛	2025-01	初赛: Top 16.9%
阿里天池	Data-juicer 系列学习赛：FT-Data Ranker_大语言模型微调数据赛（1B赛道）	2025-02	第13名，Top 6.8%
阿里天池	Data-juicer 系列学习赛：FT-Data Ranker_大语言模型微调数据赛（7B赛道）	2025-03	第9名，Top 9.5%
阿里天池	CCL25-Eval 任务5：第一届中文古诗词赏析评测	2025-04	第9名，Top 1.9%
阿里天池	CCL25-Eval 任务8：中文电子病历ICD诊断编码评测	2025-04	B榜: Top 5.8%
阿里天池	CCL25-Eval 任务10：细粒度中文仇恨识别评测	2025-04	初赛: Top 3.8%
阿里天池	AFAC2025 挑战组 - 赛题一：基金产品的长周期申购和赎回预测	2025-06	第34名，B榜: Top 3.2%
阿里天池	AFAC2025 挑战组 - 赛题二：金融保险场景下多源文件长上下文一致性校验	2025-06	第30名，B榜: Top 2.9%
阿里天池	AFAC2025 挑战组 - 赛题三：金融领域中的长思维链压缩	2025-06	Top 8.8%
科大讯飞	用户新增预测挑战赛赛季3	2025-07	初赛: 第60名，Top 1.8%
科大讯飞	基于结构化数据的用户意图理解和知识问答挑战赛	2025-07	初赛: Top 7.6%
阿里天池	2025全球AI攻防挑战赛 - 赛道一：图片全要素交互认证-生成赛	2025-08	Top 8.5%
阿里天池	2025天池极客挑战赛 - 用户购买行为预测	2025-11	第20名，Top 1.3%

比赛心得

从2025年初次接触天池AI大赛，到全年参与十余场算法竞赛，我最大的体会是：高效的实战依赖于对数据算法认知和精准的工具和平台选型。

对于绝大多数竞赛场景，需要完成特定任务。大参数模型优于小参数量模型。微调后的开源大模型结果一般会优于原始模型。我运用 llama-factory结合deepspeed等工具进行高效微调。在第一届中文古诗词赏析评测中使用趋动云微调了一个13B的模型。我还深入实践了 Data-juicer 这样的一站式数据处理系统，也亲身体验了其对计算资源的严苛要求，这让我对大数据工程的实际挑战深入体会，优质的数据是模型成功的基础。

同时，我并未盲目选择大模型。在金融预测、用户行为分析等任务中，传统机器学习算法因其出色的可解释性和极低的资源消耗，往往能更直接、更经济地解决问题。一次经历是，在"用户新增预测挑战赛"中，我仅通过5行代码进行关键特征筛选，就将这个二分类模型准确率提升至0.96。这说明在复杂数据中，精准的洞察和清洗往往比堆砌复杂模型更能决定成败，大部分数据的价值隐藏在高维冗余之下。

在多模态生成技术迅猛发展的当下，我亲身参与了AI安全攻防赛，这让我切实意识到，图像、音频、视频的深度伪造已成为严峻挑战，如何发展可靠的识别与防御技术，是行业必须共同面对的一个关键课题。

2025年AI发展迅猛，国内外各大厂商都发布了自己的AI编程工具，氛围编程极大的降低了开发者的门槛，同时也提高了竞赛效率。我仅使用了一个GPT-5 mini小模型，半小时提交赛题，没有写一行代码，也没有对代码进行优化迭代，最终拿了一个天池小布袋。我是不是应该把这个奖品赏给AI呢？所以未来的编程方向大概率是人机协同，人指挥AI干活。人的主要工作就是做复杂的意图识别。

规划与展望

我是一个IT爱好者，想要自己开发产品，技术上还是有很大的缺口。

2025年即将过去，在新的一年里，我计划继续深入学习人工智能。

提高自己的上层应用开发能力，加强从模型到产品的工程化能力。
底层继续加强数学基础，提高模型构建的能力。