【2025】个人学习与实践总结

2025个人学习与实践总结

2025年,我通过系统性课程学习与算法竞赛实践,在人工智能领域完成了快速入门与积累。

本总结旨在复盘学习路径、提炼技术洞察,并规划未来的发展方向。

系统性学习路径

我采用"框架学习 + 实战驱动"的策略,确保知识体系与应用能力同步构建:

知识输入:通过国内外优质平台课程建立理论框架,同时将官方技术文档作为解决具体问题的首要工具。

实战闭环:以竞赛打榜作为核心验证手段,在真实数据与问题中迭代,将理论知识转化为解决复杂场景问题的能力。

赛事汇总

2025年我累计参与十多场AI比赛,覆盖多模态、自然语言处理、电商及金融场景、AI安全等核心方向,并在多个赛事中取得Top 10%的优异成绩。

平台 比赛 时间 成绩百分位
阿里天池 WWW2025 多模态对话系统意图识别挑战赛 2025-01 初赛: Top 16.9%
阿里天池 Data-juicer 系列学习赛:FT-Data Ranker_大语言模型微调数据赛(1B赛道) 2025-02 第13名,Top 6.8%
阿里天池 Data-juicer 系列学习赛:FT-Data Ranker_大语言模型微调数据赛(7B赛道) 2025-03 第9名,Top 9.5%
阿里天池 CCL25-Eval 任务5:第一届中文古诗词赏析评测 2025-04 第9名,Top 1.9%
阿里天池 CCL25-Eval 任务8:中文电子病历ICD诊断编码评测 2025-04 B榜: Top 5.8%
阿里天池 CCL25-Eval 任务10:细粒度中文仇恨识别评测 2025-04 初赛: Top 3.8%
阿里天池 AFAC2025 挑战组 - 赛题一:基金产品的长周期申购和赎回预测 2025-06 第34名,B榜: Top 3.2%
阿里天池 AFAC2025 挑战组 - 赛题二:金融保险场景下多源文件长上下文一致性校验 2025-06 第30名,B榜: Top 2.9%
阿里天池 AFAC2025 挑战组 - 赛题三:金融领域中的长思维链压缩 2025-06 Top 8.8%
科大讯飞 用户新增预测挑战赛赛季3 2025-07 初赛: 第60名,Top 1.8%
科大讯飞 基于结构化数据的用户意图理解和知识问答挑战赛 2025-07 初赛: Top 7.6%
阿里天池 2025全球AI攻防挑战赛 - 赛道一:图片全要素交互认证-生成赛 2025-08 Top 8.5%
阿里天池 2025天池极客挑战赛 - 用户购买行为预测 2025-11 第20名,Top 1.3%

比赛心得

从2025年初次接触天池AI大赛,到全年参与十余场算法竞赛,我最大的体会是:高效的实战依赖于对数据算法认知和精准的工具和平台选型。

对于绝大多数竞赛场景,需要完成特定任务。大参数模型优于小参数量模型。微调后的开源大模型结果一般会优于原始模型。我运用 llama-factory结合deepspeed等工具进行高效微调。在第一届中文古诗词赏析评测中使用趋动云微调了一个13B的模型。我还深入实践了 Data-juicer 这样的一站式数据处理系统,也亲身体验了其对计算资源的严苛要求,这让我对大数据工程的实际挑战深入体会,优质的数据是模型成功的基础。

同时,我并未盲目选择大模型。在金融预测、用户行为分析等任务中,传统机器学习算法因其出色的可解释性和极低的资源消耗,往往能更直接、更经济地解决问题。一次经历是,在"用户新增预测挑战赛"中,我仅通过5行代码进行关键特征筛选,就将这个二分类模型准确率提升至0.96。这说明在复杂数据中,精准的洞察和清洗往往比堆砌复杂模型更能决定成败,大部分数据的价值隐藏在高维冗余之下。

在多模态生成技术迅猛发展的当下,我亲身参与了AI安全攻防赛,这让我切实意识到,图像、音频、视频的深度伪造已成为严峻挑战,如何发展可靠的识别与防御技术,是行业必须共同面对的一个关键课题。

2025年AI发展迅猛,国内外各大厂商都发布了自己的AI编程工具,氛围编程极大的降低了开发者的门槛,同时也提高了竞赛效率。我仅使用了一个GPT-5 mini小模型,半小时提交赛题,没有写一行代码,也没有对代码进行优化迭代,最终拿了一个天池小布袋。我是不是应该把这个奖品赏给AI呢?所以未来的编程方向大概率是人机协同,人指挥AI干活。人的主要工作就是做复杂的意图识别。

规划与展望

我是一个IT爱好者,想要自己开发产品,技术上还是有很大的缺口。

2025年即将过去,在新的一年里,我计划继续深入学习人工智能。

  • 提高自己的上层应用开发能力,加强从模型到产品的工程化能力。
  • 底层继续加强数学基础,提高模型构建的能力。
相关推荐
STLearner2 小时前
2025时空数据研究工作总结
大数据·人工智能·python·深度学习·学习·机器学习·智慧城市
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [fs]namei
linux·笔记·学习
·present·2 小时前
射频网课学习第七章(驱动放大器设计)
学习
Albert.H.Holmes2 小时前
Elasticsearch学习
大数据·学习·elasticsearch
下雨打伞干嘛2 小时前
前端学习官网文档
前端·学习
k***92162 小时前
Linux网络编程】应用层协议HTTP(实现一个简单的http服务)
java·开发语言·学习
两个蝴蝶飞9 小时前
Java量化系列(四):实现自选股票维护功能
java·经验分享
Java后端的Ai之路11 小时前
【神经网络基础】-神经网络学习全过程(大白话版)
人工智能·深度学习·神经网络·学习
k***921613 小时前
【C++】继承和多态扩展学习
java·c++·学习