分阶段训练金融大模型01-理论基础

分阶段训练金融大模型


预训练:获得知识

设计数据清洗系统,进行数据切片,并行处理

高频算子

有点像导入小说软件的那个过滤条件诶

训练数据配比

根据实际情况调整数据配比

指令微调


微调测评

价值观对齐

通过奖励模型 对认可回答打高分,不认可回答打低分:

收集语言、安全、金融行业偏好的高质量提示词,通过预训练好的sft模型生成问答对,并人工标注选择偏好回答,然后交给大模型

提升模型下限

相关推荐
云天AI实战派3 分钟前
Agent 全流程实战:用 Python 搭建技能路由智能体,落地小龙虾门店运营助手
开发语言·人工智能·python
互联网推荐官4 分钟前
上海大模型应用开发怎么样?从技术底座到落地路径的完整拆解
人工智能·软件工程
冷小鱼5 分钟前
大模型训练全景:从预训练到对齐的技术炼金术
人工智能·训练·大模型训练
百度Geek说5 分钟前
柚漫剧 AI全流程提效拆解---从单点提效到工程融合
人工智能
fuquxiaoguang12 分钟前
Agentic AI 爆发元年:2026,智能体正在学会“自己动手”
人工智能·agentic ai
隔壁大炮15 分钟前
第二章 脑电、诱发电位和事件相关电位
人工智能·深度学习·erp·eeg·脑电信号
人工智能AI技术18 分钟前
跳出CURD牢笼 拥抱智能体开发开启职业第二曲线
人工智能
无忧智库25 分钟前
具身智能的数据底座之战:一个大规模三维空间语义语料库的完整工程实践(WORD)
大数据·人工智能
我认不到你33 分钟前
拒绝token焦虑 cpa(CLI Proxy API)反代 chatgpt(Codex) 保姆级全图文教程
人工智能·ai·chatgpt