分阶段训练金融大模型01-理论基础

分阶段训练金融大模型


预训练:获得知识

设计数据清洗系统,进行数据切片,并行处理

高频算子

有点像导入小说软件的那个过滤条件诶

训练数据配比

根据实际情况调整数据配比

指令微调


微调测评

价值观对齐

通过奖励模型 对认可回答打高分,不认可回答打低分:

收集语言、安全、金融行业偏好的高质量提示词,通过预训练好的sft模型生成问答对,并人工标注选择偏好回答,然后交给大模型

提升模型下限

相关推荐
callJJ3 分钟前
Spring AI ETL 数据处理管道实战指南:从原始文档到向量索引
java·人工智能·spring·ai·etl·spring ai
志栋智能8 分钟前
当巡检遇上超自动化:一场运维质量的系统性升级
运维·服务器·网络·数据库·人工智能·机器学习·自动化
有个人神神叨叨11 分钟前
Anthropic Managed Agents 详细介绍
人工智能
跨境卫士—小依12 分钟前
平台流量分发机制变化跨境卖家如何重新获取曝光
大数据·人工智能·跨境电商·亚马逊·营销策略
阿杰学AI13 分钟前
AI核心知识120—大语言模型之 基于人类反馈的强化学习 (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·rlhf·基于人类反馈的强化学习
羽师15 分钟前
MoE是什么?
人工智能
亚马逊云开发者19 分钟前
OpenClaw 部署安全第一步:用 VPC Endpoint 让 AI Agent 调用 Bedrock 全走内网
人工智能·安全
优家数科22 分钟前
2026 中国净水出海白皮书:欧洲准入的技术红线与智能化破局
人工智能·mysql瓶颈
ZPC821028 分钟前
MoveIt Servo 与自己编写的 Action Server 通信
人工智能·算法·机器人
AIminminHu28 分钟前
OpenGL渲染与几何内核那点事-项目实践理论补充(一-3-(1):你的 CAD 终于能联网协作了,但渲染的“内功心法”到底是什么?)
人工智能·opengl