分阶段训练金融大模型01-理论基础

分阶段训练金融大模型


预训练:获得知识

设计数据清洗系统,进行数据切片,并行处理

高频算子

有点像导入小说软件的那个过滤条件诶

训练数据配比

根据实际情况调整数据配比

指令微调


微调测评

价值观对齐

通过奖励模型 对认可回答打高分,不认可回答打低分:

收集语言、安全、金融行业偏好的高质量提示词,通过预训练好的sft模型生成问答对,并人工标注选择偏好回答,然后交给大模型

提升模型下限

相关推荐
臭东西的学习笔记3 小时前
论文学习——机器学习引导的蛋白质工程
人工智能·学习·机器学习
大王小生4 小时前
说说CSV文件和C#解析csv文件的几种方式
人工智能·c#·csv·csvhelper·csvreader
m0_462605224 小时前
第G3周:CGAN入门|生成手势图像
人工智能
bubiyoushang8884 小时前
基于LSTM神经网络的短期风速预测实现方案
人工智能·神经网络·lstm
中烟创新4 小时前
烟草专卖文书生成智能体与法规案卷评查智能体获评“年度技术最佳实践奖”
人工智能
得一录4 小时前
大模型中的多模态知识
人工智能·aigc
Github掘金计划5 小时前
Claude Work 开源平替来了:让 AI 代理从“终端命令“变成“产品体验“
人工智能·开源
ghgxm5205 小时前
Fastapi_00_学习方向 ——无编程基础如何用AI实现APP生成
人工智能·学习·fastapi
余俊晖6 小时前
3秒实现语音克隆的Qwen3-TTS的Qwen-TTS-Tokenizer和方法架构概览
人工智能·语音识别
森屿~~6 小时前
AI 手势识别系统:踩坑与实现全记录 (PyTorch + MediaPipe)
人工智能·pytorch·python