分阶段训练金融大模型01-理论基础

分阶段训练金融大模型


预训练:获得知识

设计数据清洗系统,进行数据切片,并行处理

高频算子

有点像导入小说软件的那个过滤条件诶

训练数据配比

根据实际情况调整数据配比

指令微调


微调测评

价值观对齐

通过奖励模型 对认可回答打高分,不认可回答打低分:

收集语言、安全、金融行业偏好的高质量提示词,通过预训练好的sft模型生成问答对,并人工标注选择偏好回答,然后交给大模型

提升模型下限

相关推荐
中杯可乐多加冰36 分钟前
OpenClaw到底能做什么?有什么用?先装这几个实用的Skills
人工智能
千寻girling41 分钟前
一份不可多得的 《 Python 》语言教程
人工智能·后端·python
aircrushin3 小时前
从春晚看分布式实时协同算法与灵巧手工程实现
人工智能·机器人
恋猫de小郭3 小时前
Apple 的 ANE 被挖掘,AI 硬件公开,宣传的 38 TOPS 居然是"数字游戏"?
前端·人工智能·ios
银河系搭车客指南3 小时前
AI Agent 的失忆症:我是怎么给它装上"第二个大脑"的
人工智能
张拭心3 小时前
春节后,有些公司明确要求 AI 经验了
android·前端·人工智能
我的username4 小时前
极致简单的openclaw安装教程
人工智能
小锋java12344 小时前
【技术专题】嵌入模型与Chroma向量数据库 - Chroma 集合操作
人工智能
七月丶4 小时前
别再手动凑 PR 了:这个 AI Skill 会按仓库习惯自动建分支、拆提交、提 PR
人工智能·设计模式·程序员
用户5191495848454 小时前
CVE-2024-10793 WordPress插件权限提升漏洞利用演示
人工智能·aigc