分阶段训练金融大模型01-理论基础

墨_浅-2026-01-05 9:27

分阶段训练金融大模型

预训练：获得知识

设计数据清洗系统，进行数据切片，并行处理

高频算子

有点像导入小说软件的那个过滤条件诶

训练数据配比

根据实际情况调整数据配比

指令微调

微调测评

价值观对齐

通过奖励模型 对认可回答打高分，不认可回答打低分：

收集语言、安全、金融行业偏好的高质量提示词，通过预训练好的sft模型生成问答对，并人工标注选择偏好回答，然后交给大模型

提升模型下限

上一篇：ES 学习笔记

下一篇：印度交易所 BSE 与 NSE 实时数据 API 接入指南

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）09几个好用的ip纯净度检测网站 102026 年 AI 大模型 & AI 编程工具实战全总结