大模型后训练

RL4LLM_Survey 强化学习在大语言模型后训练综述Review of Reinforcement Learning for Large Language Models: Formulations, Algorithms, and Opportunities

专为“超大模型而生”，新一代训练引擎 XTuner V1 开源！9 月 8 日，上海人工智能实验室（上海AI实验室）开源书生大模型新一代训练引擎 XTuner V1。

我是有底线的