技术栈

rl4llm

QiZhang | UESTC
4 小时前
大模型·强化学习·rl4llm
RL4LLMRL4LLM 这是新的学习方向,已经抛弃了rec(_)。具体的学习资源推荐(包括必学资源、选学资源)、项目实践清单,见学习路径文档。
我是有底线的