技术栈
rl4llm
QiZhang | UESTC
4 小时前
大模型
·
强化学习
·
rl4llm
RL4LLM
RL4LLM 这是新的学习方向,已经抛弃了rec(_)。具体的学习资源推荐(包括必学资源、选学资源)、项目实践清单,见学习路径文档。
我是有底线的