技术栈
paperresearch
猴子吃桃_Q
6 小时前
paperresearch
告别人工标注瓶颈!Reward-RAG:用 CriticGPT 打造更懂人类偏好的检索模型
Reward-RAG: Enhancing RAG with Reward Driven Supervision
我是有底线的