技术栈
偏好学习
CodeShare
14 小时前
机器学习
·
偏好学习
·
胜率优化
通过胜率理解偏好学习的理论与优化方法
偏好学习(即通过偏好对比数据对齐生成模型)尚未达到分类或密度估计等任务的成熟度。为此,本文从成对偏好数据的抽样分布出发构建理论框架,证明生成模型的唯一合理评估指标是胜率(win rate),因其同时尊重数据分布中的偏好与流行度。