技术栈
决策服务
白水baishui
10 小时前
架构
·
推荐系统
·
强化学习
·
决策服务
·
服务架构
搭建强化推荐的决策服务架构
在线推荐、广告投放等场景中,强化学习推荐系统需要依据当前的用户与环境信息(上下文)即时选择最合适的动作,也就是决定展示哪条新闻或广告。微软研究院发表的论文《Making Contextual Decisions with Low Technical Debt》针对这类“上下文决策”问题,提出了一套通用的决策服务框架——Decision Service。论文链接如下: