【论文阅读】一些多轮对话文章的体会 ACL 2023

前言

  • 本文是对昨天看到的ACL 2023三篇多轮对话文章的分享
  • 这三个工作都是根据一些额外属性控制输出的工作,且评估的方面比较相似,可以借鉴

方法

这几篇文章都不是做general任务的,倾向于通过一些额外信息,来做specific任务

  • 【1】提出应该在instance-level上而不是task-level上生成attribute prompt(i.e. user's persona/dialogue intent)

    • train a lightweight prompt module that takes as input a control attribute(shallow and deep version)
    • 而不是 training static soft tokens for the dialogue task
  • 【2】在inference阶段,基于对话历史预测persona信息来定制dialogue agent,而不依赖显式的persona描述

    • 提出两种方式的persona detection model:
      • 给定模型对话历史,训练其输出的向量与persona向量(通过输入persona description来编码得到)近似
      • 给定模型对话历史,训练其直接生成persona description
    • 多任务训练:将persona detection model 与 dialogue context encoder联合训练
      • 分享第一层参数,可以看作是一个通用的对话信息编码器
      • 训练persona detection model与dialogue model一起最大化ground truth response的概率
  • 【3】生成包含特定语法items的回复(比如现在完成时,虚拟语气,定语从句),尝试了在DialoGPT上用强化学习的方式与基于GPT-3的in-context learning方式,发现都可以

数据集与评估

  • 【1】Dailydialog for label control 与 FoCus for document control

    • Dailydialog :对每句话都标注了dialogue act(图中是标记的是emotiong,act在另一个文件中),一共四种(陈述,问题,指示,承诺)

    • FoCus: 包含user's persona,希望构建 dialogue agent

    • 评估response

      • controllability for customizing responses
      • n-gram based: BLEU, NIST, ROUGE-L, METEOR for fluency and adequacy
      • distinct n-gram: Dist and Entropy for diversity
      • humane evaluation for consistency between dialogue context and response and attribute controllability
  • 【2】PersonaChat and Dailydialog

    • PersonaChat(arxiv 2018)

    • 为了验证泛化性,在Dailydialog上测试

    • 评估:

      • ppl for fluency
      • Dist for diversity
      • P-Cover for covering persona information
      • human evaluation(20 annotators)
      • etc.
  • 【3】Dailydilog(SCoRE 来训练分类器)

    • 评估:
      • Dist for diversity
      • G-Ration for containing the item
      • GOAL for fluency

参考

相关推荐
Lee川13 分钟前
RAG 知识库问答:从概念到代码的完整实现
前端·人工智能·后端
侃谈科技圈19 分钟前
2026年幻视AI数字工牌与全域零售AI解决方案官方介绍
人工智能·零售
chushiyunen24 分钟前
ai人工智能方案-3d
人工智能
易知微EasyV数据可视化32 分钟前
数序重构・智启新生|袋鼠云发布Data+AI智能飞轮战略,2026春季发布会圆满落幕
大数据·人工智能·经验分享·数字孪生·空间智能
名不经传的养虾人37 分钟前
从0到1:企业级AI项目迭代日记 Vol.26|用AI是借力,教AI才是复制自己
人工智能·ai编程·skill·教ai复制自己
GEO从入门到精通42 分钟前
GEO资料免费和付费的差距大吗?
人工智能
沪漂阿龙在努力1 小时前
面试题详解:GPT 系列、Llama 系列、Qwen 系列全解析——GPT-1 到 GPT-3、Llama1 到 Llama3、Qwen3 架构与训练流程一次讲透
人工智能
dunky1 小时前
AI Agent 的 2026:从"能干活"到"会思考",中间还差什么
人工智能·agent
用户4330514143811 小时前
用 Architect 构建 Meta-Agent
人工智能
苏三的开发日记1 小时前
RAG高级技术与调优
人工智能