论文笔记:Does Writing with Language Models Reduce Content Diversity?

iclr 2024 reviewer评分 566

1 intro

  • 大模型正在迅速改变人们创造内容的方式
    • 虽然基于LLM的写作助手有可能提高写作质量并增加作者的生产力,但它们也引入了算法单一文化
    • ------>论文旨在评估与LLM一起写作是否无意中降低了内容的多样性
  • 论文设计了一个控制实验,要求用户在纽约时报学生意见系列的一个话题下写一篇论证性文章,例如"学校教育中学生学到的最重要的东西是什么?
    • 将参与者分为三组:
      • 一组控制组,参与者在没有模型帮助的情况下写文章;
      • 一组LLM处理组,参与者在基础语言模型(GPT3)的帮助下写文章;
      • 一组反馈调优LLM处理组,参与者在经过人类反馈微调的语言模型(InstructGPT)的帮助下写文章。
    • 论文雇佣了38名写手
      • 对于每组,论文在10个话题上收集了100篇文章
      • 然后,论文开发了一组指标并测量LLM对内容多样性的影响,包括个体层面和集体层面:
        • 同质化:使用LLM写作的用户彼此写得是否更相似?
          • 使用InstructGPT的组在同质化程度上高于控制组和GPT3组
          • 通过将模型贡献的文本与每篇文章的总结要点匹配,我们发现InstructGPT贡献的要点导致了同质化增加
        • 多样性:与LLM一起写作是否降低了一组用户产生的内容的多样性?
          • 与InstructGPT一起写的文章集合显示出较低的词汇多样性,并且表达的关键点的多样性也降低

2 数据收集

2.1 任务设置

  • 用户将获得一个诸如"学校教育中学生学到的最重要的东西是什么?"的主题,并被要求用大约300字表达他们的观点
  • 用户可以选择接受并编辑其中一个LLM提出的建议,或拒绝所有建议并继续他们的写作过程。
  • 要求用户每篇文章至少请求5次建议,但不要求他们必须接受这些建议

3 用户如何与模型互动?

  • 用户平均每篇文章查询模型约9次,并接受其中约70%的建议
  • 由于用户可能在接受建议后进一步编辑这些建议,论文进一步计算了这些接受的建议是否保留在最终的文章中(model-written percentage)

但是,LLM的贡献是在贡献关键论点还是仅仅支持点的阐述呢?

------>论文过提示 gpt-3.5-turbo 将每篇文章总结为一个关键点列表,然后估计由模型和用户编写的关键点的比例

------>差不多40%的关键点是LLM提供的

4 使用LLM写作是否导致了更相似的文章?

  • 使用InstructGPT写作产生了更相似的内容
  • 使用GPT3写作并未增加同质化

5 使用LLM写作会降低内容的整体多样性吗?

  • 使用InstructGPT写作降低了词汇多样性
  • 使用InstructGPT写作降低了关键点多样性。
  • InstructGPT组的多样性低于Solo和GPT3组
  • 使用InstructGPT写作的文章更频繁地重复高阶n-grams

6 为什么使用 InstructGPT 写作会减少多样性?

  • InstructGPT 生成的文本比 GPT3 的多样性少
    • 与 GPT3 相比,InstructGPT 生成的文本多样性更低,这一点在先前的工作中也有观察到。
      • GPT4 的技术报告发现反馈调优的模型校准度更低
      • Bai 等人发现微调导致输出分布的熵减少
  • 模型写作和用户写作的多样性直接检查
    • ​​​​​​​无论用户是否与模型一起写作,以及他们使用哪个模型,用户写作文本的5-gram分布保持不变。
    • ------>用户的短语使用模式不受模型帮助的影响
  • InstructGPT 增加了关键点之间的相似性,而用户写作的文本未受影响
相关推荐
用户25765957590923 分钟前
当人类知识学会自己奔跑--skill
人工智能
个入资料3 小时前
阿里云ecs+飞书搭建openclaw
人工智能
孤烟3 小时前
【RAG 实战系列 02】检索精度翻倍!混合检索(稀疏 + 稠密)实战教程
人工智能·llm
明明如月学长4 小时前
OpenClaw 帮我睡后全自动完成了老板交代的任务
人工智能
uuware4 小时前
Lupine.Press + AI 助您分分钟搞定技术项目的文档网站
人工智能·前端框架
海上日出4 小时前
使用 QuantStats 进行投资组合绩效分析:Python 量化实战指南
人工智能
Qinana4 小时前
150行代码搞定私有知识库!Node.js + LangChain 打造最小化 RAG 系统全流程
人工智能·程序员·node.js
猿猿长成记4 小时前
AI专栏 | AI大法则之思维链、自洽性、思维树
人工智能
用户5191495848454 小时前
CrushFTP 条件竞争认证绕过漏洞利用工具 (CVE-2025-54309)
人工智能·aigc
一拳不是超人4 小时前
AI时代,35岁程序员焦虑终结:经验从负债变资产
人工智能·程序员