Prevalence and prevention of large language model use in crowd work

本文是LLM系列文章,针对《Prevalence and prevention of large language model use in crowd work》的翻译。

众包工作中使用大型语言模型的流行率和预防

  • 摘要
  • [1 研究1:LLM使用的普遍率](#1 研究1:LLM使用的普遍率)
  • [2 研究2:LLM使用的预防](#2 研究2:LLM使用的预防)
  • [3 讨论](#3 讨论)
  • [4 材料与方法](#4 材料与方法)

摘要

我们表明,大型语言模型(LLM)的使用在众包工作者中很普遍,有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中,没有以任何方式指导工人使用LLM,LLM使用的估计流行率约为30%,但通过要求工人不要使用LLM和提高使用成本(例如禁用复制粘贴),LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防:LLM的应用产生了高质量但同质的反应,这可能会损害与人类(而不是模型)行为有关的研究,并降低用众包数据训练的未来模型。同时,防止LLM的使用可能与获得高质量的响应不一致;例如,当要求员工不要使用LLM时,摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而,理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键,我们在广泛采用之前提供了一个关键的基线。

1 研究1:LLM使用的普遍率

2 研究2:LLM使用的预防

3 讨论

4 材料与方法

相关推荐
小白量化1 小时前
聚宽策略分享-1年化98国九条后中小板微盘小改
大数据·数据库·人工智能·量化·qmt
张拭心5 小时前
Cursor 又偷偷更新,这个功能太实用:Visual Editor for Cursor Browser
前端·人工智能
吴佳浩6 小时前
大模型 MoE,你明白了么?
人工智能·llm
Blossom.1187 小时前
基于Embedding+图神经网络的开源软件供应链漏洞检测:从SBOM到自动修复的完整实践
人工智能·分布式·深度学习·神经网络·copilot·开源软件·embedding
t198751287 小时前
电力系统经典节点系统潮流计算MATLAB实现
人工智能·算法·matlab
万悉科技7 小时前
比 Profound 更适合中国企业的GEO产品
大数据·人工智能
mqiqe7 小时前
vLLM(vLLM.ai)生产环境部署大模型
人工智能·vllm
V1ncent Chen7 小时前
机器是如何“洞察“世界的?:深度学习
人工智能·深度学习
AI营销前沿7 小时前
中国AI营销专家深度解析:谁在定义AI营销的未来?
人工智能
前端大卫8 小时前
【重磅福利】学生认证可免费领取 Gemini 3 Pro 一年
前端·人工智能