Prevalence and prevention of large language model use in crowd work

本文是LLM系列文章,针对《Prevalence and prevention of large language model use in crowd work》的翻译。

众包工作中使用大型语言模型的流行率和预防

  • 摘要
  • [1 研究1:LLM使用的普遍率](#1 研究1:LLM使用的普遍率)
  • [2 研究2:LLM使用的预防](#2 研究2:LLM使用的预防)
  • [3 讨论](#3 讨论)
  • [4 材料与方法](#4 材料与方法)

摘要

我们表明,大型语言模型(LLM)的使用在众包工作者中很普遍,有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中,没有以任何方式指导工人使用LLM,LLM使用的估计流行率约为30%,但通过要求工人不要使用LLM和提高使用成本(例如禁用复制粘贴),LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防:LLM的应用产生了高质量但同质的反应,这可能会损害与人类(而不是模型)行为有关的研究,并降低用众包数据训练的未来模型。同时,防止LLM的使用可能与获得高质量的响应不一致;例如,当要求员工不要使用LLM时,摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而,理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键,我们在广泛采用之前提供了一个关键的基线。

1 研究1:LLM使用的普遍率

2 研究2:LLM使用的预防

3 讨论

4 材料与方法

相关推荐
2501_920953861 小时前
工业4.0时代,制造企业精益管理咨询的标准化实施步骤
大数据·人工智能·制造
~央千澈~2 小时前
《2026鸿蒙NEXT纯血开发与AI辅助》第四章 对鸿蒙next项目结构目录详解以及实战解决一个最初的依赖安装的报错·卓伊凡
人工智能
xinlianyq2 小时前
2026企业流量破局:四大主流短视频矩阵获客系统深度解析与选型指南
人工智能·矩阵
workflower3 小时前
用硬件换时间”与“用算法降成本”之间的博弈
人工智能·算法·安全·集成测试·无人机·ai编程
Cx330❀4 小时前
一文吃透Linux System V共享内存:原理+实操+避坑指南
大数据·linux·运维·服务器·人工智能
OPHKVPS4 小时前
Anthropic 为 Claude Code 推出“自动模式”:AI 编码工具迈向更高自主性
网络·人工智能·安全·ai
Allen_LVyingbo4 小时前
斯坦福HAI官网完整版《2025 AI Index Report》全面解读
人工智能·数学建模·开源·云计算·知识图谱
木子ee4 小时前
LLM×MapReduce: Simplified Long-Sequence Processing using Large Language Models
大数据·语言模型·mapreduce
金融小师妹4 小时前
基于AI通胀预期建模与能源冲击传导机制的政策分析:高频信号下的风险再评估
人工智能·svn·能源
胡摩西4 小时前
当大模型遇上毫米级定位:机器人将拥有“空间思维”?
人工智能·机器人·slam·gps·室内定位·roomaps