Prevalence and prevention of large language model use in crowd work

本文是LLM系列文章,针对《Prevalence and prevention of large language model use in crowd work》的翻译。

众包工作中使用大型语言模型的流行率和预防

  • 摘要
  • [1 研究1:LLM使用的普遍率](#1 研究1:LLM使用的普遍率)
  • [2 研究2:LLM使用的预防](#2 研究2:LLM使用的预防)
  • [3 讨论](#3 讨论)
  • [4 材料与方法](#4 材料与方法)

摘要

我们表明,大型语言模型(LLM)的使用在众包工作者中很普遍,有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中,没有以任何方式指导工人使用LLM,LLM使用的估计流行率约为30%,但通过要求工人不要使用LLM和提高使用成本(例如禁用复制粘贴),LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防:LLM的应用产生了高质量但同质的反应,这可能会损害与人类(而不是模型)行为有关的研究,并降低用众包数据训练的未来模型。同时,防止LLM的使用可能与获得高质量的响应不一致;例如,当要求员工不要使用LLM时,摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而,理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键,我们在广泛采用之前提供了一个关键的基线。

1 研究1:LLM使用的普遍率

2 研究2:LLM使用的预防

3 讨论

4 材料与方法

相关推荐
Agent产品评测局13 小时前
离散制造业生产流程优化,AI落地实操步骤详解:从传统自动化到企业级智能体的技术范式跃迁
运维·人工智能·ai·自动化
rainbow72424413 小时前
零基础职场人线上学习AI,是否支持线上考试?
人工智能·学习
360亿方智能13 小时前
走向Agent-Native!360AI知识库打通业务底座,让人与AI自然协同
人工智能
love530love13 小时前
Python 3.12 解决 MediaPipe “no attribute ‘solutions‘” 终极方案:基于全版本硬核实测的避坑指南
开发语言·人工智能·windows·python·comfyui·mediapipe·solutions
fengyehongWorld13 小时前
AI 专有名词释义
人工智能
RkxI7soAM13 小时前
冷钱包选购的安全标准答案:锁定Ledger官方授权店铺
人工智能·安全
<-->13 小时前
sglang-omni [多模态大语言模型的推理与评测框架]
人工智能·语言模型·自然语言处理
小程故事多_8013 小时前
[大模型面试系列] 破解 Agent 软故障困局,四层防御 + 可观测性,筑牢生产级稳健性防线
人工智能·面试·职场和发展·智能体
wltx168813 小时前
独立站搭建需要做氨氮检测仪展示吗?
人工智能·python
月疯13 小时前
NLP的一些概念
人工智能·自然语言处理