Prevalence and prevention of large language model use in crowd work

UnknownBody2023-10-27 15:14

本文是LLM系列文章，针对《Prevalence and prevention of large language model use in crowd work》的翻译。

众包工作中使用大型语言模型的流行率和预防

摘要
[1 研究1：LLM使用的普遍率](#1 研究1：LLM使用的普遍率)
[2 研究2：LLM使用的预防](#2 研究2：LLM使用的预防)
[3 讨论](#3 讨论)
[4 材料与方法](#4 材料与方法)

摘要

我们表明，大型语言模型（LLM）的使用在众包工作者中很普遍，有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中，没有以任何方式指导工人使用LLM，LLM使用的估计流行率约为30%，但通过要求工人不要使用LLM和提高使用成本（例如禁用复制粘贴），LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防：LLM的应用产生了高质量但同质的反应，这可能会损害与人类（而不是模型）行为有关的研究，并降低用众包数据训练的未来模型。同时，防止LLM的使用可能与获得高质量的响应不一致；例如，当要求员工不要使用LLM时，摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而，理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键，我们在广泛采用之前提供了一个关键的基线。

Prevalence and prevention of large language model use in crowd work

众包工作中使用大型语言模型的流行率和预防

摘要

1 研究1：LLM使用的普遍率

2 研究2：LLM使用的预防

3 讨论

4 材料与方法