A Survey on Fairness in Large Language Models

本文是LLM系列文章,针对《A Survey on Fairness in Large Language Models》的翻译。

大型语言模型中的公平性研究综述

  • 摘要
  • [1 引言](#1 引言)
  • [2 评估度量](#2 评估度量)
  • [3 内在去偏](#3 内在去偏)
  • [4 外部去偏](#4 外部去偏)
  • [5 大型LLM的公平性](#5 大型LLM的公平性)
  • [6 讨论](#6 讨论)
  • [7 结论](#7 结论)

摘要

大型语言模型(LLM)已经显示出强大的性能和发展前景,并在现实世界中得到了广泛的部署。然而,LLM可以从未处理的训练数据中捕捉社会偏见,并将这些偏见传播到下游任务。不公平的LLM制度具有不良的社会影响和潜在的危害。在本文中,我们对LLM中的公平性的相关研究进行了全面的综述。首先,对于中等规模LLM,我们分别从内在偏差和外在偏差的角度介绍了评估指标和去偏方法。然后,对于大规模LLM,我们介绍了最近的公平性研究,包括公平性评估、偏差原因和去偏差方法。最后,我们讨论并深入了解LLM公平发展的挑战和未来方向。

1 引言

2 评估度量

3 内在去偏

4 外部去偏

5 大型LLM的公平性

6 讨论

7 结论

我们对LLM中的公平性问题进行了全面的调查。社会偏见主要来源于包含有害信息和不平衡数据的训练数据,可分为内在偏见和外在偏见。我们总结了LLM的公平性研究,包括中等规模LLM的内在和外在评估指标和去偏策略,以及大规模LLM的公正性评估、偏误原因和去偏方法。此外,我们还讨论了LLM公平性发展中的挑战以及参与者可以努力的研究方向。本次调查的结论是,当前LLM的公平性研究仍需在评估偏差、偏差来源和去偏差策略方面加强。特别是对于仍处于早期阶段的大规模LLM的公平性,从业者应该结合更多的技术,构建全面、安全的语言模型系统。

相关推荐
声网7 分钟前
MiniMax 发布新 TTS 模型 Speech-02,轻松制作长篇有声内容;Meta 高端眼镜年底推出:售价上千美元丨日报
人工智能
HeteroCat11 分钟前
OpenAI 官方学院 -- 提示词课程要点
人工智能·chatgpt
每天做一点改变13 分钟前
AI Agent成为行业竞争新焦点:技术革新与商业重构的双重浪潮
人工智能·重构
大美B端工场-B端系统美颜师16 分钟前
定制化管理系统与通用管理系统,谁更胜一筹?
人工智能·信息可视化·数据挖掘·数据分析
生信小鹏17 分钟前
Nature旗下 | npj Digital Medicine | 图像+转录组+临床变量三合一,多模态AI预测化疗反应,值得复现学习的完整框架
人工智能·学习·免疫治疗·scrna-seq·scrna
开始学AI22 分钟前
【Windows+Cursor】从0到1配置Arxiv MCP Server,实现论文自主查询、下载、分析、综述生成
语言模型·大模型·ai agent·mcp
OpenLoong 开源社区30 分钟前
技术视界 | 从哲学到技术:人形机器人感知导航的探索(下篇)
人工智能·机器人·开源社区·人形机器人·openloong
csssnxy43 分钟前
叁仟数智指路机器人的主要功能有哪些?
人工智能
蝎蟹居1 小时前
GB/T 4706.1-2024 家用和类似用途电器的安全 第1部分:通用要求 与2005版差异(1)
人工智能·单片机·嵌入式硬件·物联网·安全
浊酒南街1 小时前
TensorFlow实现逻辑回归
人工智能·tensorflow·逻辑回归