A Survey on Fairness in Large Language Models

本文是LLM系列文章,针对《A Survey on Fairness in Large Language Models》的翻译。

大型语言模型中的公平性研究综述

  • 摘要
  • [1 引言](#1 引言)
  • [2 评估度量](#2 评估度量)
  • [3 内在去偏](#3 内在去偏)
  • [4 外部去偏](#4 外部去偏)
  • [5 大型LLM的公平性](#5 大型LLM的公平性)
  • [6 讨论](#6 讨论)
  • [7 结论](#7 结论)

摘要

大型语言模型(LLM)已经显示出强大的性能和发展前景,并在现实世界中得到了广泛的部署。然而,LLM可以从未处理的训练数据中捕捉社会偏见,并将这些偏见传播到下游任务。不公平的LLM制度具有不良的社会影响和潜在的危害。在本文中,我们对LLM中的公平性的相关研究进行了全面的综述。首先,对于中等规模LLM,我们分别从内在偏差和外在偏差的角度介绍了评估指标和去偏方法。然后,对于大规模LLM,我们介绍了最近的公平性研究,包括公平性评估、偏差原因和去偏差方法。最后,我们讨论并深入了解LLM公平发展的挑战和未来方向。

1 引言

2 评估度量

3 内在去偏

4 外部去偏

5 大型LLM的公平性

6 讨论

7 结论

我们对LLM中的公平性问题进行了全面的调查。社会偏见主要来源于包含有害信息和不平衡数据的训练数据,可分为内在偏见和外在偏见。我们总结了LLM的公平性研究,包括中等规模LLM的内在和外在评估指标和去偏策略,以及大规模LLM的公正性评估、偏误原因和去偏方法。此外,我们还讨论了LLM公平性发展中的挑战以及参与者可以努力的研究方向。本次调查的结论是,当前LLM的公平性研究仍需在评估偏差、偏差来源和去偏差策略方面加强。特别是对于仍处于早期阶段的大规模LLM的公平性,从业者应该结合更多的技术,构建全面、安全的语言模型系统。

相关推荐
夜影风2 分钟前
给AI装上记忆系统:AI记忆机制与上下文管理实战
人工智能·langchain·ai记忆系统
深度学习lover4 分钟前
<数据集>yolo食物分类检测<目标检测>
人工智能·深度学习·yolo·目标检测·计算机视觉·食物分类识别
2401_832298104 分钟前
AI 智能体 “寒武纪”——OpenClaw 狂飙迭代,引领开源 Agent 商业化落地浪潮
大数据·人工智能
扬帆破浪9 分钟前
免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:本地离线知识库的妥协与收益 老电脑跑察元AI的可行边界
人工智能·windows·开源·电脑·知识图谱
Navicat中国15 分钟前
AI 代码补全如何改变 DBA 编写 SQL 的方式
数据库·人工智能·sql·dba·navicat
科技互联.30 分钟前
2026年5月观察:四大头部工具如何重塑短视频矩阵的“生产规则”
大数据·人工智能·矩阵
智象科技30 分钟前
智能运维(AIOps),正在改变IT行业格局
运维·人工智能·运维开发·devops·智能运维
数据门徒31 分钟前
神经网络原理 第五章:径向基函数网络
网络·人工智能·神经网络
TG_yunshuguoji34 分钟前
阿里云代理商:DeepSeek V4 在阿里云部署的经济性革命
人工智能·阿里云·云计算·ai智能体·deepseek v4
一切皆是因缘际会36 分钟前
2026年AGI突围:自主智能体驱动,数字生命从架构落地到自我迭代全解析
人工智能·深度学习·机器学习·架构·系统架构·agi