A Survey on Fairness in Large Language Models

本文是LLM系列文章,针对《A Survey on Fairness in Large Language Models》的翻译。

大型语言模型中的公平性研究综述

  • 摘要
  • [1 引言](#1 引言)
  • [2 评估度量](#2 评估度量)
  • [3 内在去偏](#3 内在去偏)
  • [4 外部去偏](#4 外部去偏)
  • [5 大型LLM的公平性](#5 大型LLM的公平性)
  • [6 讨论](#6 讨论)
  • [7 结论](#7 结论)

摘要

大型语言模型(LLM)已经显示出强大的性能和发展前景,并在现实世界中得到了广泛的部署。然而,LLM可以从未处理的训练数据中捕捉社会偏见,并将这些偏见传播到下游任务。不公平的LLM制度具有不良的社会影响和潜在的危害。在本文中,我们对LLM中的公平性的相关研究进行了全面的综述。首先,对于中等规模LLM,我们分别从内在偏差和外在偏差的角度介绍了评估指标和去偏方法。然后,对于大规模LLM,我们介绍了最近的公平性研究,包括公平性评估、偏差原因和去偏差方法。最后,我们讨论并深入了解LLM公平发展的挑战和未来方向。

1 引言

2 评估度量

3 内在去偏

4 外部去偏

5 大型LLM的公平性

6 讨论

7 结论

我们对LLM中的公平性问题进行了全面的调查。社会偏见主要来源于包含有害信息和不平衡数据的训练数据,可分为内在偏见和外在偏见。我们总结了LLM的公平性研究,包括中等规模LLM的内在和外在评估指标和去偏策略,以及大规模LLM的公正性评估、偏误原因和去偏方法。此外,我们还讨论了LLM公平性发展中的挑战以及参与者可以努力的研究方向。本次调查的结论是,当前LLM的公平性研究仍需在评估偏差、偏差来源和去偏差策略方面加强。特别是对于仍处于早期阶段的大规模LLM的公平性,从业者应该结合更多的技术,构建全面、安全的语言模型系统。

相关推荐
小芝麻咿呀几秒前
边缘计算网关-EG8200Mini导轨版
java·人工智能·边缘计算
ZC跨境爬虫7 分钟前
3D 地球卫星轨道可视化平台开发 Day5(简介接口对接+规划AI自动化卫星数据生成工作流)
前端·人工智能·3d·ai·自动化
木卫二号Coding7 分钟前
第八十四篇-V100-32G+Easyclaw+Ollama+Qwopus3.5-27B-V3
人工智能
xiaoxiang960910 分钟前
TDD测试驱动开发:从理论到实战的完整指南(含AI增强工作流)
人工智能·驱动开发·tdd
小张同学82412 分钟前
Python 封神技巧:1 行代码搞定 90% 日常数据处理,效率直接拉满
开发语言·人工智能·python
源码之家15 分钟前
计算机毕业设计:Python棉花产业数据可视化与预测系统 Django框架 ARIMA算法 数据分析 可视化 爬虫 大数据 大模型(建议收藏)✅
人工智能·python·算法·信息可视化·数据挖掘·django·课程设计
chatexcel15 分钟前
北大ChatExcel团队推出AI办公桌宠“仓鼠元元”:桌面宠物开始做效率助手了
人工智能·宠物
数字供应链安全产品选型15 分钟前
从影子AI到合规溯源:悬镜安全灵境AIDR如何覆盖智能体安全全生命周期?
人工智能
梵得儿SHI17 分钟前
(第一篇)Spring AI 架构设计与优化:从单实例到万级 QPS 分布式服务的演进之路
人工智能·分布式架构·spring ai·万级 qps·ai 服务高并发·模型 / 向量 / 业务·qps分布式服务
qq_3482318518 分钟前
Ubuntu 24.04 环境配置 AI自动化编程 gstack
linux·运维·人工智能·ubuntu