智能体的中文文献

1. 强化学习与智能体

  • 《强化学习》 (周志华, 2016)
    系统性介绍强化学习理论,包含马尔可夫决策过程(MDP)和Q-学习等算法。
  • 《多智能体强化学习进展综述》 (罗俊仁等, 2021)
    发表于《自动化学报》,讨论多智能体系统的协作与竞争机制。

2. 分布式智能体系统

  • 《多智能体系统导论》 (石纯一等, 2004)
    经典教材,涵盖智能体通信、协商与协作框架。
  • 《基于Agent的建模与仿真》 (张伟等, 2018)
    探讨智能体在复杂系统建模中的应用,如社会网络分析。

3. 智能体与人工智能前沿

  • 《深度强化学习:前沿与挑战》 (张伟楠等, 2020)
    分析深度强化学习(DRL)在游戏、机器人控制等场景的应用。
  • 《自主智能体系统:理论与应用》 (张涛, 2021)
    结合理论推导与案例(如无人机集群),讨论智能体自主决策技术。

4. 经典论文推荐

  1. 《多智能体协同强化学习算法研究》 (王坤峰等,《计算机研究与发展》, 2019)

    提出改进的协同Q-学习算法,解决局部观测下的合作问题。

    Q_i(s,a) \\leftarrow Q_i(s,a) + \\alpha \\left\[ r + \\gamma \\max_{a'}Q_i(s',a') - Q_i(s,a) \\right\]

  2. 《基于博弈论的多智能体决策优化》 (李力等,《控制与决策》, 2017)

    结合纳什均衡理论,设计分布式优化策略。

相关推荐
Mr. zhihao2 分钟前
SDD(规范驱动开发):AI 编程时代的范式革命——因果链视角
人工智能·ai编程
大腾智能4 分钟前
华为开发者大会2026观察:鸿蒙底座成型,大腾智能锚定工业AI路径
人工智能·华为·harmonyos
rising start5 分钟前
ReAct Agent:让 AI 学会思考与行动
人工智能·agent
奔袭的算法工程师5 分钟前
论文解读--Sparse4D v3: Advancing End-to-End 3D Detection and Tracking
人工智能·目标检测·计算机视觉·自动驾驶·信号处理
SNSZR16 分钟前
2026定制数字人平台选型:5大垂直行业解决方案对比
大数据·人工智能·安全
小二·6 分钟前
端侧 AI 模型部署:从云端到移动端
人工智能
AI搅拌机6 分钟前
ComfyUI Bernini导演台再升级:支持FPS设置及源视频输出,修复音画不同步BUG。
人工智能
qzhqbb7 分钟前
论文精读|GEC-DCL——面向段落与学术文本的动态上下文语法纠错模型
人工智能
程序员三明治8 分钟前
【AI】从文本到向量:理解Embedding的作用
java·人工智能·后端·llm·元数据·rag·向量化
lxw18449125148 分钟前
2026年国内免费的key ,可接入cc switch 的有哪些?
人工智能·ai编程