智能体的中文文献

1. 强化学习与智能体

  • 《强化学习》 (周志华, 2016)
    系统性介绍强化学习理论,包含马尔可夫决策过程(MDP)和Q-学习等算法。
  • 《多智能体强化学习进展综述》 (罗俊仁等, 2021)
    发表于《自动化学报》,讨论多智能体系统的协作与竞争机制。

2. 分布式智能体系统

  • 《多智能体系统导论》 (石纯一等, 2004)
    经典教材,涵盖智能体通信、协商与协作框架。
  • 《基于Agent的建模与仿真》 (张伟等, 2018)
    探讨智能体在复杂系统建模中的应用,如社会网络分析。

3. 智能体与人工智能前沿

  • 《深度强化学习:前沿与挑战》 (张伟楠等, 2020)
    分析深度强化学习(DRL)在游戏、机器人控制等场景的应用。
  • 《自主智能体系统:理论与应用》 (张涛, 2021)
    结合理论推导与案例(如无人机集群),讨论智能体自主决策技术。

4. 经典论文推荐

  1. 《多智能体协同强化学习算法研究》 (王坤峰等,《计算机研究与发展》, 2019)

    提出改进的协同Q-学习算法,解决局部观测下的合作问题。

    Q_i(s,a) \\leftarrow Q_i(s,a) + \\alpha \\left\[ r + \\gamma \\max_{a'}Q_i(s',a') - Q_i(s,a) \\right\]

  2. 《基于博弈论的多智能体决策优化》 (李力等,《控制与决策》, 2017)

    结合纳什均衡理论,设计分布式优化策略。

相关推荐
小北方城市网1 天前
第 9 课:Python 全栈项目性能优化实战|从「能用」到「好用」(企业级优化方案|零基础落地)
开发语言·数据库·人工智能·python·性能优化·数据库架构
却道天凉_好个秋1 天前
OpenCV(五十二):图像修复
人工智能·opencv·计算机视觉
Deepoch1 天前
破解酒店服务难题:Deepoc赋能机器人智能升级
人工智能·机器人·开发板·具身模型·deepoc·酒店机器人
间彧1 天前
Vibe Coding在实际项目中如何与现有开发流程(如敏捷开发、CI/CD)结合?
人工智能
JSU_曾是此间年少1 天前
pytorch自动微分机制探寻
人工智能·pytorch·python
Hcoco_me1 天前
大模型面试题40:结合RoPE位置编码、优秀位置编码的核心特性
人工智能·深度学习·lstm·transformer·word2vec
刘立军1 天前
程序员应该熟悉的概念(8)嵌入和语义检索
人工智能·算法
Mr.Lee jack1 天前
TileRT超低延迟的大语言模型推理系统
人工智能·pytorch·deepseek
kisshuan123961 天前
基于VFNet的轮胎标签检测与分类系统
人工智能·分类·数据挖掘