q-learning

小毅&Nora11 天前
人工智能·cnn·q-learning
【人工智能】人工智能发展历程全景解析:从图灵测试到大模型时代(含CNN、Q-Learning深度实践)📌 文章说明:本文系统梳理人工智能自1950年至今的发展脉络,深入剖析机器学习、深度学习、大模型等关键阶段的技术演进,并以CNN(卷积神经网络)为核心展开深度实践——从基础原理到完整项目(图像分类+目标检测),提供可直接运行的精细化源码及逐行解析。适合对AI技术演进感兴趣的开发者、学生和架构师阅读,尤其适合希望落地CNN技术的初学者。
有梦想的攻城狮4 个月前
强化学习·q-learning
Q-Learning详解:从理论到实践的全面解析Q-Learning是一种无模型(Model-Free)的强化学习算法,属于**基于值迭代(Value Iteration)的方法。其核心目标是通过构建Q表(状态-动作值函数表)来存储环境认知,并指导智能体在每个状态下选择最优动作。Q-Learning采用时间差分(TD)**方法,融合了蒙特卡洛的样本效率和动态规划的数学严谨性,适用于未知环境的决策优化问题。
、达西先生10 个月前
算法·rl·sarsa·q-learning
强化学习笔记——4策略迭代、值迭代、TD算法首先梳理一下: 通过贝尔曼方程将强化学习转化为值迭代和策略迭代两种问题 求解上述两种贝尔曼方程有三种方法:DP(有模型),MC(无模型),TD(DP和MC结合) 这三种只是方法,既可以用于求值迭代也可以用于求解策略迭代
我是有底线的