学习周报二十五学习了无监督学习(PCA)、强化学习(Q-learning)的核心原理,以及神经网络与推荐算法结合的实践实现。阐述 PCA 作为线性降维方法的原理、步骤、应用场景,分析其在大模型和深度神经网络中不适用的原因及有限应用场景;其次介绍强化学习的核心框架、Q-learning 算法的原理与贝尔曼更新方程,以及神经网络如何解决传统强化学习的维度灾难问题;最后通过完整的 PyTorch 代码实现 NeuMF 推荐模型,详细说明数据编码、负采样、二分类损失优化、HR/NDCG 评估等关键环节,展示了 GMF(线性交互