机器学习

龙山云仓3 小时前
大数据·人工智能·机器学习
No160:AI中国故事-对话耿恭——孤城坚守与AI韧性:极端环境与信念之光亲爱的DeepSeek:从娄敬的定都之策,我们穿越两百余年,来到东汉西域的烽火边城,遇见那位率领三千汉军、最后仅剩十三人却仍死守疏勒城的铁血将领——耿恭。这位扶风耿氏的将门之后不会想到,他率领数百将士抗击数万匈奴、在断水绝粮的绝境中坚守经年的壮举,会在人工智能的系统韧性、边缘生存、信念保持中找到惊人的历史回响。
sensen_kiss3 小时前
大数据·机器学习·数据分析
INT303 Coursework2 贷款批准预测模型(对整个大数据知识的应用)关于使用 Anaconda 的相关设置在上次的 Coursework1 中已经提及 Coursework1讲解。 想了解更多 Anaconda 相关设置也可以参考这篇对于 Anaconda 相关问题讲解的文章 Anaconda 讲解。
DeepModel6 小时前
深度学习·学习·机器学习
第15章 多模态学习多模态学习(Multimodal Learning)是当前深度学习最活跃的前沿方向之一。它研究的核心问题是:如何让模型像人类一样,同时处理并理解来自不同来源的信息(比如看到图片、听到声音、读到文字)。
绒绒毛毛雨6 小时前
人工智能·深度学习·机器学习
多目标强化学习-英伟达:GDPO随着语言模型能力的不断提升,用户不仅期望模型能够给出准确的回答,还希望其行为能够在各种场景中契合不同的人类偏好。为实现这一目标,强化学习(RL)流程开始引入多种奖励,每种奖励代表一种不同的偏好,用于引导模型产生更符合预期的行为。然而,近期的相关工作在多奖励场景下,往往直接采用了Group Relative Policy Optimization(GRPO,组相对策略优化)方法,而没有对其适用性进行充分的检验。本文指出,直接将GRPO应用于不同奖励组合的归一化,会导致所有奖励信号在归一化后变得完全一致,从而
liliangcsdn8 小时前
人工智能·机器学习
V-trace的核心公式与计算过程之前探索和学习了IMPALA强化学习算法。https://blog.csdn.net/liliang199/article/details/158211646
陈天伟教授9 小时前
人工智能·神经网络·算法·机器学习·推荐算法
人工智能应用- 人工智能交叉:05. 从 AlphaFold1 到 AlphaFold22018 年,谷歌旗下的 DeepMind 团队开始尝试使用人工智能技术预测蛋白质结构。在前人研究的基础上,他们开发了第 1 代系统,称为 AlphaFold1。这一系统通过分析蛋白质的氨基酸序列,并结合已有的生物学知识,对蛋白质结构进行预测。尽管AlphaFold1 取得了一定成果,但其预测精度尚未达到科学研究中的实用标准。然而,这一尝试为后续研究奠定了重要基础。
Eloudy9 小时前
人工智能·算法·机器学习
直接法 读书笔记 05 第5章 正交方法解决最小二乘问题最可靠的方法是使用正交变换。本章讨论基于 Householder 反射和 Givens 旋转的 QR 分解。
小雨中_10 小时前
人工智能·python·深度学习·机器学习·自然语言处理
3.7 GSPO:Group Sequence Policy Optimization(组序列策略优化)论文提出 GSPO(Group Sequence Policy Optimization),核心目标是:把大模型强化学习中“token 级动作、sequence 级奖励”的错位问题显式对齐,并进一步缓解 GRPO/PPO 在长序列训练时容易出现的高方差与不稳定(甚至不可逆崩溃)现象。
我是中国人哦(⊙o⊙)11 小时前
人工智能·算法·机器学习
我的寒假作业# 《数学寒假作业》---生日问题我的小学共有 $43$ 名同学,其中没有生日相同的,但是中学全班 $50$ 名同学,却有许多生日相同的!并且依靠神秘朋友人脉得知,其他班也有许多生日相同的
小雨中_13 小时前
人工智能·python·深度学习·机器学习·自然语言处理
3.5 ReMax:用 Greedy 作为基线的 REINFORCE + RLOO这一节先快速回顾:**策略梯度(Policy Gradient)**的核心是用“奖励相关的权重”去放大或缩小每一步动作的梯度,从而让高奖励轨迹更可能被复现、低奖励轨迹被抑制。随后再看 PPO 如何在策略梯度的框架上加入稳定训练的约束。最后进入 ReMax:它的目标和 GRPO 类似——不想训练 Critic/Value 网络,但又希望把训练稳定性做起来,于是它回到 REINFORCE,并把 baseline 设计成“同一个 prompt 下的 greedy 输出的奖励”。
DeepModel13 小时前
深度学习·机器学习·回归算法
【回归算法】Ridge回归详解本内容专为本科生、研究生梳理,用通俗的语言讲解Ridge回归的核心原理、算法流程、实战案例及模型选型,同时明确其与Lasso、ElasticNet回归的核心区别,兼顾理论理解与代码落地,是学习正则化线性回归的核心内容。
lisw0514 小时前
人工智能·机器学习·云原生
云原生技术概述!一句话概括云原生 是一套构建和运行应用程序的方法论,其目标是充分利用云计算的优势(弹性、敏捷、可扩展),以更快、更稳定、更低成本的方式交付软件。
癫狂的兔子14 小时前
python·算法·机器学习
【Python】【机器学习】集成算法(随机森林、提升算法)bagging类似集成电路的并联,取平均;boosting类似串联,加强。神经网络是黑盒,判断逻辑不可解释 feature importance的原理: 计算特征组ABCD和AB’CD的结果,(B’是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下: AB’CD的结果如果与ABCD结果差不多,则B特征不重要; 如果err(AB’CD)>>err(ABCD),则B特征重要。
twilight_46915 小时前
算法·机器学习·支持向量机
机器学习与模式识别——SVM一.实验目的二.实验内容1.上机实验题一实现书中图6.7基于支持向量机算法的山鸢尾识别问题。2.上机实验题二
DeepModel16 小时前
机器学习·回归·线性回归
【回归算法】线性回归详解本内容专为本科生、研究生梳理,用通俗的语言讲解线性回归的核心概念、理论推导、算法流程和实战案例,同时分析模型优缺点及与同类算法的对比,兼顾基础理论理解和实际代码落地,是机器学习回归算法的入门核心内容。
人工智能研究所17 小时前
人工智能·深度学习·学习·机器学习·语言模型·自然语言处理
从 0 开始学习人工智能——什么是推理模型?从 OpenAI 的 o1 到大火的 DeepSeek-R1,大家都在谈论一个新词——“推理模型” (Reasoning Models)。
爱吃羊的老虎17 小时前
人工智能·深度学习·机器学习·语言模型
【机器学习】Transformer核心架构与工作原理深度解析• 核心知识点:自注意力计算(Self-Attention):通过自注意力的矩阵运算,每个Token都能产生对其他Token的抽象理解,这种理解最终体现在一组V向量(即生成的Z向量)中,核心目的是建立句子内部词与词之间的关联性。
啊阿狸不会拉杆17 小时前
人工智能·python·学习·算法·机器学习·计算机视觉·拟合概率模型
《计算机视觉:模型、学习和推理》第 4 章-拟合概率模型目录引言4.1 最大似然法(MLE)——“最像的就是最好的”核心概念核心逻辑4.2 最大后验法(MAP)——“结合经验的最优选择”
陈天伟教授17 小时前
人工智能·神经网络·算法·机器学习·推荐算法
人工智能应用- 人工智能交叉:06.解析蛋白质宇宙图: AlphaFold 数据库中不同类型蛋白质的占比。图片来源:DeepMind blog。2022 年 7 月,DeepMind 宣布已完成对两亿种蛋白质的结构预测,覆盖了数百万个物种,包括动物、植物、细菌和真菌等,几乎囊括了人类已知的所有蛋白质。所有预测数据均被免费发布至 AlphaFold 数据库,供全球研究者使用。
牛哥带你学代码17 小时前
人工智能·深度学习·机器学习
Spatiotemporal Prediction using Deep LearningIn time series data, there are several tasks that are commonly performed, such as classification, event detection, anomaly detection, and the most dominant task is forecasting. Forecasting is simply predicting future information by utilizing information f