机器学习

STLearner39 分钟前
大数据·论文阅读·人工智能·深度学习·学习·机器学习·数据挖掘
AI论文速读 | U-Cast:学习高维时间序列预测的层次结构论文标题:U-Cast: Learning Hierarchical Structures for High-Dimensional Time Series Forecasting
roman_日积跬步-终至千里3 小时前
人工智能·机器学习
【模式识别与机器学习(16)】聚类分析【1】:基础概念与常见方法聚类分析是机器学习中的无监督学习方法,通过将相似对象分组,自动发现数据中的隐藏模式和结构,无需人工标注就能实现数据分类。本文以客户细分为实战场景,系统讲解聚类分析的基本概念、数据类型和最常见的划分方法(K-means),帮助读者理解如何从"无类标号的数据"到"自动分组",掌握聚类分析的技术本质和设计逻辑。
LDG_AGI5 小时前
人工智能·pytorch·分布式·python·深度学习·机器学习
【推荐系统】深度学习训练框架(十):PyTorch Dataset—PyTorch数据基石在PyTorch中,Dataset类是用来表示数据集的抽象类,需要继承它并实现几个关键方法。以下是详细的介绍和示例:
长桥夜波5 小时前
人工智能·机器学习
机器学习日报23今天系统学习了异常检测算法的构建和评估方法。通过高斯分布对每个特征进行建模,将各特征概率相乘得到联合概率p(x),当p(x)小于阈值ε时判定为异常。在算法评估方面,虽然训练使用无标签数据,但可以通过少量带标签的异常样本构建验证集和测试集,使用精确率、召回率和F1分数来评估性能并调整参数ε。
roman_日积跬步-终至千里5 小时前
人工智能·机器学习
【模式识别与机器学习(9)】数据预处理-第一部分:数据基础认知在第一部分中,我们将学习数据预处理的基础知识,包括如何理解不同类型的数据、如何描述数据的特征,以及为什么需要数据预处理。
胡乱编胡乱赢5 小时前
人工智能·深度学习·机器学习·联邦学习·decaf攻击
Decaf攻击:联邦学习中的数据分布分解攻击Decaf,是联邦学习领域中一种名为Data Distribution Decompose Attack的攻击手段。从性质上来说,它属于恶意攻击,会泄露联邦学习中客户端的隐私数据分布;其实现流程围绕梯度变化与数据分布的关联展开,核心是解决两类关键问题以精准推断客户端标签占比,具体如下:
青云交6 小时前
机器学习·自然语言处理·java 大数据·知识融合·跨语言信息检索·多语言知识图谱·低资源语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的跨语言信息检索与知识融合嘿,亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!在全球化浪潮下,世界贸易组织(WTO)数据显示,跨国企业日均处理的多语言商业文档超 1.5 亿份,国际学术数据库每日新增跨语言文献达 200 万篇。然而,传统跨语言信息检索系统面临三大困境:语义鸿沟导致检索准确率不足 45%(《2024 年全球自然语言处理白皮书》)、低资源语言覆盖缺失、知识孤岛难以打通。Java 凭借其分布式计算优势(单集群支持 PB 级数据处理)、丰富的机器学习生态(DL4J、Apache MXNe
_Twink1e6 小时前
人工智能·深度学习·机器学习
【HCIA-AIV4.0】2025题库+解析(二)1、以下哪一项是ReLu函数被广泛用于神经网络隐藏层的主要原因? A.能将多分类任务输出转化为概率分布 B.输出对称于0,避免梯度偏向某一方向 C.输出范围为(0,1),可直接表示概率 D.正区间梯度恒为 1,有效缓解梯度消失问题,计算简单
铅笔侠_小龙虾6 小时前
人工智能·深度学习·机器学习
深度学习理论推导--多元线性回归当你迷茫的时候,请回头看看 目录大纲,也许有你意想不到的收获先准备一些矩阵小知识,后面会大有用处,下面 A,B,C,W 全是矩阵表示
从零开始学习人工智能7 小时前
数据库·人工智能·机器学习
PDF解析双雄对决:Unstructured vs PyMuPDF 深度对比与选型指南在Python生态中,PDF解析工具层出不穷,但能真正覆盖从简单文本提取到复杂结构化解析场景的工具屈指可数。Unstructured凭借其强大的非结构化数据结构化能力脱颖而出,而PyMuPDF(fitz)则以轻量高效的文本/图像提取著称。
胡乱编胡乱赢8 小时前
人工智能·深度学习·机器学习
关于联邦学习中的Decaf攻击基础知识Decaf(Data Distribution DEcompose Attack)是针对联邦学习(FL)的一种被动隐私推断攻击,由论文提出,目标是让一个“honest-but-curious”(诚实但好奇)的服务器在不干扰训练、不降全局模型性能的情况下,反推每个客户端本地数据中各类别的占比(即数据分布)。实验证明它能在多种数据集与模型上精确恢复类比例,并能可靠识别客户端“缺失类”(null classes)。
灰灰学姐8 小时前
人工智能·深度学习·机器学习
注意力机制主要参考:注意力机制的应用_哔哩哔哩_bilibili 视觉 注意力机制——通道注意力、空间注意力、自注意力-CSDN博客
大模型服务器厂商8 小时前
人工智能·机器学习·自动驾驶
挥手示意车辆先行,自动驾驶为何常 “不知所措”? Alpamayo-R1给出新解法2025 年 NeurIPS 人工智能大会(加利福尼亚州圣地亚哥举办)上,英伟达发布的 Alpamayo-R1 模型,被业内称为 “自动驾驶领域首个视觉语言动作模型”。这款开源工具的核心目标,正是解决自动驾驶长期面临的 “常识判断” 难题 —— 而这一切技术落地,都离不开 GPU 服务器的算力支撑。
roman_日积跬步-终至千里9 小时前
机器学习·信息可视化·数据分析
【模式识别与机器学习(15)】主成分分析核心要点:主成分分析(Principal Component Analysis, PCA)是一种无监督的线性特征抽取方法,主要应用于数据降维。PCA通过寻找方差最大的投影方向,将高维数据映射到低维空间,在保持数据主要信息的同时降低数据维度。本教程将系统讲解PCA的算法原理、实现步骤和应用场景。
Salt_07289 小时前
人工智能·机器学习·聚类
DAY 21 推断聚类后簇的类型知识点回顾:1.推断簇含义的2个思路:先选特征和后选特征2. 通过可视化图形借助 ai 定义簇的含义3. 科研逻辑闭环;通过精度判断特征工程价值
江塘13 小时前
c++·python·决策树·机器学习·剪枝
机器学习-决策树剪枝处理(C++/Python实现)目录一、前言二、剪枝2.1 为什么要剪枝2.2 预剪枝2.2.1 限制树深度2.2.2 基于验证集的早停法
陈天伟教授9 小时前
人工智能·机器学习
机器学习策略(1)四大学派机器学习的目的是让机器从数据中自动学习规律,并将这些规律转化为知识,以便进行推理和决策。为了解决这一挑战,历史上涌现出了许多理论和方法,最终形成了四个主要学派:符号学派、贝叶斯学派、连接学派和进化仿生学派。
roman_日积跬步-终至千里10 小时前
数据库·机器学习·oracle
【模式识别与机器学习(18)】关联规则深入浅出教程关联规则是发现数据中"什么与什么相伴"的强有力工具,通过支持度和置信度两个核心指标,从海量交易数据中自动挖掘出有价值的关联模式。本文以电商购物篮分析为实战场景,系统讲解关联规则的核心原理和Apriori算法,帮助读者理解如何从"买面包的人往往也买牛奶"这样的业务洞察中,掌握关联规则的技术本质和落地逻辑。
宇来风满楼10 小时前
人工智能·深度学习·神经网络·算法·机器学习
U-KAN复现误差在可接受范围第24篇完全复现的论文