机器学习

有为少年1 小时前
人工智能·线性代数·机器学习·计算机视觉·矩阵
从概率估计到“LLM 训练是有损压缩”当我们试图理解大语言模型(LLM)的内部运作时,往往会自然地走向信息论。一个模型在训练中到底“记住”了多少输入细节?它又真正提取出了多少对预测下一个 token 有用的结构?
春风有信3 小时前
人工智能·深度学习·机器学习
【DM】DDPM与DDIM的数学原理目录符号说明一、DDPM1.1 前向过程1.1.1 逐步加噪1.1.2 任意加噪1.1.3 噪声强度分析
刘大猫.4 小时前
人工智能·算法·机器学习·ai·大模型·算力·ai智能座舱助手
宝马发布全新AI智能座舱助手 能理解用户复杂出行需求在刚刚闭幕的 2026 北京车展上,宝马联合阿里云隆重推出了三款专为中国市场设计的 AI 智能助手。这些助手将全面提升用户在用车和出行方面的体验,让传统的车机语音助手从被动响应变为主动决策,真正做到 “听得懂,办得妥”。
WHS-_-20224 小时前
人工智能·python·机器学习
Rank-Revealing Bayesian Block-Term Tensor Completion With Graph Information摘要——块项分解 (BTD),特别是其秩为 ( L r , L r , 1 ) (L_r, L_r, 1) (Lr,Lr,1) 的特例,在信号处理中得到了广泛应用。计算 BTD 的传统方法要么不切实际地假设块的数量和块秩是已知的,要么需要对这些参数进行穷举式的调整。虽然已经引入了促进稀疏性的正则化来更有效地估计这些参数,但它仍然需要调整正则化参数。
迁旭6 小时前
人工智能·机器学习·语言模型·gpt-3
OpenAI API 请求与响应 核心总结HTTPS + HTTP,就是普通的 REST API 调用,无任何特殊协议。流式返回是 HTTP SSE,同样基于 HTTP。
AI周红伟6 小时前
人工智能·深度学习·安全·机器学习·语言模型·openclaw
周红伟:OpenClaw安全防控:OpenClaw+Skills+DeepSeek-V4大模型安全部署、实操和企业应用实操《OpenClaw安全防控:OpenClaw+Skills+DeepSeek-V4大模型安全部署、实操和企业应用实操》
-cywen-6 小时前
人工智能·深度学习·机器学习
扩散模型基础扩散模型属于「生成模型」的一种,通过学习给定的训练样本,生成模型可以学会如何 生成 数据,比如生成图片或者声音。一个好的生成模型能生成一组 样式不同 的输出。这些输出会与训练数据相似,但不是一模一样的副本。
涛声依旧-底层原理研究所6 小时前
机器学习
十大经典机器学习算法图解精析以下是机器学习领域中最具代表性的十种经典算法,它们是人工智能与数据分析的基石,广泛应用于预测建模、分类、聚类等任务。每一种算法都配有直观的图示解释和核心原理说明,帮助快速理解其工作方式。
2401_827499998 小时前
人工智能·机器学习·线性回归
机器学习03-线性回归1.理解线性回归是什么? 2.知道一元线性回归和多元线性回归的区别 3.知道线性回归的应用场景假若有了身高和体重数据,来了播仔的身高,你能预测播仔体重吗? 这是一个回归问题,该如何求解呢? 思路:先从已知身高X和体重Y中找规律,再预测 • 数学问题:用一条线来拟合身高和体重之间的关系,再对新数据进行预测 方程 Y = kX + b k160 + b = 56.3 ---- (1) k166 + b = 60.6 ---- (2) …
这张生成的图像能检测吗9 小时前
人工智能·深度学习·算法·机器学习·时序模型
(论文速读)FreDN:基于可学习频率分解的时间序列预测的频谱解纠缠论文题目:FreDN: Spectral Disentanglement for Time Series Forecasting via Learnable Frequency Decomposition(基于可学习频率分解的时间序列预测的频谱解纠缠)
落羽的落羽9 小时前
linux·服务器·网络·c++·人工智能·计算机网络·机器学习
【网络】计算机网络世界的基础概念计算机网络的诞生源于人们“协作”的需求。根据覆盖范围,网络主要分为两类:所谓局域网和广域网,只是一个相对的概念。比如我们有墙,整个国内也可以看做一个局域网。
Black蜡笔小新9 小时前
人工智能·机器学习
企业私有化AI训练推理一体工作站/企业级AI模型工作站DLTM训推一体工作站助力智慧医疗智能化转型医疗行业数据具备高敏感、高隐私、强合规的核心属性,影像资料、患者病历、诊疗记录等核心信息严禁外流。随着智慧医疗建设提速,AI辅助诊断、智能影像筛查、院内智能风控等应用需求持续增长,但传统公有云AI方案因数据传输风险、合规不达标等问题,难以在医院、基层医疗机构全面落地。
love在水一方9 小时前
人工智能·算法·机器学习
【Voxel-SLAM】 体素地图与Bundle Adjustment算法深度分析(四)Voxel-SLAM的核心在于其自适应八叉树体素地图(Adaptive Octree Voxel Map)和基于体素的Bundle Adjustment优化。与传统的KdTree最近邻匹配不同,本系统将地图本身作为优化因子,通过PointCluster充分统计量实现高效的增量更新和边缘化。
AI科技星10 小时前
人工智能·算法·机器学习·数学建模·数据挖掘
从180°旋转定值π、e论证时空宿命与未来可预测性—全域数学视角算法联盟ROOT·乖乖数学研究组(乖乖数学+AI科技星)成文审定:2026年5月1日归属:全域数学·时空本源卷·宿命论分支
handsomestWei10 小时前
机器学习·softmax·ml
Softmax算法使用简介全文链接:Softmax算法使用简介Softmax 函数把任意长度的实数向量(常称 logits)唯一地变换为同一长度的向量:各分量在 (0,1) 上,且和为 1,因而常作为多类分类输出层的归一化概率表示。与 Sigmoid 处理二分类或逐元素“概率”不同,Softmax 在类别之间是互斥、竞争的;实现上多配合 对数似然/交叉熵 作损失。在大语言模型中,同一形式还用于下一词分布与注意力权重;采样温度在推理中调节下一词 Softmax 的尖锐/平坦程度。本文从名称与来源、场景、定义与手算、温度等扩展、LLM
学弟12 小时前
人工智能·深度学习·机器学习
【快捷】通过指定CPU的分配解决A100服务器上多训练任务核心争抢导致的训练速度慢的问题最近,正赶上某一个DDL, 大家都在开足马力使用显卡疯狂跑实验,突然发现原先的实验配置在相同的4090机器上训练速度要慢2~3倍,一次实验的时长来到了9天,这有点难以接收。幸好有小伙伴帮忙搞到了一台4卡的A100资源,可以用。欣喜之余,也遇到了问题:如果我启一个任务,那么训练速度是正常的;如果在两张显卡上起分别起两个训练实验,则这两个训练实验的训练时长都会加倍,显然是两个实验出现了互相影响。也不能这么稀缺的显卡资源,每次只跑一个实验,感觉有种端着金饭碗要饿死的感觉。经过和AI的交流,4090的集群的训练问
PNP Robotics1 天前
人工智能·深度学习·学习·机器学习·机器人
领军军者|PNP机器人包文涛:以具身智能定义机器人的“生命直觉”在2026机器人大讲堂暨leaderrobot年度盛典上,集智联机器人(PNP机器人)创始人包文涛荣膺“中国军事智能行业影响力人物”。这份荣誉,既是对他深耕机器人行业近二十载的认可,更是对PNP机器人在具身智能赛道领跑地位的权威印证。
lkforce1 天前
笔记·机器学习·ai·预训练·minimind·train_pretrain
MiniMind学习笔记(三)--train_pretrain.py(预训练)train_pretrain.py是MiniMind项目中用于预训练的主脚本,负责模型的预训练流程。train_pretrain.py文件整个分了2部分,第一部分是一个函数,
lwf0061641 天前
深度学习·机器学习
DeepFM 学习日记在推荐系统(CTR预测)中,我们需要解决两个核心问题:什么是 Embedding?Embedding 是将高维稀疏特征映射到低维稠密向量的技术。在推荐系统中,它是最关键的第一步。
数据智能老司机1 天前
机器学习
学习 AutoML——理解 AutoML 流水线自动化机器学习(AutoML)的承诺是具有变革性的:以最少人工干预,将原始数据转化为生产就绪的预测模型。然而,在这种优雅简洁的表象背后,隐藏着一套复杂的、相互连接的流程编排;这些流程必须协同工作,才能交付 state-of-the-art 的结果。本章将探索现代 AutoML 流水线的基础架构,考察每个组件如何为机器学习民主化这一总体目标作出贡献。