机器学习

Mr数据杨1 小时前
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
结构化表格分类建模与业务预测落地路径在Kaggle竞赛生态中,以“Test Competition Please Ignore”为代表的测试性竞赛,虽不指向激烈的排名竞争,却为入门者提供了一个清晰、标准的表格数据分类实践框架。其围绕准确率评估指标展开,本质是要求参赛者掌握从结构化数据理解到模型训练与评估的完整建模流程,这一过程正是将业务问题转化为数据问题并交付可量化解决方案的核心技能。
生信研究猿1 小时前
机器学习·数据挖掘·聚类
#P4475.第2题-终端款型聚类识别第2题-终端款型聚类识别 - problem_ide - CodeFun2000
FluxMelodySun1 小时前
人工智能·机器学习
机器学习(三十四) 概率图模型-马尔可夫随机场与条件随机场马尔可夫随机场 (Markov Random Field,简称MRF) 是典型的马尔可夫网,是一种著名的无向图模型 (每个结点表示一个或一组变量,结点之间的边表示变量之间的相关性)。若其中任意两个结点之间都有边连接,则称此结点子集为一个"团"(clique)。若在一个团中加入任何另外一个结点都不再形成团,则称该团为"极大团"(maximal clique) <不可再发展的团>。
L-影2 小时前
人工智能·机器学习·支持向量机
下篇:核函数、软间隔和它的“江湖地位”——SVM的三种形态上篇说了,SVM的核心是找一个最大间隔的超平面。但现实里数据哪有那么乖,让你一刀切得干干净净?所以SVM发展出了三种类型,分别应对不同的场景。
reset20212 小时前
人工智能·机器学习·支持向量机
支持向量机(SVM)原理与应用支持向量机(SVM)作为机器学习领域的经典算法,自20世纪60年代由维克托·瓦普尼克(Victor Vapnik)和亚历山大·切尔文科伊(Alexander Chervonenkis)提出以来,经历了从线性分类到非线性分类、从二分类到多分类、从监督学习到半监督学习的多次重要演进。1992年引入核技巧,1995年提出软边距SVM后,该算法在手写识别、文本分类、生物信息学等领域展现出卓越性能,成为高维数据分类任务的首选方法。SVM的核心优势在于其通过寻找最大间隔超平面实现数据分类,同时引入正则化项优化结构风险
Mr数据杨2 小时前
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
Unlearnable CIFAR 10 图像分类实战 从异常训练数据到鲁棒建模这道 Kaggle 赛题表面是 CIFAR-10 十分类,实际核心并不在常规视觉识别,而在训练数据已被“不可学习化”处理后,模型为何会出现泛化失效。文章重点放在任务拆解、数据特征理解、鲁棒训练思路与可复现实验流程,适合作为机器学习安全与图像分类结合场景的实践案例。
Mr数据杨2 小时前
机器学习·分类·数据挖掘·数据分析·自动化·kaggle
短文本意图分类助力智能客服自动化服务在智能客服、任务型对话机器人等实际业务场景中,准确理解用户的短文本意图是实现自动化服务的第一步。OCRV Test Task竞赛以经典的文本意图分类为题,为自学者提供了一个绝佳的实战沙盒,能够系统性地实践从原始数据到可评估模型的完整自然语言处理流程。本文将围绕该竞赛,深入剖析其任务定义、数据特性、多元解题思路及具体操作案例,构建一条清晰的学习与应用路径。
Mr数据杨3 小时前
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
医学影像分类实战复盘 从课程赛题到可落地建模流程这道 Kaggle 课程赛虽然页面信息很少,但任务边界很清晰,核心是围绕医学影像完成分类建模,并用分类准确率检验结果。这样的题目很适合用来训练完整的视觉项目思路,因为真正的难点不在提交一次预测文件,而在于把数据理解、标签核对、验证设计和模型迭代串成一条可复现流程。
PoplarLittle4 小时前
机器学习
机器学习学习笔记-鸢尾花案例在多个项目间切换时,不同的依赖版本很容易引发冲突,Conda可以为每一个项目单独创建一个环境,这个环境不受系统环境和Conda创建的其他环境的干扰。
QYR-分析4 小时前
人工智能·机器学习·自动驾驶
重型自动驾驶地面车辆行业洞察:分类、格局与市场机遇重型自动驾驶地面车辆(Heavy-Duty Autonomous Ground Vehicles),核心是载重5吨及以上、集成环境感知、路径规划与自动控制的无人化作业平台,广泛应用于矿山、工程施工、军用后勤及工业运输等高强度场景。这类车辆融合激光雷达、毫米波雷达、视觉感知与高精度定位技术,依托车规级控制系统实现复杂环境下自主运行,能在高负荷、长周期工况中保持稳定,核心价值在于提升作业安全、降低人力成本、实现全天候连续运营,是工业自动化向重载领域延伸的核心方向。当前,激光雷达等核心部件国产化加速,禾赛科技以
惊鸿一博4 小时前
人工智能·机器学习·自动驾驶
自动驾驶与大模型相关VLA4ADVLA4ADVLA4AD 是“Vision-Language-Action for Autonomous Driving”(视觉-语言-行动自动驾驶)的缩写,它代表一种将大模型应用于自动驾驶的新范式:让车辆不仅能“看懂”路况,还能“听懂”语言指令,并直接做出驾驶动作。它由清华大学、麦吉尔大学、威斯康星大学等团队在 2025 年提出,被视为自动驾驶与多模态大模型结合的前沿方向。
X journey5 小时前
人工智能·算法·机器学习
机器学习实践(18.5):特征工程补充在第十八篇里,我们主要从实战角度讲了特征工程:如果只从项目经验看,这些都已经很有说服力了。 但如果你想再往深一点问,就会碰到一个非常关键的问题:
日光明媚5 小时前
人工智能·机器学习·计算机视觉·ai作画·stable diffusion·aigc
DMD 一步扩散核心原理:从符号定义到梯度推导本文严格基于 MIT/Adobe 的《One-step Diffusion with Distribution Matching Distillation》原论文,专门补全所有你在看论文时会卡住的基础数学细节:从最基础的概率密度、梯度、期望,到分数函数的线性等价性、KL 散度的梯度推导,再到雅可比矩阵的作用。所有推导不跳步,所有符号都有明确解释,帮你彻底打通 DMD 的数学逻辑。
Mr数据杨5 小时前
学习·机器学习·分类·数据挖掘·数据分析·kaggle
不可学习 ImageNet 二分类实战 从图像识别到训练数据投毒防御Unlearnable ImageNet 不是常规的二分类刷榜题,表面任务是区分两类图像,真正难点在于训练集已被不可学习扰动处理,模型很容易出现训练正常、泛化失效的情况。文章重点不放在网络堆叠,而放在如何理解受污染数据、建立可靠验证闭环,并验证防御策略是否真正有效。
湘美书院--湘美谈教育6 小时前
大数据·人工智能·深度学习·神经网络·机器学习
湘美书院人工智能启示录:AI会是人类的造梦师吗?当AI能作画、能写歌、能编故事,甚至能描摹出人类连自己都说不清的模糊情绪,它会不会成为新的造梦师,替人类造出从未有过的绚烂梦境?
迷藏4946 小时前
java·开发语言·python·机器学习
# 发散创新:基于Python的自动特征工程实战与深度优化在机器学习在机器学习项目中,特征工程往往占据了80%以上的工作量。传统手动构造特征不仅效率低下,还容易因主观判断导致模型性能受限。本文将深入探讨如何利用Python生态实现自动特征工程(Auto Feature Engineering),并通过真实数据集演示从原始特征到高价值衍生特征的完整流程。
Forrit6 小时前
人工智能·机器学习
注意力计算为什么要除以根号dK首先要知道,QKV的初始化方式为均值为0,方差为1的随机初始化均值非零的负面影响 当数据分布均值不为零时,例如全为正数,每一层的输出会逐渐向上偏移。这种偏移在深层网络中不断累积,最终导致数值爆炸。对称分布的数据能让信号落在激活函数最敏感的区域内,通常以零为中心的区域对ReLU、Softmax等函数最为敏感,有利于梯度传播和学习效率。
Mr数据杨6 小时前
机器学习·数据分析·kaggle
医学影像分类模型构建与辅助诊断落地在Kaggle社区中,存在一类以教育与技能形成为核心目标的竞赛,其价值不在于激烈的排名角逐,而在于提供一个结构清晰、目标明确的微型项目框架。“Machine Learning with ANN using scikit-learn”正是此类典范。该竞赛聚焦于使用scikit-learn库构建人工神经网络,完成一个医学影像分类任务。尽管其数据规模精简,但“分类准确率”这一明确的评估指标与“计算机视觉/医学影像”的领域标签,共同定义了一个典型的多标签分类问题原型,为初学者掌握从数据到部署的完整建模流程提供了绝
輕華8 小时前
人工智能·机器学习·lstm
LSTM实战(上篇):微博情感分析——词表构建与数据集加载本文是上篇《LSTM实战:遗忘门、输入门与输出门解决长期依赖》的续篇。上篇深入解析了 LSTM 三大门的理论机制,本文进入实战阶段:以微博四分类情感分析项目为例,从零搭建一套完整的 NLP 数据预处理流水线。
郝学胜-神的一滴15 小时前
人工智能·pytorch·python·深度学习·神经网络·机器学习
深度学习必学:PyTorch 神经网络参数初始化全攻略(原理 + 代码 + 选择指南)在深度学习模型训练中,参数初始化是决定模型能否收敛、训练效率高低、效果优劣的底层关键步骤。它看似只是给权重赋一个初始值,却直接影响梯度传播、模型对称性与最终性能。