机器学习

songyuc6 小时前
深度学习·算法·机器学习
【Qwen】DataArguments说明Holds all configuration options for data loading and preprocessing in Qwen-VL fine-tuning. Passed as data_args after parsing from the command line (e.g. via HfArgumentParser) and used by make_supervised_data_module to build the dataset and collator.
2401_841495646 小时前
人工智能·python·机器学习·数据清洗·矩阵分解·特征可视化·模型训练评估
【机器学习】电商销售额预测实战目录一、引言二、整体架构总览三、分模块详细功能说明模块 1:环境配置与可视化基础设置模块 2:数据加载与预处理(核心数据准备)
漂洋过海的鱼儿6 小时前
机器学习
机器学习-K临近算法(1)假设我们要判断一个男生是不是“优质男”,我们根据两个指标来打分(1-10分):事业心和家务能力。我们手里已经有 4 个已知身份的样本:
辰尘_星启7 小时前
线性代数·机器学习·机器人·概率论·控制·现代控制
[最优控制]MPC模型预测控制pid作为一种通用的泛用的控制方案,在某些工况下还是难以满足需求,比如动作模仿、轨迹规划、调速控制等,只要控制目标涉及到运动的动态过程,pid的效果总是差强人意; 因此,需要引入MPC(模型预测控制),直接针对运动过程中的加速度/速度/位置等状态量直接控制,在更大程度上控制运动的动态。
亚里随笔7 小时前
人工智能·深度学习·机器学习·llm·agentic·rlvr
相对优势估计存在偏差——揭示群体相对强化学习中的系统性偏差问题在大型语言模型的后训练时代,强化学习从验证者奖励(RLVR)已成为提升模型推理能力的核心范式。以GRPO为代表的群体相对算法因其无需训练评判网络的简洁设计而备受青睐。然而,本文揭示了这一方法中一个被长期忽视的根本性问题:群体相对优势估计存在系统性偏差。本文不仅提供了首个理论分析,证明该估计器对困难问题会系统性低估优势、对简单问题会过度估计优势,还提出了基于历史感知的自适应难度加权(HA-DW)方案来纠正这一偏差。实验表明,该方法在多个数学推理基准上持续提升性能,为RLVR训练提供了新的理论见解和实践指导。
2501_948120159 小时前
网络·机器学习·php
基于机器学习的网络异常检测与响应技术研究随着互联网技术的普及和数字化转型的发展,网络安全已经成为国家安全和社会稳定的关键因素。网络攻击手段的不断演变和复杂化,使得传统的网络安全防护措施面临巨大挑战。网络异常检测与响应技术作为网络安全防御体系的重要组成部分,其重要性日益凸显。
机器学习之心10 小时前
人工智能·机器学习·回归·stacking集成·kan网络回归预测
Stacking集成传统机器学习模型与新型KAN网络回归预测+五模型回归对比y^meta=fKAN(y^PLS,y^BP,y^SVM,y^Tree) \hat{y}_{\text{meta}} = f_{\text{KAN}}( \hat{y}_{\text{PLS}}, \hat{y}_{\text{BP}}, \hat{y}_{\text{SVM}}, \hat{y}_{\text{Tree}} ) y^meta=fKAN(y^PLS,y^BP,y^SVM,y^Tree)
szcsun510 小时前
人工智能·机器学习·分类
机器学习(三)--分类问题实例1,垃圾邮件检测。任务:判断是否为垃圾邮件输入:邮件输出:是/不是垃圾邮件实例2:图片分类分类:根据已知样本的某些特征,判断一个新样本属于哪个已知的样本类。
汽车仪器仪表相关领域11 小时前
大数据·网络·数据库·人工智能·机器学习·单元测试·可用性测试
一表双显+±1%精度:MTX-D数字油压温度计赛车/改装车发动机监测实战全解在高性能发动机改装、赛事竞技与车辆故障诊断领域,油压与油温是评估发动机健康状态的两大核心参数,直接关系到动力输出、零部件寿命与行车安全。传统机械仪表存在响应滞后、读数误差大、安装繁琐等痛点,难以满足精准监测与实时预警需求。近期,我带领团队完成了68台赛车/改装车的发动机监测系统升级项目,采用INNOVATE MOTORSPORTS MTX-D数字双功能油压和温度计(0-145 PSI),累计服务32家汽车改装厂、15支赛车队与21家汽车维修企业,支撑超5,000台次发动机工况监测、故障诊断与性能优化任务。
玄同76511 小时前
人工智能·python·sql·mysql·机器学习·自然语言处理·database
SQLAlchemy 模型定义完全指南:从基础到进阶的 ORM 实战【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
源于花海13 小时前
人工智能·机器学习·迁移学习·深度神经网络·深度迁移学习
深度迁移学习:深度神经网络的可迁移性Hi,大家好,我是半亩花海。在上节说明了最简单的深度迁移--Finetune(微调)之后,本文主要将介绍迁移学习的深度迁移学习——深度神经网络的可迁移性。本文探讨了深度神经网络的可迁移性,重点分析了不同网络层次的特征迁移能力。研究表明:1)网络前3层主要学习通用特征,迁移效果最佳;2)加入微调(fine-tune)能显著提升迁移性能;3)深度迁移比随机初始化效果更好;4)层次迁移能加速网络优化。实验发现,随着迁移层数增加,性能会下降,但前3层始终具有较好的可迁移性。
砚边数影13 小时前
java·数据库·算法·机器学习·逻辑回归·金仓数据库
逻辑回归实战(二):Java + DL4J 实现模型,评估指标(准确率/召回率)计算——别只看“准确率”,你的业务要的是“抓得准”还是“抓得全”?大家好,我是那个总在模型上线前被风控总监问“能不能把高危用户一个不漏地揪出来?”、又在 KES 表里核对每一条误判样本的老架构。上一期我们把用户流失数据干净利落地存进了电科金仓 KingbaseES(KES),标签定义清晰、时间锚点明确、特征快照隔离。
源于花海13 小时前
人工智能·机器学习·迁移学习·finetune·深度迁移学习
深度迁移学习:最简单的深度迁移——Finetune(微调)Hi,大家好,我是半亩花海。在上节说明了迁移学习的第三类方法:子空间学习之后,本文主要将介绍深度迁移学习——最简单的深度迁移--Finetune(微调)。Finetune利用预训练网络针对新任务进行调整,避免了从头训练网络的高成本。文章阐述了Finetune的必要性:预训练网络具有强大的泛化能力,但需要针对特定任务进行调整。Finetune通过固定网络前层参数、微调后层参数,显著提升训练效率和模型性能。此外,Finetune还可用于特征提取,替代传统手工特征方法。实验证明,基于深度网络的特征提取在图像分类
高锰酸钾_13 小时前
人工智能·决策树·机器学习
机器学习-决策树决策树(Decision Tree)是机器学习中最直观、最易于理解的监督学习算法之一,兼具分类与回归能力。其“树形结构”与人类“if-then”决策逻辑高度一致,使得模型不仅在预测时效率极高,更具备天然的可解释性。从核心思想 → 数学原理 → 算法变种 → 应用场景的路径理解决策树,是掌握树模型(如随机森林、GBDT)乃至整个集成学习理论的基石。
Echo_NGC223714 小时前
人工智能·python·深度学习·安全·机器学习·联邦学习
【联邦学习入门指南】 Part 2:核心挑战与安全机制🛡️ 从“可用”到“可靠”:构建鲁棒的联邦系统 🎯 目标:深入理解联邦学习在实际部署中面临的统计挑战、通信瓶颈以及隐私防御技术 💡 核心:如何在数据非独立同分布 (Non-IID) 和潜在攻击下保持模型的收敛与安全
TGITCIC14 小时前
人工智能·算法·机器学习·rag·ai agent·ai开发·rag增强检索
RAG不是魔法,是工程:从知识库到企业部署的硬核实践大模型热潮席卷技术圈,但真正将其用于企业生产环境的人很快会发现:开箱即用的聊天机器人远不能满足业务需求。模型会胡说八道,回答不了昨天刚发布的新政策,更不敢把客户合同上传到公有云API。这时候,RAG(检索增强生成)成了多数团队的第一选择。然而,很多项目在“跑通Demo”后便陷入泥潭——召回率低、答案不准、维护成本高、用户反馈差。问题出在哪?不在于RAG理论本身,而在于工程实现的粗糙。RAG看似简单:用户提问,系统检索相关文档,再让大模型生成答案。但每个环节都藏着陷阱:PDF解析丢失表格结构、文本切分截断关
Clarice__14 小时前
windows·python·机器学习·conda·visual studio code
Anaconda安装、使用教程系统: Windows 8.1+ 处理器:进5年产品均可 内存: 8GB+ 硬盘: 10GB+双击安装包,开始安装。
钮钴禄·爱因斯晨15 小时前
人工智能·算法·机器学习
机器学习(三):聚焦KNN算法距离度量、特征预处理与超参数选择直观的距离度量方法,两个点在空间中的距离一般都是指欧式距离。欧氏距离=对应维度差值平方和,开平方根也称城市街区距离,曼哈顿城市特点:横平竖直
CDA数据分析师干货分享15 小时前
算法·机器学习·数据挖掘·数据分析·kmeans·cda证书
【CDA干货】客户分群建模——RFM+K-Means用户画像——电商用户数据分析全流程:从数据到增长决策运用机器学习技术,基于电商用户的行为及交易数据开展客户分群研究。其核心目标在于识别出差异化的客户群体,为企业制定精准营销、产品推荐及客户留存策略提供决策依据。
Cathy Bryant15 小时前
笔记·神经网络·机器学习·概率论·信息与通信
softmax函数与logitssoftmax 函数有一种独特的优雅:softmax ( z i ) = e z i ∑ j e z j \text{softmax}(z_i) = \frac{e^{z_i}}{\sum_j e^{z_j}} softmax(zi)=∑jezjezi