机器学习

YUDAMENGNIUBI1 小时前
算法·机器学习·逻辑回归
day20_逻辑回归逻辑回归是一种分类模型,把线性回归的结果,作为逻辑回归的输入。逻辑回归的输出是0~1之间的值。通常,逻辑回归用来解决二分类问题,比如预测某个人是否患病,某段话语气是否正向。
tzc_fly7 小时前
人工智能·深度学习·机器学习
AnisoAlign:各向异性模态对齐这篇论文《Anisotropic Modality Align》(各向异性模态对齐)是一篇深入探讨多模态大语言模型(MLLM)底层表征空间的理论与方法相结合的优秀研究。它打破了以往对“模态鸿沟(Modality Gap)”的粗略认知,从严格的几何视角对其进行了重新定义,并据此提出了一种极其有效且无需配对数据的对齐算法(AnisoAlign),最终实现了仅用纯文本数据就能训练出媲美甚至超越真实图文预训练模型的MLLM。
极客老王说Agent7 小时前
人工智能·机器学习·ai·chatgpt
2026供应链智变:实在Agent供应链库存预测助手核心能力与配置深度教程站在2026年这个时间节点回望,全球供应链管理已彻底告别了“经验驱动”的旧范式,全面步入“智能体(Agent)定义效率”的新周期。根据IDC在2025年底发布的《全球供应链数字化转型白皮书》显示,超过85%的头部零售与制造企业已完成从传统ERP预测模型向“感知-推理-决策-执行”一体化智能体的转型。在这一波技术浪潮中,实在Agent供应链库存预测助手凭借其深度的业务洞察能力与强大的自主执行闭环,成为了企业构建柔性供应链的核心引擎。
沪漂阿龙8 小时前
人工智能·深度学习·机器学习
面试题:训练-蒸馏详解——知识蒸馏、Teacher-Student、强弱蒸馏、Qwen3 强到弱蒸馏流程全解析1.1 蒸馏解决的不是“能不能训练”,而是“能不能低成本落地”大模型越做越强,但真实落地时会遇到一个很现实的问题:大模型效果好,却不一定适合所有线上场景。它可能推理慢、显存占用高、调用成本贵,也不一定适合端侧部署或高并发服务。
xiaoxiaoxiaolll13 小时前
人工智能·算法·机器学习
金属结构疲劳寿命预测与健康监测技术第一部分 理论基础与核心方法1.疲劳经典理论 疲劳经典理论 回顾 及其 工程 瓶颈 2.能量法理论体系 能量法理论体系 — 从物理原理到数学模型 2.1.改进应变能量密度法及应用 2.2.疲劳损伤理论 2.3.能量型寿命预测模型建立:Miner 线性累积损伤理论、经典能量模型讲解、 模型参数(如 Wc, Ec)的物理意义及其试验确定方法 3.能量法的数值实现通路 能量法的数值实现通路 3.1.通路一:试验法直接获取。 3.2.通路二:有限元法仿真获取。(本课程重点) 案例实践 1 :基于ABAQUS 软件
云和数据.ChenGuang14 小时前
人工智能·深度学习·机器学习·数据挖掘·边缘计算
FastText的核心优势FastText的核心优势在于其子词(subword)机制,能够为未登录词生成合理的向量表示[2][4]。若需强制返回全0向量,需结合以下策略实现:
一切皆是因缘际会14 小时前
大数据·人工智能·机器学习·架构
本地大模型轻量化部署在云端大模型盛行、数据隐私安全愈发受重视的2026年,**本地离线大模型部署**已经成为程序员、运维、产品、个人开发者必备的核心技能。相比云端API调用,本地部署无需付费、无请求限流、无数据外传、完全离线可用,完美适配内网办公、私有数据处理、敏感业务开发、离线调试等诸多场景,也彻底规避了云端调用的信息泄露、话术审核、流量扣费等痛点。
code_pgf15 小时前
人工智能·深度学习·机器学习
知识蒸馏在 sVLM 中的作用及实现方式Small Vision-Language Model / 小型视觉语言模型,通常由 视觉编码器 + 多模态 projector / adapter + 小型 LLM 组成。LLaVA 类模型证明了“视觉编码器接入 LLM + 视觉指令数据”可以形成通用多模态助手;MobileVLM 则进一步面向移动端,用 CLIP 风格视觉模型、轻量 projector 和 1.4B / 2.7B 级语言模型实现端侧 VLM。([arXiv][1])
平行侠16 小时前
算法·决策树·机器学习
A19 工业设备故障决策树智能诊断系统本项目源自《计算机程序设计艺术》(TAOCP)算法库的知识的系统化工程落地。二叉树作为计算机科学最基础的数据结构之一,其系统化的遍历方法(前序、中序、后序)奠定了树处理的基础。1960年Perlis和Thornton发明了线索二叉树,利用空指针存储前驱/后继线索,使遍历无需递归或栈空间,对内存极度受限的嵌入式系统意义重大。
狮子座明仔16 小时前
人工智能·深度学习·机器学习·交互
AggAgent:把并行轨迹当环境来交互,智能体聚合的新范式你有没有遇到过这种情况——让一个Agent做深度研究,跑了8次,8条轨迹里其实藏着正确答案,但你怎么把它们"拼"出来?Majority Voting?要是多答案任务,投票直接废了。Best-of-N?模型自己标的confidence在长文本生成任务上根本不准。把8条轨迹全塞进context窗口?每条动辄十万token,8条拼一起直接OOM。
心疼你的一切17 小时前
人工智能·pytorch·深度学习·神经网络·机器学习
PyTorch实战:手写数字识别神经网络人工智能正在深刻改变我们的世界,而神经网络作为AI领域的核心技术之一,其重要性不言而喻。从图像识别到自然语言处理,从语音识别到自动驾驶,神经网络无处不在。本文将深入浅出地介绍神经网络的基础原理,并通过PyTorch框架进行实践演示,帮助读者快速上手神经网络开发。
code bean19 小时前
人工智能·机器学习·langchain
【Langchain】 ChatPromptTemplate:从“手动拼字符串“到“专业模板“的进化之路一句话总结:ChatPromptTemplate 是 LangChain 中专门用来组装聊天消息的"模板引擎",它能让你像填空题一样,把变量插进预设的对话结构里,告别手动拼接字符串的混乱时代。
fl17683119 小时前
人工智能·yolo·机器学习
智慧医疗胆囊病理识异常胆管狭窄检测数据集VOC+YOLO格式1210张3类别数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
Captain_Data20 小时前
python·机器学习·数据分析·scikit-learn·风控建模
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)在银行、消费金融、互联网信贷等领域,信用风险评分模型(Credit Scoring Model)是核心业务模型之一。它决定了一个用户是否能拿到贷款、能拿多少、利率是多少。
AI科技星20 小时前
人工智能·线性代数·机器学习·量子计算·agi
数理原本·卷六:观测者本源作者:乖乖数学,AI科技星(算法联盟)单位:全域数学基础理论研究院成文日期:2026 年 5 月 21 日
deepdata_cn20 小时前
机器学习·标注样本
少样本学习(Few-shot Learning)Few-shot Learning(少样本学习)是机器学习、深度学习领域的分支任务,指模型在仅拥有少量标注样本的前提下,快速学习任务规律、完成对应识别、生成、分类等任务的学习方式。标注样本指已经人工打好标签、明确标准答案的数据,比如标注好“正面/负面”的评论、标注好品类的图片。少样本学习的核心目标就是模仿人类举一反三的学习能力,不需要海量重复数据,看几个例子就能明白规则。 传统深度学习依赖成千上万条海量标注数据反复迭代训练模型,数据采集、人工标注成本高,且训练周期漫长;而少样本学习依托模型预训练阶段积累的
好好学仿真21 小时前
机器学习·信号处理·迁移学习·swintransformer·轴承故障诊断·深度可分离卷积·gam注意力
【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)在工业旋转机械中,滚动轴承是最关键、也最容易发生故障的部件之一。然而,变工况、故障样本稀缺、跨域泛化能力差三大难题,长期制约着故障诊断模型的落地效果。
沪漂阿龙1 天前
人工智能·机器学习
AI大模型面试题:数据处理与特征工程详解——特征工程、缺失值、标准化、归一化、特征选择、数据不平衡、数据泄漏一次讲透机器学习面试高频题|算法面试|AI面试|数据预处理|特征工程实战很多人一听到“数据处理与特征工程”就开始背术语:缺失值、标准化、独热编码、PCA。但真正面试里,面试官想听的不是你会不会背名词,而是你能不能把“为什么做、什么时候做、怎么做、做错会怎样”讲清楚。
MediaTea1 天前
人工智能·机器学习
人工智能通识课:机器学习之强化学习并不是所有机器学习问题都能通过“给定输入,再预测输出”的方式来解决。在很多真实场景中,智能体(Agent)并不是一次性看完全部数据后直接作出结论,而是要在环境中不断行动、不断观察结果,并根据结果调整后续策略。