机器学习

code_pgf21 分钟前
人工智能·深度学习·机器学习
知识蒸馏在 sVLM 中的作用及实现方式Small Vision-Language Model / 小型视觉语言模型,通常由 视觉编码器 + 多模态 projector / adapter + 小型 LLM 组成。LLaVA 类模型证明了“视觉编码器接入 LLM + 视觉指令数据”可以形成通用多模态助手;MobileVLM 则进一步面向移动端,用 CLIP 风格视觉模型、轻量 projector 和 1.4B / 2.7B 级语言模型实现端侧 VLM。([arXiv][1])
平行侠1 小时前
算法·决策树·机器学习
A19 工业设备故障决策树智能诊断系统本项目源自《计算机程序设计艺术》(TAOCP)算法库的知识的系统化工程落地。二叉树作为计算机科学最基础的数据结构之一,其系统化的遍历方法(前序、中序、后序)奠定了树处理的基础。1960年Perlis和Thornton发明了线索二叉树,利用空指针存储前驱/后继线索,使遍历无需递归或栈空间,对内存极度受限的嵌入式系统意义重大。
狮子座明仔2 小时前
人工智能·深度学习·机器学习·交互
AggAgent:把并行轨迹当环境来交互,智能体聚合的新范式你有没有遇到过这种情况——让一个Agent做深度研究,跑了8次,8条轨迹里其实藏着正确答案,但你怎么把它们"拼"出来?Majority Voting?要是多答案任务,投票直接废了。Best-of-N?模型自己标的confidence在长文本生成任务上根本不准。把8条轨迹全塞进context窗口?每条动辄十万token,8条拼一起直接OOM。
心疼你的一切2 小时前
人工智能·pytorch·深度学习·神经网络·机器学习
PyTorch实战:手写数字识别神经网络人工智能正在深刻改变我们的世界,而神经网络作为AI领域的核心技术之一,其重要性不言而喻。从图像识别到自然语言处理,从语音识别到自动驾驶,神经网络无处不在。本文将深入浅出地介绍神经网络的基础原理,并通过PyTorch框架进行实践演示,帮助读者快速上手神经网络开发。
code bean4 小时前
人工智能·机器学习·langchain
【Langchain】 ChatPromptTemplate:从“手动拼字符串“到“专业模板“的进化之路一句话总结:ChatPromptTemplate 是 LangChain 中专门用来组装聊天消息的"模板引擎",它能让你像填空题一样,把变量插进预设的对话结构里,告别手动拼接字符串的混乱时代。
fl1768315 小时前
人工智能·yolo·机器学习
智慧医疗胆囊病理识异常胆管狭窄检测数据集VOC+YOLO格式1210张3类别数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
Captain_Data5 小时前
python·机器学习·数据分析·scikit-learn·风控建模
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)在银行、消费金融、互联网信贷等领域,信用风险评分模型(Credit Scoring Model)是核心业务模型之一。它决定了一个用户是否能拿到贷款、能拿多少、利率是多少。
AI科技星5 小时前
人工智能·线性代数·机器学习·量子计算·agi
数理原本·卷六:观测者本源作者:乖乖数学,AI科技星(算法联盟)单位:全域数学基础理论研究院成文日期:2026 年 5 月 21 日
deepdata_cn6 小时前
机器学习·标注样本
少样本学习(Few-shot Learning)Few-shot Learning(少样本学习)是机器学习、深度学习领域的分支任务,指模型在仅拥有少量标注样本的前提下,快速学习任务规律、完成对应识别、生成、分类等任务的学习方式。标注样本指已经人工打好标签、明确标准答案的数据,比如标注好“正面/负面”的评论、标注好品类的图片。少样本学习的核心目标就是模仿人类举一反三的学习能力,不需要海量重复数据,看几个例子就能明白规则。 传统深度学习依赖成千上万条海量标注数据反复迭代训练模型,数据采集、人工标注成本高,且训练周期漫长;而少样本学习依托模型预训练阶段积累的
好好学仿真6 小时前
机器学习·信号处理·迁移学习·swintransformer·轴承故障诊断·深度可分离卷积·gam注意力
【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)在工业旋转机械中,滚动轴承是最关键、也最容易发生故障的部件之一。然而,变工况、故障样本稀缺、跨域泛化能力差三大难题,长期制约着故障诊断模型的落地效果。
沪漂阿龙7 小时前
人工智能·机器学习
AI大模型面试题:数据处理与特征工程详解——特征工程、缺失值、标准化、归一化、特征选择、数据不平衡、数据泄漏一次讲透机器学习面试高频题|算法面试|AI面试|数据预处理|特征工程实战很多人一听到“数据处理与特征工程”就开始背术语:缺失值、标准化、独热编码、PCA。但真正面试里,面试官想听的不是你会不会背名词,而是你能不能把“为什么做、什么时候做、怎么做、做错会怎样”讲清楚。
MediaTea7 小时前
人工智能·机器学习
人工智能通识课:机器学习之强化学习并不是所有机器学习问题都能通过“给定输入,再预测输出”的方式来解决。在很多真实场景中,智能体(Agent)并不是一次性看完全部数据后直接作出结论,而是要在环境中不断行动、不断观察结果,并根据结果调整后续策略。
曦月逸霜15 小时前
人工智能·python·机器学习
啥是RAG 它能干什么?RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索与大语言模型生成能力的技术。与传统模型相比,RAG能够从外部知识库中检索相关信息,再基于这些信息生成更准确、更可靠的回答。
CSND74016 小时前
深度学习·yolo·机器学习
YOLO resume断点续训(不能用官方的权重,是自己训练一半生成的last.pt)训练 YOLO 模型(v5/v8/v11)常需数百 epoch,耗时数天。断电、SSH 断开、显存溢出、进程误杀等意外极易导致训练中断,从头开始会浪费大量算力与时间。
AI医影跨模态组学17 小时前
人工智能·机器学习·论文·医学·医学影像·影像组学
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证01文献学习今天分享的文献是由美国Cedars-Sinai医学中心、Valar Labs、加拿大玛格丽特公主癌症中心等国际多机构团队于2026年2月在肿瘤学领域顶刊《Journal of Clinical Oncology》(中科院1区top,IF=43.4)上发表的研究“Development and Validation of a Computational Histology Artificial Intelligence-Powered Predictive Biomarker for Selec
温九味闻醉17 小时前
人工智能·机器学习
关于腾讯广告算法大赛2025项目分析3-重读main中初始化赋值 8. 初始化所有参数 - user_emb,item_emb:全零化处理 - 其他:xavier_normal 9. 所有emb权重 padding 位置(第0行)清零
AI医影跨模态组学21 小时前
人工智能·机器学习·论文·医学·医学影像·影像组学
Cancer Letters(IF=10.1)中山大学附属第六医院等团队:基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降01文献学习今天分享的文献是由中山大学附属第六医院联合中山大学肿瘤防治中心、四川大学华西医院等团队于2025年9月在《Cancer Letters》(中科院1区top,IF=10.1)上发表的研究“RCMIX model based on pre-treatment MRI imaging predicts T-downstage in MRI-cT4 stage rectal cancer”即基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降,该研究基于多中心回顾性数据,构建并
染指11101 天前
人工智能·算法·机器学习
3.AI大模型-token是什么-大模型底层运行机制内容参考于:图灵AI大模型全栈Token是大模型通用的货币,这个货币是个什么东西?如下图某大模型的Token的收费
南宫萧幕1 天前
开发语言·人工智能·python·算法·机器学习·控制
基于 Simulink 与 Python 联合仿真的 eVTOL 强化学习全链路实战将混合动力汽车(HEV)的能量管理策略延伸到混合动力飞行汽车(Hybrid eVTOL 或 Flying Car),是一个极具前瞻性且挑战性倍增的研究方向。
哥布林学者1 天前
机器学习·ai
深度学习进阶(二十二)T5:NLP任务的首次大一统上一篇我们完整展开了 Transformer-XL 的四项重构式 RPE,它通过把内容和位置分开建模,让位置信息真正参与到了注意力计算中。 但看完那个复杂的公式后,有这样一个问题: