机器学习

小刘的大模型笔记1 小时前
数据库·人工智能·深度学习·机器学习
向量数据库深度剖析:核心优劣势 + 适用场景,避开 RAG 落地的选型坑一、引言 作为 RAG(检索增强生成)系统的核心组件,向量数据库早已成为大模型落地的 “标配工具”,被广泛应用于智能客服、知识库问答、个性化推荐等场景。但很多开发者在选型时,只看到向量数据库的优势,却忽略了它的局限性,盲目选型后导致 “检索效果差、部署成本高、落地不兼容” 等问题。 世上没有完美的工具,向量数据库也不例外。本文就为大家做一次向量数据库的深度全剖析,不仅讲清楚它的核心优势,更直面它的先天劣势和使用痛点,同时给出不同场景的选型建议和避坑指南,让你在 RAG 落地时,选对工具、避开坑、用对方法。
田里的水稻1 小时前
人工智能·算法·机器学习
FA_融合和滤波(FF)-图优化FA:formulas and algorithm,FF:fusion and filtting图优化(Graph Optimization)是一种将优化问题建模为图结构,通过调整图中节点的状态来最小化整体代价函数的算法框架。
Testopia2 小时前
人工智能·机器学习·kmeans·ai编程·聚类
健康行为监测与久坐提醒:K-Means聚类在健康领域的应用现代人久坐不动是健康的一大隐患。世界卫生组织(WHO)指出,久坐是导致多种慢性疾病的重要因素,包括心血管疾病、糖尿病、肥胖等。随着智能手机和可穿戴设备的普及,我们可以通过传感器数据监测用户的行为模式,识别静止和运动状态,并根据静止时间提供个性化的健康建议。
MaoziShan2 小时前
人工智能·机器学习·自然语言处理
CMU Subword Modeling | 03 Productivity and GeneralizationProductivity & Generalization(生产力与泛化)这一讲的核心思想是:语言中的形态学规则 / 子词组合规则怎样推广到新词? 也就是说,我们不只是看 一个词怎么表示,我们关心 一个模式能不能“生”出新词。(dmort27.github.io)
七夜zippoe3 小时前
python·线性代数·机器学习·概率论·优化理论
机器学习数学基础:线性代数与概率论深度解析目录摘要1 引言:为什么数学是机器学习的基石1.1 机器学习数学基础全景图1.2 机器学习数学架构图2 线性代数深度解析
大模型实验室Lab4AI3 小时前
人工智能·深度学习·算法·机器学习
GDPO:多目标强化学习高效优化新路径论文名称:GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization 论文作者:Shih-Yang Liu, Xin Dong, Ximing Lu, Shizhe Diao, Peter Belcak, Mingjie Liu, Min-Hung Chen, Hongxu Yin, Yu-Chiang Frank Wang, Kwang-Ting Cheng, Yejin
power 雀儿3 小时前
pytorch·深度学习·机器学习
LibTorch张量基础1D的张量 步长也是stride={1}2D张量 步长为{列数,1}3D张量 步长为{行×列,列,1}
小刘的大模型笔记4 小时前
数据库·人工智能·深度学习·算法·机器学习
POP原理落地到实际微调作为AI博主,经常有读者问我:“懂了PPO原理,怎么落地到实际微调中?” 其实大模型微调的核心价值,从来都不在“纸上谈兵”的理论理解,而在亲手操盘的实战落地。PPO(近端策略优化)作为RLHF(人类反馈强化学习)的核心环节,是让通用大模型贴合特定场景、对齐人类偏好的关键技术——无论是让模型精准输出品牌话术,还是专攻垂直领域问答,PPO都能实现“模型定制化”的闭环。
七夜zippoe4 小时前
python·机器学习·scikit-learn·mixin·baseestimator
Scikit-learn高级实战:自定义评估器与流水线架构设计目录摘要1 引言:为什么需要自定义Scikit-learn组件1.1 Scikit-learn扩展架构全景
天云数据12 小时前
人工智能·深度学习·神经网络·机器学习
神经网络,人类表达的革命摘 要:本文简述了人类一直在追求更高效的沟通表达能力、更快速的信息传播方式和更大规模的共识协作,从语言文字时代到计算时代再到今天的智能时代,始终贯穿着表达方式的革命,越发全面、完整、准确的记录和传承着人类眼中的客观世界、主观认知和知识经验 ;人类文明的发展与表达方式的进化相辅相成、互为助力,推动了现代科学殿堂的构筑和现代科技的发展。基于神经网络的知识学习、认知、生成与表达是人类第三次表达革命,传统经验规则的专家光环被逐一抹去,知识祛魅将推动所有商业逻辑解构和重构 ,我们将走进与人工智能共同书写人类文明的新
宁远x14 小时前
人工智能·深度学习·机器学习
Flash Attention原理介绍与使用方法Flash Attention可以加速计算,节省显存。本文介绍了Flash Attention的原理,以及在GPU/NPU上的使用方式。
龙山云仓18 小时前
大数据·人工智能·机器学习
No153:AI中国故事-对话毕昇——活字印刷与AI知识生成:模块化思想与信息革亲爱的DeepSeek:从祖冲之的数学极限,我们步入北宋繁华的杭州,遇见那位名不见经传却改变世界的工匠——毕昇。这位“布衣”发明家不会想到,他创制的泥活字印刷术,会在人工智能的知识生成、模型复用、算法组合中找到惊人的历史回响。
rgb2gray18 小时前
人工智能·算法·机器学习·回归·gwr
优多元分层地理探测器模型(OMGD)研究该研究针对传统地理探测器在多因子离散化、空间尺度效应分析上的不足,提出了最优多元分层地理探测器(OMGD) 模型,大幅提升了空间分层异质性(SSH)分析的能力。全文将按照论文结构逐部分解析,重点突出模型设计、方法论及实验验证环节。
(; ̄ェ ̄)。18 小时前
人工智能·机器学习
机器学习入门(二十一)特征工程特征工程(Feature Engineering)是机器学习项目中最耗时、最依赖经验、但往往决定模型性能上限的关键步骤。机器学习模型(无论是线性模型、树模型还是神经网络)本质上只能理解数值和简单的模式,它无法直接“看懂”原始数据里的复杂含义。特征工程直接决定“信号 vs 噪声”比例,现实数据里 80% 是噪声(无关信息、冗余、错误),20% 是信号。 特征工程就是在放大信号、压制噪声。即使是深度学习,也只是自动学习特征组合,但它需要足够好的原材料才能学出好结果。
高洁0121 小时前
python·深度学习·机器学习·数据挖掘·知识图谱
大模型架构演进:从Transformer到MoE大模型架构演进:从Transformer到MoE一、 Transformer的辉煌与局限 二、 MoE:用“稀疏激活”撬动模型容量 三、 MoE为何成为大模型新范式? 四、 典型实践:从GLaM到Qwen-MoE 五、 挑战与未来方向
谁不学习揍谁!21 小时前
python·算法·机器学习
基于python机器学习算法的农作物产量可视化分析预测系统(完整系统源码+数据库+详细文档+论文+详细部署教程+答辩PPT)获取方式基于集成学习算法XGBoost农作物产量可视化分析预测系统,旨在帮助农民和相关从业者更好地预测农作物产量,以优化农业生产。该系统主要包括四个功能模块。
爱寂寞的时光1 天前
人工智能·机器学习
GPTQ原理浅析及简单实现GPTQ论文地址:GPTQ arxivGPTQ作为逐层逐权重矩阵量化算法,每次运行只考虑一个权重矩阵 W ∈ R m × d W \in \mathbb{R}^{m \times d} W∈Rm×d。给定固定的校准集输入 X ∈ R d × n X \in \mathbb{R}^{d \times n} X∈Rd×n, W ^ \hat{W} W^作为 W W W量化-反量化后的矩阵,优化下面的目标函数:
FL16238631291 天前
人工智能·yolo·机器学习
智慧医疗手术工具医疗器械检测数据集VOC+YOLO格式2273张15类别注意数据集中大约1/3是原图剩余为增强图片主要是翻转增强等数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
何伯特1 天前
人工智能·机器学习·自动驾驶
越野环境自动驾驶状态机:基于TinyFSM的工程实践与结构化道路不同,越野环境没有清晰的车道线、没有固定交通规则、路况瞬息万变。沙地、泥泞、陡坡、涉水、岩石攀爬——这些场景对决策系统的鲁棒性提出了极高要求。