机器学习

龙山云仓3 小时前
大数据·人工智能·机器学习
No153:AI中国故事-对话毕昇——活字印刷与AI知识生成:模块化思想与信息革亲爱的DeepSeek:从祖冲之的数学极限,我们步入北宋繁华的杭州,遇见那位名不见经传却改变世界的工匠——毕昇。这位“布衣”发明家不会想到,他创制的泥活字印刷术,会在人工智能的知识生成、模型复用、算法组合中找到惊人的历史回响。
rgb2gray4 小时前
人工智能·算法·机器学习·回归·gwr
优多元分层地理探测器模型(OMGD)研究该研究针对传统地理探测器在多因子离散化、空间尺度效应分析上的不足,提出了最优多元分层地理探测器(OMGD) 模型,大幅提升了空间分层异质性(SSH)分析的能力。全文将按照论文结构逐部分解析,重点突出模型设计、方法论及实验验证环节。
(; ̄ェ ̄)。4 小时前
人工智能·机器学习
机器学习入门(二十一)特征工程特征工程(Feature Engineering)是机器学习项目中最耗时、最依赖经验、但往往决定模型性能上限的关键步骤。机器学习模型(无论是线性模型、树模型还是神经网络)本质上只能理解数值和简单的模式,它无法直接“看懂”原始数据里的复杂含义。特征工程直接决定“信号 vs 噪声”比例,现实数据里 80% 是噪声(无关信息、冗余、错误),20% 是信号。 特征工程就是在放大信号、压制噪声。即使是深度学习,也只是自动学习特征组合,但它需要足够好的原材料才能学出好结果。
高洁017 小时前
python·深度学习·机器学习·数据挖掘·知识图谱
大模型架构演进:从Transformer到MoE大模型架构演进:从Transformer到MoE一、 Transformer的辉煌与局限 二、 MoE:用“稀疏激活”撬动模型容量 三、 MoE为何成为大模型新范式? 四、 典型实践:从GLaM到Qwen-MoE 五、 挑战与未来方向
谁不学习揍谁!7 小时前
python·算法·机器学习
基于python机器学习算法的农作物产量可视化分析预测系统(完整系统源码+数据库+详细文档+论文+详细部署教程+答辩PPT)获取方式基于集成学习算法XGBoost农作物产量可视化分析预测系统,旨在帮助农民和相关从业者更好地预测农作物产量,以优化农业生产。该系统主要包括四个功能模块。
爱寂寞的时光7 小时前
人工智能·机器学习
GPTQ原理浅析及简单实现GPTQ论文地址:GPTQ arxivGPTQ作为逐层逐权重矩阵量化算法,每次运行只考虑一个权重矩阵 W ∈ R m × d W \in \mathbb{R}^{m \times d} W∈Rm×d。给定固定的校准集输入 X ∈ R d × n X \in \mathbb{R}^{d \times n} X∈Rd×n, W ^ \hat{W} W^作为 W W W量化-反量化后的矩阵,优化下面的目标函数:
FL162386312910 小时前
人工智能·yolo·机器学习
智慧医疗手术工具医疗器械检测数据集VOC+YOLO格式2273张15类别注意数据集中大约1/3是原图剩余为增强图片主要是翻转增强等数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
何伯特10 小时前
人工智能·机器学习·自动驾驶
越野环境自动驾驶状态机:基于TinyFSM的工程实践与结构化道路不同,越野环境没有清晰的车道线、没有固定交通规则、路况瞬息万变。沙地、泥泞、陡坡、涉水、岩石攀爬——这些场景对决策系统的鲁棒性提出了极高要求。
lisw0510 小时前
人工智能·驱动开发·机器学习
Spec-Driven Development,规格驱动开发:程序开发新模式!“规格驱动开发”是一个非常前沿且值得深入探讨的理念。它并非一个凭空出现的新名词,而是现代软件工程最佳实践演进和融合的必然产物,可以看作是测试驱动开发、API先行、契约测试和形式化验证等思想的集大成者。
FL162386312911 小时前
人工智能·yolo·机器学习
厨房用品厨房物体食物检测数据集VOC+YOLO格式9366张69类别特别注意数据集中里面图片都是从大模型生成的视频截图的,注意查看图片预览数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
MaoziShan11 小时前
人工智能·机器学习·自然语言处理
CMU Subword Modeling | 01 Things Smaller than Words在自然语言处理中(Natural Language Processing, NLP),我们需要把文本变成数字,这样计算机才能“理解”语言。这个转换的核心步骤之一就是 Tokenization(分词/标记化):把连续的文字拆成可以处理的最小单位。(dmort27.github.io)
LuH112411 小时前
python·深度学习·机器学习
【ILSVRC2012】ImageNet-1k数据集下载与处理脚本
狸猫算君11 小时前
机器学习
别再用ChatGPT群发祝福了!手把手教你“喂”出一个懂人情的AI,连马术梗都能接住今年1月初,我立了个Flag:春节前,做一个能帮人写祝福语的小工具。当时想得很简单,现在大模型这么强,写个祝福语还不简单?结果被狠狠打脸。
山顶夕景12 小时前
人工智能·数学·算法·机器学习
【Math】数学知识点串联0、核心是复习以往数学知识,串联知识点,而不是以前考完试就可以丢了1、你想研究的问题 → 驱动你选择合适的数学工具:
shenxianasi12 小时前
人工智能·深度学习·机器学习·计算机视觉·语言模型·自然语言处理
【论文精读】Flamingo: a Visual Language Model for Few-Shot Learning目录一、前言二、创新点总结&模型优越性1.关键的架构创新2.Flamingo-80B的性能优越三、Introduction
Coding茶水间12 小时前
开发语言·人工智能·深度学习·yolo·机器学习
基于深度学习的车牌识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)基于深度学习的车牌识别系统大家好,这里是 Coding茶水间。今天给大家带来的是 《基于YOLO的车牌识别系统》。
隔壁大炮12 小时前
人工智能·深度学习·机器学习
第1章,机器学习与深度学习深度学习和机器学习的区别(仅个人理解):(1)深度学习是机器学习的一个子集(2)深度学习利用多层神经网络从大量数据中进行学习
Suryxin.12 小时前
人工智能·python·深度学习·机器学习·vllm
从0开始复现nano-vllm「model_runner.py」上半篇之初始化分布式推理环境定义了一个名为 ModelRunner 的核心类,用于在 nanovllm 框架下高效地加载和运行 Qwen3 大语言模型,其主要作用是构建一个支持多 GPU 张量并行(Tensor Parallelism)的高性能推理引擎。
春日见12 小时前
linux·人工智能·算法·机器学习·自动驾驶
commit与fetchgit commit (本地存档): 只是保存在你自己的电脑上!git push (上传): 这才是把你的 Commit 推送到远端仓库。
周周爱喝粥呀12 小时前
人工智能·机器学习
机器学习中的自监督学习和无监督学习的区别是什么?自监督学习(Self-Supervised Learning, SSL) = 模型从输入数据本身生成“标签”进行训练 无监督学习(Unsupervised Learning) = 模型没有标签,只找数据内部结构或规律