数据挖掘

谅望者5 小时前
笔记·数据挖掘·数据分析
数据分析笔记10:数据容器数据容器是用于存储数据的结构,不同容器具有不同的特点和用途。五种主要容器:实际应用:爬虫数据存储。 场景:爬取多个网页的数据。
谅望者5 小时前
笔记·数据挖掘·数据分析
数据分析笔记05:区间估计点估计的定义:用样本统计量估计总体参数的方法。点估计的三大性质:核心局限:无法保证单一样本的估计值等于总体参数的真实值。
权泽谦6 小时前
java·机器学习·数据挖掘
Java 在机器学习中的应用:基于 DL4J 与 Weka 的完整实战案例说到机器学习(Machine Learning),大部分人的第一反应是:Python 才是最常用的语言。
权泽谦8 小时前
人工智能·分类·数据挖掘
脑肿瘤分割与分类的人工智能研究报告脑肿瘤按组织来源可分为原发性(如胶质瘤)和继发性(转移性肿瘤)。MRI 提供多序列图像(T1、T1c、T2、FLAIR),为 AI 模型提供丰富数据,但存在形态多样、边界不规则和异质性强等特点。AI 能自动提取特征,实现精确分割与分类,辅助临床决策。
xuehaikj10 小时前
人工智能·分类·数据挖掘
【甲状腺病理AI】基于YOLO11-SOEP的甲状腺乳头状癌病理特征识别与分类系统研究🔬 近年来,甲状腺乳头状癌(PTC)的发病率逐年上升,早期准确诊断对提高患者生存率至关重要!💪 传统的病理诊断依赖医生经验,存在主观性和效率低下的问题。随着人工智能技术的发展,深度学习在医学图像分析领域展现出巨大潜力。本文介绍了一种基于YOLO11-SOEP的甲状腺乳头状癌病理特征识别与分类系统,该系统能够自动识别和分类多种病理特征,为临床诊断提供辅助决策支持。🎯
谅望者20 小时前
笔记·数据挖掘·数据分析
数据分析笔记06:假设检验定义:假设检验是对已经存在的结论或主张进行统计验证的过程。基本流程:思路一:将研究中的假设作为备择假设。
xuehaikj1 天前
人工智能·数据挖掘
【实战案例】基于dino-4scale_r50_8xb2-36e_coco的棉田叶片病害识别与分类项目详解在现代农业发展过程中,棉田叶片病害的及时准确识别对保障棉花产量和质量至关重要。传统病害识别方法依赖人工经验,存在效率低、主观性强、易受环境影响等问题。本文介绍了一个基于改进DINO模型的棉田叶片病害识别与分类项目,通过多尺度特征融合和注意力机制等技术,实现了高精度、实时性的病害识别,为精准农业提供了有力支持。
q***31832 天前
爬虫·数据挖掘·数据分析
爬虫基础之爬取某基金网站+数据分析声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
生信大表哥2 天前
机器学习·数据挖掘·聚类
贝叶斯共识聚类(BCC)共识聚类被广泛用于整合多种聚类算法或多源数据集。贝叶斯共识聚类提出了一种数据驱动的共识聚类方法,通过扩展有限狄利克雷混合模型以适配多数据源,同时对源特定特征和整体聚类进行建模。该方法为每个数据源生成独立的聚类结果,但这些结果均与所有数据源的整体聚类松散关联。贝叶斯共识聚类能够同步完成特定数据源聚类与共识聚类,且共识聚类的形成基于一种概率分布,该分布对在特定区域频繁出现的簇赋予更高概率。
谅望者2 天前
大数据·数据库·笔记·python·数据挖掘·数据分析
数据分析笔记07:Python编程语言介绍软件的本质是一大堆代码的集合,包括:低维度语言(机器语言):高维度语言(人类可读):优势:Python解释器: 作用:将人类编写的Python代码翻译成机器能识别的0和1代码。 两种选择:
甄心爱学习2 天前
人工智能·算法·分类·数据挖掘
数据挖掘11-分类的高级方法学习笔记(AI总结):Chapter 7 Classification Advanced Methods
qq_436962183 天前
数据库·人工智能·信息可视化·数据挖掘·数据分析
数据中台:打破企业数据孤岛,实现全域资产化的关键一步在当今数字化浪潮中,企业面临着前所未有的数据挑战。各部门的工作内容虽已进入各类系统(如ERP、MES、CRM等),但由于系统间的割裂,数据无法有效流通,形成了严重的数据孤岛现象。这不仅影响了企业的决策效率,更阻碍了业务的协同发展。本文将深入探讨企业数据管理的痛点,并介绍如何通过构建轻量数据中台实现数据资产化,从而提升企业的整体竞争力。
CV实验室3 天前
人工智能·机器学习·计算机视觉·数据挖掘·论文·聚类
AAAI 2026 Oral 之江实验室等提出MoEGCL:在6大基准数据集上刷新SOTA,聚类准确率最高提升超8%!在数字时代,我们常常从不同角度或来源获取关于同一个事物的数据,比如一个新闻事件的文字报道、图片和视频。如何整合这些不同来源(即“多视图”)的数据,并自动地将相似的事物归为一类,是多视图聚类 (Multi-View Clustering) 要解决的核心问题。当前的研究方法在融合这些多视图信息时,通常采用一种较为粗糙的策略,即为每个视图的整体信息分配一个固定的权重再进行融合,这忽略了不同样本之间存在的差异性,导致聚类效果受限。
xuehaikj3 天前
人工智能·数据挖掘
基于RetinaNet的建筑设计师风格识别与分类研究_1RetinaNet是一种单阶段目标检测算法,由Lin等人于2017年提出,旨在解决传统单阶段检测器在处理类别不平衡问题时面临的挑战。在改进之前,RetinaNet采用标准的ResNet作为骨干网络,结合特征金字塔网络(FPN)进行多尺度特征融合,并通过密集锚点策略进行目标检测。该算法的核心创新在于引入了Focal Loss,有效缓解了正负样本不平衡和难易样本不平衡的问题,使得单阶段检测器在保持高推理速度的同时达到了与两阶段检测器相当的精度。
迦蓝叶3 天前
java·人工智能·数据挖掘·知识图谱·语义网·rdf·rdfs
RDF 与 RDFS:知识图谱推理的基石在当今数字化时代,知识图谱、语义网以及现代数据集成技术已经成为信息管理和智能处理的重要工具。这些技术的底层支撑是两个由万维网联盟(W3C)制定的核心标准:资源描述框架(Resource Description Framework,RDF)和 RDF 模式(RDF Schema,RDFS)。它们共同构成了一个简单而强大的基础,用于以机器可读的方式描述任意实体及其相互关系。本文将通过拆解章节的方式,逐步剖析这两个协议的核心概念、内在联系与实际应用,帮助读者更好地理解语义网技术的底层逻辑。
xuehaikj3 天前
人工智能·数据挖掘
苹果质量检测与分类 - YOLO13结合RFCAConv实现本数据集为苹果质量检测与分类任务提供了全面的视觉训练资源,采用YOLOv8格式标注,包含3418张经过预处理的图像。数据集分为训练集、验证集和测试集,涵盖两类标签:‘Bad’(劣质苹果)和’Good’(优质苹果)。每张图像均经过640x640像素的拉伸调整和直方图均衡化对比度增强处理,以提升模型识别能力。为增加数据多样性,数据集通过水平翻转、垂直翻转以及90度旋转(包括无旋转、顺时针、逆时针和上下翻转)等 augmentation 技术生成了每个原始图像的三个版本,有效扩充了训练样本。数据集采集于2024
xuehaikj3 天前
人工智能·数据挖掘
芦笋嫩茎形态分类与识别_YOLO11-C3k2-MambaOut-SFSC模型实现_1本数据集为芦笋(Asparagus officinalis)嫩茎形态分类与识别的专用数据集,采用YOLOv8格式标注,包含903张经过预处理的高质量图像。所有图像均被统一调整为640×640像素尺寸,以保持数据一致性。数据集包含六类芦笋嫩茎形态标注,分别为’Ab’、‘At’、‘Bb’、‘Bt’、‘Cb’和’Ct’,这些类别可能代表芦笋的不同生长阶段、品质特征或部位分类。数据集通过qunshankj平台进行标注与整理,遵循CC BY 4.0许可协议,适用于计算机视觉领域的目标检测任务研究。图像背景多为纯黑或
qunshankeji3 天前
yolo·分类·数据挖掘
YOLOv8-SOEP-RFPN-MFM水果智能分类与检测模型实现嗨,各位AI爱好者们!👋 今天我要和大家分享一个超酷的项目——基于YOLOv8-SOEP-RFPN-MFM的水果智能分类与检测模型!🍎🍌🍊 想象一下,只需一张水果图片,我们的AI就能精准识别出是什么水果,甚至还能在图片中框出它们的位置!是不是超级神奇?😲
沧澜sincerely4 天前
人工智能·数据挖掘
数据挖掘概述目录什么是数据挖掘数据挖掘技术的产生与发展商业需求与应用牵引技术背景驱动大数据时代对数据挖掘的新增需求
Learn Beyond Limits4 天前
人工智能·python·算法·ai·分类·数据挖掘·回归
Regression vs. Classification|回归vs分类-----------------------------------------------------------------------------------------------