数据挖掘

腾讯WeTest1 小时前
人工智能·分类·数据挖掘
Al in CrashSight ——基于AI优化异常堆栈分类模型CrashSight在进行异常问题分组时,经常会由于一些特殊case导致无法聚合在一起,如堆栈里面包含uuid,玩家姓名等,从而产生大量重复issue,给用户带来不必要的干扰,同时海量的issue也影响了页面查询性能。另外,崩溃issue分组场景下,由于一些通用堆栈行的干扰,传统的分组算法有时会将实际不同的issue识别成相同issue,影响问题追踪精准度。因此,CrashSight团队引入用LLM大模型驱动的问题分组方法,带来更智能化的问题分组体验。
龙腾AI白云9 小时前
深度学习·数据挖掘
国内外具身智能VLA模型深度解析(3)国内外具身智能VLA模型深度解析(3) 国内典型具身智能VLA模型 1.星动纪元 —— ERA-42 2)模型训练
xuehaikj10 小时前
人工智能·数据挖掘
文档类型识别与分类_yolo13-C3k2-SFSConv实现详解在计算机视觉领域,文档识别与分类是一项重要且具有挑战性的任务。随着深度学习技术的发展,基于目标检测的方法在文档处理中取得了显著成果。本文将详细介绍yolo13模型中C3k2-SFSConv模块的实现原理及其在文档识别任务中的应用。
蒋星熠16 小时前
大数据·python·数据挖掘·数据分析·需求分析
实证分析:数据驱动决策的技术实践指南🌟 Hello,我是蒋星熠Jaxonic! 🌈 在浩瀚无垠的技术宇宙中,我是一名执着的星际旅人,用代码绘制探索的轨迹。 🚀 每一个算法都是我点燃的推进器,每一行代码都是我航行的星图。 🔭 每一次性能优化都是我的天文望远镜,每一次架构设计都是我的引力弹弓。 🎻 在数字世界的协奏曲中,我既是作曲家也是首席乐手。让我们携手,在二进制星河中谱写属于极客的壮丽诗篇!
谅望者21 小时前
大数据·数据库·笔记·python·数据挖掘·数据分析
数据分析笔记14:Python文件操作计算机只能识别0和1,而人类使用文字、字母、符号。编码是将两者之间进行转换的机制。编码流程: 人类语言(汉字/字母) → [编码] → 机器语言(0101) 机器语言(0101) → [解码] → 人类语言(汉字/字母)
思通数科人工智能大模型21 小时前
人工智能·目标检测·计算机视觉·数据挖掘·知识图谱·零售
零售场景下的数智店商:解决盗损问题,化解隐性成本痛点在零售行业,盗损问题始终是商家挥之不去的痛点。无论是顾客在生鲜区将进口水果藏入背包的偷盗行为,还是在化妆品区随意撕开试用装的违规拆包,亦或是电子产品区因意外碰撞导致商品损坏,这些隐性损失不仅侵蚀利润,还增加了运营的不确定性。AI视频监控卫士,依托先进的AI视觉技术和行为意图分析引擎,为数智店商打造了一个高效、智能的防损闭环,彻底破解盗损痛点。
谅望者1 天前
笔记·数据挖掘·数据分析
数据分析笔记10:数据容器数据容器是用于存储数据的结构,不同容器具有不同的特点和用途。五种主要容器:实际应用:爬虫数据存储。 场景:爬取多个网页的数据。
谅望者1 天前
笔记·数据挖掘·数据分析
数据分析笔记05:区间估计点估计的定义:用样本统计量估计总体参数的方法。点估计的三大性质:核心局限:无法保证单一样本的估计值等于总体参数的真实值。
权泽谦1 天前
java·机器学习·数据挖掘
Java 在机器学习中的应用:基于 DL4J 与 Weka 的完整实战案例说到机器学习(Machine Learning),大部分人的第一反应是:Python 才是最常用的语言。
权泽谦1 天前
人工智能·分类·数据挖掘
脑肿瘤分割与分类的人工智能研究报告脑肿瘤按组织来源可分为原发性(如胶质瘤)和继发性(转移性肿瘤)。MRI 提供多序列图像(T1、T1c、T2、FLAIR),为 AI 模型提供丰富数据,但存在形态多样、边界不规则和异质性强等特点。AI 能自动提取特征,实现精确分割与分类,辅助临床决策。
xuehaikj1 天前
人工智能·分类·数据挖掘
【甲状腺病理AI】基于YOLO11-SOEP的甲状腺乳头状癌病理特征识别与分类系统研究🔬 近年来,甲状腺乳头状癌(PTC)的发病率逐年上升,早期准确诊断对提高患者生存率至关重要!💪 传统的病理诊断依赖医生经验,存在主观性和效率低下的问题。随着人工智能技术的发展,深度学习在医学图像分析领域展现出巨大潜力。本文介绍了一种基于YOLO11-SOEP的甲状腺乳头状癌病理特征识别与分类系统,该系统能够自动识别和分类多种病理特征,为临床诊断提供辅助决策支持。🎯
谅望者2 天前
笔记·数据挖掘·数据分析
数据分析笔记06:假设检验定义:假设检验是对已经存在的结论或主张进行统计验证的过程。基本流程:思路一:将研究中的假设作为备择假设。
xuehaikj2 天前
人工智能·数据挖掘
【实战案例】基于dino-4scale_r50_8xb2-36e_coco的棉田叶片病害识别与分类项目详解在现代农业发展过程中,棉田叶片病害的及时准确识别对保障棉花产量和质量至关重要。传统病害识别方法依赖人工经验,存在效率低、主观性强、易受环境影响等问题。本文介绍了一个基于改进DINO模型的棉田叶片病害识别与分类项目,通过多尺度特征融合和注意力机制等技术,实现了高精度、实时性的病害识别,为精准农业提供了有力支持。
q***31833 天前
爬虫·数据挖掘·数据分析
爬虫基础之爬取某基金网站+数据分析声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
生信大表哥3 天前
机器学习·数据挖掘·聚类
贝叶斯共识聚类(BCC)共识聚类被广泛用于整合多种聚类算法或多源数据集。贝叶斯共识聚类提出了一种数据驱动的共识聚类方法,通过扩展有限狄利克雷混合模型以适配多数据源,同时对源特定特征和整体聚类进行建模。该方法为每个数据源生成独立的聚类结果,但这些结果均与所有数据源的整体聚类松散关联。贝叶斯共识聚类能够同步完成特定数据源聚类与共识聚类,且共识聚类的形成基于一种概率分布,该分布对在特定区域频繁出现的簇赋予更高概率。
谅望者3 天前
大数据·数据库·笔记·python·数据挖掘·数据分析
数据分析笔记07:Python编程语言介绍软件的本质是一大堆代码的集合,包括:低维度语言(机器语言):高维度语言(人类可读):优势:Python解释器: 作用:将人类编写的Python代码翻译成机器能识别的0和1代码。 两种选择:
甄心爱学习3 天前
人工智能·算法·分类·数据挖掘
数据挖掘11-分类的高级方法学习笔记(AI总结):Chapter 7 Classification Advanced Methods
qq_436962184 天前
数据库·人工智能·信息可视化·数据挖掘·数据分析
数据中台:打破企业数据孤岛,实现全域资产化的关键一步在当今数字化浪潮中,企业面临着前所未有的数据挑战。各部门的工作内容虽已进入各类系统(如ERP、MES、CRM等),但由于系统间的割裂,数据无法有效流通,形成了严重的数据孤岛现象。这不仅影响了企业的决策效率,更阻碍了业务的协同发展。本文将深入探讨企业数据管理的痛点,并介绍如何通过构建轻量数据中台实现数据资产化,从而提升企业的整体竞争力。
CV实验室4 天前
人工智能·机器学习·计算机视觉·数据挖掘·论文·聚类
AAAI 2026 Oral 之江实验室等提出MoEGCL:在6大基准数据集上刷新SOTA,聚类准确率最高提升超8%!在数字时代,我们常常从不同角度或来源获取关于同一个事物的数据,比如一个新闻事件的文字报道、图片和视频。如何整合这些不同来源(即“多视图”)的数据,并自动地将相似的事物归为一类,是多视图聚类 (Multi-View Clustering) 要解决的核心问题。当前的研究方法在融合这些多视图信息时,通常采用一种较为粗糙的策略,即为每个视图的整体信息分配一个固定的权重再进行融合,这忽略了不同样本之间存在的差异性,导致聚类效果受限。
xuehaikj4 天前
人工智能·数据挖掘
基于RetinaNet的建筑设计师风格识别与分类研究_1RetinaNet是一种单阶段目标检测算法,由Lin等人于2017年提出,旨在解决传统单阶段检测器在处理类别不平衡问题时面临的挑战。在改进之前,RetinaNet采用标准的ResNet作为骨干网络,结合特征金字塔网络(FPN)进行多尺度特征融合,并通过密集锚点策略进行目标检测。该算法的核心创新在于引入了Focal Loss,有效缓解了正负样本不平衡和难易样本不平衡的问题,使得单阶段检测器在保持高推理速度的同时达到了与两阶段检测器相当的精度。