数据挖掘

天呐草莓6 小时前
人工智能·python·深度学习·算法·机器学习·数据挖掘·集成学习
集成学习 (ensemble learning)集成学习 (ensemble learning) 通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统 (multi-classifier system)、基于委员会的学习 (committee-based learning) 等。
十三画者12 小时前
数据挖掘·数据分析
【文献分享】PepQueryMHC:基于免疫肽组学数据实现肿瘤抗原的快速全面筛选确定 MHC 结合肽的肿瘤特异性对于癌症免疫疗法的发展至关重要,但目前的方法在处理 II 类肽和非参考序列方面存在困难。我们推出了 PepQueryMHC 这一超快速工具,它将 MHC 结合肽序列与转录的 RNA 测序读数相结合,以实现对肿瘤抗原的高效优先排序。我们展示了其在优先排序 I 类和 II 类肿瘤抗原、确定呈递肽的细胞来源以及解决有关蛋白酶体剪接肽的流行程度的不确定性方面的灵活性。
超自然祈祷14 小时前
人工智能·机器学习·数据挖掘·数据分析
从数据挖掘到人工智能的脉络地图信息技术:工业化、信息化、数字化、智能化(5G、云计算、大数据、大模型)……天知道以后会是什么,用脑机接口为第四次工业革命画上句号并开启新的革命?
甄心爱学习14 小时前
数据挖掘·数据立方体
如何计算数据立方体中聚合单元的个数?这个题如此抽象,先看一下基本概念:有两种情况:count>=1,count>=2理解一下,这里count>=1时,相当于把每个基础单元格看作集合,然后求出这个集合的所有真子集,然后取并集
啊阿狸不会拉杆14 小时前
图像处理·人工智能·算法·分类·数据挖掘·数字图像处理
《数字图像处理》实验8-图像识别与分类读取包含多目标的图像→截取单个目标作为模板→计算归一化互相关系数→定位最匹配目标并标记。准备汽车 / 自行车两类训练样本→提取 HOG 特征→训练 SVM 分类器→对测试图像进行分类并可视化 HOG 特征。
奥特曼_ it15 小时前
大数据·笔记·分布式·数据挖掘·数据分析·spark·毕设
【数据分析】基于Spark链家网租房数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✔目录一、项目背景二、研究目的三、项目创新点四、项目功能五、开发技术介绍六、项目展示七、B站权威教学视频
上海乐备实生物15 小时前
信息可视化·数据挖掘·聚类·生信·单细胞测序·乐备实·聚类分群
单细胞转录组数据的聚类分群:方法、挑战与进展单细胞转录组测序(scRNA-seq)技术已彻底改变了我们研究细胞异质性的能力,其核心价值在于揭示组织或生物样本中不同类型的细胞状态、发育轨迹和功能亚群。聚类分析作为scRNA-seq数据处理流程中的关键环节,旨在将成千上万个具有相似转录谱的细胞归并为具有生物学意义的群体,是后续进行细胞类型注释、差异表达分析、轨迹推断等高级分析的基础。因此,聚类算法的准确性、稳健性和可解释性直接决定了研究结论的可靠性。
Gofarlic_oms11 天前
大数据·运维·人工智能·分布式·架构·数据挖掘·需求分析
集中式 vs 分布式许可:跨地域企业的管控架构选择集中式 vs 分布式许可:跨地域企业的管控架构选择跨地域企业在运营过程中,往往会面临一个关键的技术管理问题:如何选择许可控制架构? 是采用集中式许可管理,还是分布式许可部署?这个问题看似简单,实则关系到企业在不同地区的合规性、运维效率、安全控制以及战略执行能力。作为一名企业技术管理的从业者,你的首要任务是理解这两种模式的核心差异,明确各自的适用场景,并结合企业实际做出科学决策。将从技术、政策和运营三个维度,深入探讨集中式与分布式许可架构的选择逻辑。
自不量力的A同学1 天前
人工智能·数据挖掘·回归
阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep根据最新信息,阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep,这标志着其自回归图像生成系列模型的一次重要升级。
2501_941333102 天前
人工智能·分类·数据挖掘
基于YOLO11-CA-HSFPN的人体姿态识别与姿势分类改进方法详解【文章标签:YOLO11作为目标检测领域的最新突破,其高效准确的人体姿态识别能力在计算机视觉领域备受关注。本文将深入解析基于YOLO11-CA-HSFPN的人体姿态识别与姿势分类改进方法,带你领略这一前沿技术的魅力所在。
Loacnasfhia92 天前
yolo·分类·数据挖掘
珊瑚形态识别与分类:基于YOLOv8-EfficientHead的14种珊瑚生长形态自动检测系统本数据集名为珊瑚数据集(coral) v2 release版本,是RF100基准测试计划的一部分,该计划由英特尔赞助,旨在创建一个新的物体检测基准以评估模型泛化能力。数据集包含594张图像,所有图像均已YOLOv8格式标注,未应用任何图像增强技术。数据集包含14个珊瑚形态类别:树状珊瑚(Arborescent)、簇状-a型(Caespitose-a)、簇状-b型(Caespitose-b)、柱状(Columnar)、伞状(Corymbose)、指状(Digitate)、结壳状(Encrusting)、叶状
2301_792185882 天前
人工智能·数据挖掘·软件工程
基于软件工程的结构化分析实验(1)掌握结构化分析方法进行建模的原则及使用场景。(2)熟悉结构化分析建模的符号和绘制规则。(3)使用结构化分析方法分析实际问题,绘制数据流图、状态转换图。
一瞬祈望2 天前
人工智能·python·神经网络·数据挖掘
ResNet50 图像分类完整实战(Notebook Demo + 训练代码)之前做了一个 PyTorch 图像分类项目模板,解决的是「结构怎么搭、流程怎么跑通」的问题。这篇文章,我们往前再走一步 —— 用一个真正常用的模型:ResNet50,把整个图像分类训练流程完整跑一遍。
顽强卖力2 天前
数据挖掘·数据分析
第一章:什么是数据分析?很多人都在谈论大数据、数据分析,但是又有多少人了解大数据、知道数据分析呢?近年来,不管是企业还是其他,都在高谈阔论数据赋能、数据驱动业务增长。但是又有多少企业或其他能够做到数据赋能、数据驱动呢?
QZ166560951592 天前
分类·数据挖掘·政务
政务数据智能治理一体化解决方案:合规对标、易掌握、自适应分类的全面实现提示:本文系统阐述政务数据分类分级管理的政策背景、行业痛点、技术路径与落地成效,突出“合规对标、易掌握、自适应分类”三大核心特性,为数字政府建设提供可操作、可复制的治理典范。 在数字政府纵深发展的当下,政务数据已成为提升治理能力与公共服务品质的关键要素。然而,数据规模急剧增长、系统异构分散、合规要求趋严等多重挑战,使得政务数据管理面临“数据不清、安全难控、共享不畅”的普遍困境。“知源-AI数据分类分级系统”,以合规对标为基准,以易掌握为体验导向,以自适应分类为技术内核,构建了一套覆盖政务数据全生命周期的智
奥利文儿2 天前
网络·数据挖掘·数据分析
【虚拟机】win11+VMware+ubuntu24 网络配置篇本文主要是描述使用多台win11系统主机(2台或以上通用),运用VMware虚拟化Ubuntu作为服务器使用,实现综合多台主机整合机器性能目的网络通信配置过程。使用VMware进行配置虽然存在部分性能损耗,但胜在对比docker,更适合入门者操作,同时适合熟悉搭建的人员脱离脚本情况下快速完成组合机器搭建高性能数据分析环境的相关操作。因为开发过程中需要使用到互联网的同时,宿主机与宿主机、宿主机与虚拟机之间需要相互通信,宿主机和虚拟机同时需要访问互联网,相关的网络拓扑很复杂,以下将分步骤描述。
Aloudata3 天前
人工智能·数据挖掘·数据分析·chatbi·data agent
根据业务角色创建 AI 数据分析助手,满足集团型企业多部门个性化需求集团型企业规模庞大、业务复杂,不同部门的数据分析需求差异显著。以 HR 部门为例,需要分析员工招聘渠道的有效性、培训投入与产出的比例,以及员工流失率与绩效的关系等;财务部门则聚焦于成本结构分析、预算执行偏差原因查找,以及不同业务板块的盈利能力评估;区域经理则关心各区域市场的销售业绩对比、客户群体特征差异,以及市场推广活动的效果评估;门店运营人员便更为关注各门店销售业绩差异分析、库存周转情况监控、顾客消费行为洞察等。
qq_2704900963 天前
大数据·数据挖掘·数据分析
基于大数据的民宿数据分析及可视化平台的设计与实现随着共享经济的蓬勃发展,民宿行业已成为旅游产业的重要组成部分。然而,海量的房源信息、用户评价、价格波动等数据给行业管理者、经营者和消费者带来了新的挑战:
后端小张3 天前
人工智能·深度学习·学习·机器学习·自然语言处理·数据挖掘·transformer
【AI 学习】深度解析Transformer核心:注意力机制的原理、实现与应用在自然语言处理(NLP)发展的早期,循环神经网络(RNN)及其变体(LSTM、GRU)长期占据主导地位。这类模型通过时序递推的方式处理序列数据,能够捕捉文本中的上下文依赖关系,但存在两大核心缺陷:一是并行计算能力差,由于每个时间步的计算依赖于上一个时间步的输出,导致训练效率低下;二是长距离依赖捕捉能力有限,随着序列长度增加,梯度容易消失或爆炸,难以有效建模长文本中的语义关联。