数据挖掘

databook7 小时前
python·数据挖掘·数据分析
数据分析师的“水晶球”:时间序列分析很多刚入行的小伙伴问我:“我想预测下个月公司的销售额,或者预测一下明天的股价,该学什么?”我的回答通常只有六个字:时间序列分析。
玄同76512 小时前
服务器·人工智能·python·深度学习·自然语言处理·数据挖掘·知识图谱
Python 流程控制:LLM 批量推理与 API 限流处理对零基础开发者来说,Python 流程控制就像 LLM 批量推理的「交通信号灯」—— 它决定了:在 LLM 开发中,80% 的批量推理问题都可以通过流程控制解决—— 本文将从零基础开始,系统讲解 Python 流程控制的核心语法,并结合 LLM 批量推理、API 限流处理的真实场景,提供可直接运行的代码方案。
计算机程序设计小李同学16 小时前
人工智能·分类·数据挖掘
基于贝叶斯分类算法的垃圾邮件筛选器开发基于贝叶斯分类算法的垃圾邮件筛选器开发一. 系统概述本系统是基于贝叶斯分类算法实现的垃圾邮件筛选器,旨在帮助用户自动过滤垃圾邮件,提高邮箱的清洁度。通过对邮件内容的分析,该系统能够自动标记垃圾邮件,并提供手动标记的功能,进一步提升分类的准确性。系统主要基于Python、Django、MySQL技术栈构建,分为前端、后端和数据库三大部分。
天呐草莓1 天前
人工智能·python·深度学习·算法·机器学习·数据挖掘·集成学习
集成学习 (ensemble learning)集成学习 (ensemble learning) 通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统 (multi-classifier system)、基于委员会的学习 (committee-based learning) 等。
十三画者2 天前
数据挖掘·数据分析
【文献分享】PepQueryMHC:基于免疫肽组学数据实现肿瘤抗原的快速全面筛选确定 MHC 结合肽的肿瘤特异性对于癌症免疫疗法的发展至关重要,但目前的方法在处理 II 类肽和非参考序列方面存在困难。我们推出了 PepQueryMHC 这一超快速工具,它将 MHC 结合肽序列与转录的 RNA 测序读数相结合,以实现对肿瘤抗原的高效优先排序。我们展示了其在优先排序 I 类和 II 类肿瘤抗原、确定呈递肽的细胞来源以及解决有关蛋白酶体剪接肽的流行程度的不确定性方面的灵活性。
超自然祈祷2 天前
人工智能·机器学习·数据挖掘·数据分析
从数据挖掘到人工智能的脉络地图信息技术:工业化、信息化、数字化、智能化(5G、云计算、大数据、大模型)……天知道以后会是什么,用脑机接口为第四次工业革命画上句号并开启新的革命?
甄心爱学习2 天前
数据挖掘·数据立方体
如何计算数据立方体中聚合单元的个数?这个题如此抽象,先看一下基本概念:有两种情况:count>=1,count>=2理解一下,这里count>=1时,相当于把每个基础单元格看作集合,然后求出这个集合的所有真子集,然后取并集
啊阿狸不会拉杆2 天前
图像处理·人工智能·算法·分类·数据挖掘·数字图像处理
《数字图像处理》实验8-图像识别与分类读取包含多目标的图像→截取单个目标作为模板→计算归一化互相关系数→定位最匹配目标并标记。准备汽车 / 自行车两类训练样本→提取 HOG 特征→训练 SVM 分类器→对测试图像进行分类并可视化 HOG 特征。
奥特曼_ it2 天前
大数据·笔记·分布式·数据挖掘·数据分析·spark·毕设
【数据分析】基于Spark链家网租房数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✔目录一、项目背景二、研究目的三、项目创新点四、项目功能五、开发技术介绍六、项目展示七、B站权威教学视频
上海乐备实生物2 天前
信息可视化·数据挖掘·聚类·生信·单细胞测序·乐备实·聚类分群
单细胞转录组数据的聚类分群:方法、挑战与进展单细胞转录组测序(scRNA-seq)技术已彻底改变了我们研究细胞异质性的能力,其核心价值在于揭示组织或生物样本中不同类型的细胞状态、发育轨迹和功能亚群。聚类分析作为scRNA-seq数据处理流程中的关键环节,旨在将成千上万个具有相似转录谱的细胞归并为具有生物学意义的群体,是后续进行细胞类型注释、差异表达分析、轨迹推断等高级分析的基础。因此,聚类算法的准确性、稳健性和可解释性直接决定了研究结论的可靠性。
Gofarlic_oms12 天前
大数据·运维·人工智能·分布式·架构·数据挖掘·需求分析
集中式 vs 分布式许可:跨地域企业的管控架构选择集中式 vs 分布式许可:跨地域企业的管控架构选择跨地域企业在运营过程中,往往会面临一个关键的技术管理问题:如何选择许可控制架构? 是采用集中式许可管理,还是分布式许可部署?这个问题看似简单,实则关系到企业在不同地区的合规性、运维效率、安全控制以及战略执行能力。作为一名企业技术管理的从业者,你的首要任务是理解这两种模式的核心差异,明确各自的适用场景,并结合企业实际做出科学决策。将从技术、政策和运营三个维度,深入探讨集中式与分布式许可架构的选择逻辑。
自不量力的A同学3 天前
人工智能·数据挖掘·回归
阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep根据最新信息,阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep,这标志着其自回归图像生成系列模型的一次重要升级。
2501_941333103 天前
人工智能·分类·数据挖掘
基于YOLO11-CA-HSFPN的人体姿态识别与姿势分类改进方法详解【文章标签:YOLO11作为目标检测领域的最新突破,其高效准确的人体姿态识别能力在计算机视觉领域备受关注。本文将深入解析基于YOLO11-CA-HSFPN的人体姿态识别与姿势分类改进方法,带你领略这一前沿技术的魅力所在。
Loacnasfhia93 天前
yolo·分类·数据挖掘
珊瑚形态识别与分类:基于YOLOv8-EfficientHead的14种珊瑚生长形态自动检测系统本数据集名为珊瑚数据集(coral) v2 release版本,是RF100基准测试计划的一部分,该计划由英特尔赞助,旨在创建一个新的物体检测基准以评估模型泛化能力。数据集包含594张图像,所有图像均已YOLOv8格式标注,未应用任何图像增强技术。数据集包含14个珊瑚形态类别:树状珊瑚(Arborescent)、簇状-a型(Caespitose-a)、簇状-b型(Caespitose-b)、柱状(Columnar)、伞状(Corymbose)、指状(Digitate)、结壳状(Encrusting)、叶状
2301_792185883 天前
人工智能·数据挖掘·软件工程
基于软件工程的结构化分析实验(1)掌握结构化分析方法进行建模的原则及使用场景。(2)熟悉结构化分析建模的符号和绘制规则。(3)使用结构化分析方法分析实际问题,绘制数据流图、状态转换图。
一瞬祈望3 天前
人工智能·python·神经网络·数据挖掘
ResNet50 图像分类完整实战(Notebook Demo + 训练代码)之前做了一个 PyTorch 图像分类项目模板,解决的是「结构怎么搭、流程怎么跑通」的问题。这篇文章,我们往前再走一步 —— 用一个真正常用的模型:ResNet50,把整个图像分类训练流程完整跑一遍。
顽强卖力4 天前
数据挖掘·数据分析
第一章:什么是数据分析?很多人都在谈论大数据、数据分析,但是又有多少人了解大数据、知道数据分析呢?近年来,不管是企业还是其他,都在高谈阔论数据赋能、数据驱动业务增长。但是又有多少企业或其他能够做到数据赋能、数据驱动呢?
QZ166560951594 天前
分类·数据挖掘·政务
政务数据智能治理一体化解决方案:合规对标、易掌握、自适应分类的全面实现提示:本文系统阐述政务数据分类分级管理的政策背景、行业痛点、技术路径与落地成效,突出“合规对标、易掌握、自适应分类”三大核心特性,为数字政府建设提供可操作、可复制的治理典范。 在数字政府纵深发展的当下,政务数据已成为提升治理能力与公共服务品质的关键要素。然而,数据规模急剧增长、系统异构分散、合规要求趋严等多重挑战,使得政务数据管理面临“数据不清、安全难控、共享不畅”的普遍困境。“知源-AI数据分类分级系统”,以合规对标为基准,以易掌握为体验导向,以自适应分类为技术内核,构建了一套覆盖政务数据全生命周期的智
奥利文儿4 天前
网络·数据挖掘·数据分析
【虚拟机】win11+VMware+ubuntu24 网络配置篇本文主要是描述使用多台win11系统主机(2台或以上通用),运用VMware虚拟化Ubuntu作为服务器使用,实现综合多台主机整合机器性能目的网络通信配置过程。使用VMware进行配置虽然存在部分性能损耗,但胜在对比docker,更适合入门者操作,同时适合熟悉搭建的人员脱离脚本情况下快速完成组合机器搭建高性能数据分析环境的相关操作。因为开发过程中需要使用到互联网的同时,宿主机与宿主机、宿主机与虚拟机之间需要相互通信,宿主机和虚拟机同时需要访问互联网,相关的网络拓扑很复杂,以下将分步骤描述。