数据挖掘

Michelle80235 小时前
大数据·人工智能·数据挖掘
23大数据 数据挖掘复习1A. 根节点是树的末端节点,代表分类结果 B. 内部节点表示特征或属性,用于进一步分割数据 C. 叶节点是树的最顶层节点,代表初始数据分割 D. 边表示分类结果,路径表示特征取值 答案:B 解析:决策树中,根节点是最顶层节点(A、C错误),代表初始数据分割;内部节点表示特征或属性,用于进一步分割数据(B正确);叶节点是末端节点,代表分类结果;边表示特征的可能取值,路径表示一系列决策(D错误)。
梦想画家8 小时前
自然语言处理·分类·数据挖掘
Cohen‘s Kappa系数:衡量分类一致性的黄金标准及其在NLP中的应用在分类任务(如医学诊断、机器学习模型评估、数据标注等)中,两个评估者(或模型)的分类一致性是衡量结果可靠性的关键指标。Cohen’s Kappa系数(κ) 是一种经典的统计方法,用于评估分类一致性,同时校正随机一致的影响,比简单的“一致率”更可靠。本文将详细介绍:
iceslime10 小时前
机器学习·数据挖掘·逻辑回归
头歌Educator机器学习与数据挖掘-逻辑回归答案分享
eqwaak01 天前
开发语言·python·信息可视化·数据挖掘·数据分析·pandas
数据预处理与可视化流水线:Pandas Profiling + Altair 实战指南在数据科学项目中,数据预处理和可视化分析是核心环节。传统流程中,工程师需手动编写大量代码完成数据清洗、探索性分析(EDA)和图表生成,效率低且易出错。本指南将构建一个自动化流水线,结合:
Christo31 天前
人工智能·算法·机器学习·数据挖掘·kmeans
关于K-means和FCM的凸性问题讨论K-means 最小化簇内平方和:min⁡{rik},{μk}∑i=1n∑k=1Krik∥xi−μk∥2, \min_{\{r_{ik}\},\{\boldsymbol{\mu}_k\}} \sum_{i=1}^n \sum_{k=1}^K r_{ik} \|\mathbf{x}_i - \boldsymbol{\mu}_k\|^2, {rik},{μk}mini=1∑nk=1∑Krik∥xi−μk∥2,
热心不起来的市民小周1 天前
人工智能·分类·数据挖掘
基于 RoBERTa + 多策略优化的中文商品名细粒度分类代码详见:https://github.com/xiaozhou-alt/Products_Name_Classification
CappuccinoRose2 天前
matlab·信息可视化·数据挖掘·数据分析
MATLAB学习文档(二十三)目录数组练习题Q1: 创建结构体数组studentQ2: 分析JSON文件中的宝可梦数据Q3: 导入文件夹中的xml和图片文件
MoRanzhi12032 天前
人工智能·python·机器学习·数学建模·分类·数据挖掘·pandas
11. Pandas 数据分类与区间分组(cut 与 qcut)在数据分析中,我们常常需要将连续型变量划分为若干区间,从而对数据进行离散化、分层统计或可视化展示。Pandas 提供了两种常用方法:cut(等宽分组)和 qcut(等频分组)。它们能帮助我们快速地将连续数值数据转化为类别变量,为后续的趋势分析、分层汇总和建模提供有力支持。
你好~每一天3 天前
人工智能·百度·数据挖掘·数据分析·职业·转行
2025 中小企业 AI 转型:核心岗技能 “怎么证、怎么用”?随着数字化转型加速,人工智能技术正逐步渗透到各行各业,中小企业核心岗位对AI技能的需求呈现爆发式增长。
唐兴通个人3 天前
人工智能·数据挖掘
清华大学AI领导力AI时代领导力AI变革领导力培训师培训讲师专家唐兴通讲授数字化转型人工智能组织创新实践领导力国央企国有企业金融运营商制造业《AI领导力》《AI时代领导力》《AI赋能领导力:驾驭智能时代的增长罗盘》A.I. Leadership: The Strategic Compass for the Intelligence Age
码上地球3 天前
大数据·机器学习·数据挖掘
大数据成矿预测系列(三) | 从统计模型到机器学习:为何机器学习是成矿预测的新前沿?矿产勘查的本质上就是是一场在巨大的不确定性中寻求确定性的过程。从早期探矿依赖个人经验和直觉的“相矿”,到后来基于地质理论的知识驱动模型。在漫长的发展中,证据权重法(Weights of Evidence, WofE)的出现开创性地引入了数据驱动的理念,为在地理信息系统(GIS)环境下系统性地整合多源地学信息、进行定量化的成矿预测提供了第一个强大而客观的框架。
F_D_Z3 天前
python·数据挖掘·数据分析·prophet
【Python】家庭用电数据分析Prophet预测数据集:Household Electricity Consumption | Kaggle目录数据集简介
好开心啊没烦恼3 天前
开发语言·爬虫·python·数据挖掘·数据分析
Python数据分析:使用爬虫从网页、社交媒体平台、论坛等公开资源提取中文和英文人名。直接上代码。简单正则(如[\u4e00-\u9fa5]{2,4})会误抓: re.findall(r’[\u4e00-\u9fa5]{2,4}', “中国银行宣布马云参加会议”) #输出:[‘中国银行’, ‘宣布’, ‘马云’, ‘参加’, ‘会议’](含大量非人名) 且无法区分人名与普通词汇(如“北京”、“公司”)。
计算机源码社4 天前
大数据·hadoop·机器学习·数据挖掘·spark·毕业设计·课程设计
基于Hadoop的车辆二氧化碳排放量分析与可视化系统|基于Spark的车辆排放量实时监控与预测系统|基于数据挖掘的汽车排放源识别与减排策略系统💕💕作者:计算机源码社 💕💕个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Spark、hadoop、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流! 💕💕学习资料、程序开发、技术解答、文档报告 💕💕如需要源码,可以扫取文章下方二维码联系咨询
罗小罗同学4 天前
人工智能·深度学习·分类·数据挖掘·病理组学·医学人工智能·医工交叉
覆盖9个癌种,基于11671张病理切片训练的模型登上Nature子刊,可精准“读出”分子标志物,突破传统分类局限想象一下,如果你去体检时,医生只告诉你“血压正常”或“血压异常”,却不告诉你具体数值——你无法知道自己是接近正常上限还是严重超标,后续调理也没有精准方向。
nju_spy5 天前
人工智能·机器学习·数学建模·数据挖掘·arima·时间序列预测·相关性分析
2023 美赛C Predicting Wordle Results(上)Wordle规则 猜一个五个字母的单词 六次以内机会:灰色代表正确单词里没有这个字母,黄色代表有这个字母但位置不对,绿色代表位置对。
电商API_180079052475 天前
大数据·数据库·数据挖掘·数据分析
电商数据分析之自动获取数据的技术手段分享在电商行业,数据是驱动业务决策、优化运营策略的核心资产。无论是分析用户消费行为、监控商品销售动态,还是调研竞品市场表现,都需要大量精准、实时的数据支撑。然而,电商数据体量庞大、维度复杂,手动获取数据不仅效率低下,还容易出现误差。因此,掌握自动获取数据的技术手段,成为电商数据分析从业者的必备能力。本文将详细分享当前主流的电商数据自动获取技术,助力从业者高效搭建数据采集体系。
AI悦创|编程1v16 天前
数据仓库·正则表达式·数据挖掘·ai悦创编程一对一教学·python一对一辅导·python一对一教学
00-1-正则表达式学习心得:从入门到上瘾,再到克制你好,我是 Cleland。受悦创的邀请,今天想和你聊聊我学习正则表达式的经历,以及一路走来的一些经验与反思。希望能帮你少走弯路,在学习正则的路上更轻松一些。
tzc_fly6 天前
数据挖掘·数据分析
Genome Biology | scKAN:连接单细胞数据分析与药物发现的可解释架构来自香港理工大学数据科学与人工智能学院的Kay Chen Tan教授团队与中山大学、香港城市大学(东莞)、西北工业大学在基因组学领域顶级期刊 Genome Biology(IF=9.4,中科院一区Top)上发表论文,提出了scKAN架构。博士生何昊淮为第一作者,香港城市大学(东莞)助理教授黄志安与西北工业大学副教授黄裕安为通讯作者。scKAN建立在强可解释性的科尔莫戈罗夫-阿诺德网络(KAN)上,能够系统性地推断细胞特异性的功能基因与基因集,并成功应用于胰腺癌的药物重定位研究,展现了其连接基础研究与临床应