数据挖掘

kcuwu.12 小时前
人工智能·分类·数据挖掘
FastText文本分类全流程实战技术博客FastText 是 Facebook AI Research 于 2016 年开源的一款高效文本分类和词向量学习工具。它以极快的训练速度和出色的分类效果著称,特别适合工业级大规模文本分类场景。
isNotNullX12 小时前
大数据·数据挖掘·数据分析
大数据项目4大核心环节详解:数据采集、数据处理、数据存储、数据分析最近和几位做技术的朋友聊天,发现不少公司大数据项目推进困难:数据团队加班加点搭建的平台,业务部门却不怎么用。
ZHW_AI课题组12 小时前
人工智能·数据挖掘·回归
基于XGBoost的鸢尾花花瓣长度回归预测1.作者介绍 郭焱琳 女 西安工程大学电子信息学院,2025级研究生 研究方向:模式识别与人工智能 电子邮件:250412112@stu.xpu.edu.cn
哈伦201913 小时前
数据挖掘·汽车·聚类
第十章 聚类 案例:汽车款式聚类本案例的数据基于R语言 ISLR 包中的Auto数据集,数据集中共有392个样本, 8个特征,根据每种汽车的参数,利用聚类算法来进行聚类,识别出相似的汽车。
【建模先锋】14 小时前
人工智能·深度学习·分类·数据挖掘·信号处理·故障诊断·降噪算法
强噪声故障诊断新思路!从频域降噪到故障分类:FusADFaultClassifier 自适应谱降噪分类模型详解Python轴承故障诊断 (14)高创新故障识别模型-CSDN博客独家原创 | SCI 1区 高创新轴承故障诊断模型!-CSDN博客
chatexcel14 小时前
数据挖掘·数据分析
ChatExcel Max 2.0发布:支持公式样式保留与无限制文件数据分析北大团队的 ChatExcel Max 迎来重磅升级!能接数据、懂规则、能分析、能审核、能生成结果并可安全部署,成为您的 AI 数据员工。
醒醒该学习了!14 小时前
人工智能·数据挖掘·数据分析
AI数据分析应用就像大厨做饭得先备菜一样,AI分析数据也得按流程来。数据收集,比如想分析电商销量,就得把订单时间、商品类别、价格这些“食材”捞出来,这里可以用Python的pandas库写句df=pd.read_csv('电商订单.csv')先把数据读进表格里。
qqxhb15 小时前
人工智能·数据挖掘·回归·覆盖率·命中率·正确性
36|RAG 评测与回归:命中率、覆盖率、引用正确性到上一篇为止,你的 RAG(检索增强生成)系统已经跑通了。你随机问了几个问题,发现它答得还不错,于是准备满心欢喜地向老板汇报上线。 等一下!
高洁011 天前
人工智能·数据挖掘·transformer·virtualenv·知识图谱
大模型落地行业第一线大模型落地行业第一线一、 金融行业:智能风控与投顾助手 二、 医疗健康:从辅助诊断到患者管理 三、 制造业:知识助手与工艺优化 四、 教育行业:个性化助教与内容生成 五、 政务与客服:提升效率与可及性
白玉cfc1 天前
ios·分类·数据挖掘
【iOS】底层原理:分类、扩展和关联对象打开 objc 源码,找到分类的底层结构 _category_t:有方法列表、协议列表、属性列表——但没有 ivar 数组。这是分类不能添加成员变量的直接原因(结构体层面)
yingjie1102 天前
机器学习·数据挖掘·聚类
Scanpy 单细胞转录组分析完整流程(上):从原始数据到细胞聚类单细胞转录组测序(scRNA-seq)是当前生物医学研究中最热门的技术之一。从肿瘤微环境解析到发育轨迹追踪,scRNA-seq 已经成为高水平论文的标配。本文用 Scanpy(Python) 带你走完单细胞分析的前半程——从数据读取到降维聚类。
zxsz_com_cn2 天前
人工智能·数据挖掘
工厂中需要预测性维护的关键设备在现代化工厂中,设备的高效运行直接影响生产效率和成本控制。预测性维护(PdM)通过实时监测设备状态,提前发现潜在故障,从而避免非计划停机。以下设备尤其需要预测性维护:
汽车仪器仪表相关领域2 天前
运维·服务器·网络·数据挖掘·数据分析·单元测试·集成测试
Kvaser Hybrid CAN/LIN 单通道三合一总线分析仪:高性价比CAN FD/LIN集成测试利器在汽车车身电子研发、车载故障诊断、工业总线调试、高校科研教学、实验室数据标定等轻量化测试场景中,兼顾多协议兼容、高速传输、精准采样、稳定抗干扰、低成本部署是行业刚需。市面上多数入门级总线设备普遍存在功能单一、高速协议适配差、数据采样精度低、工业环境稳定性不足等问题,要么需采购多台设备适配CAN、LIN不同总线,要么性能不达标无法满足现代化CAN FD测试需求,大幅拉高企业研发与测试成本。
KaMeidebaby2 天前
服务器·前端·数据库·人工智能·算法·数据挖掘·数据分析
卡梅德生物技术快报|基因测序技术在 46,XY 性发育障碍变异筛查中的流程与数据分析在生物信息学与临床分子遗传实操领域,46,XY 性发育障碍的基因变异筛查是儿科生信分析的典型应用场景。生信实操与实验人员常面临多重技术痛点:基因测序技术建库与测序参数把控难度大,DNA 片段破碎长度、文库质控不达标会直接导致变异漏检;测序原始数据格式转换、基因组比对流程繁琐,软件参数设置缺乏标准化规范;变异位点筛选注释规则不统一,易出现假阳性、假阴性结果;高频致病基因 SRY、NR5A1、AR 的变异特征缺乏系统性生信分析模板;传统单基因生信分析方法无法适配多基因高通量测序数据,数据分析效率低下。同时,如
帅次3 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理·数据挖掘·知识图谱
AI数字营销实战测评:CSDN AI智选主题如何提升技术博客创作效率与质量?在AI数字营销创作中,选题是决定文章方向和受众吸引力的第一步。CSDN的AI智选主题功能提供了两种高效的选题方式:
FL16238631293 天前
人工智能·分类·数据挖掘
窗户干净脏污分类窗户清洁状态分类数据集3299张2类别已划分训练验证测试集数据集类型:图像分类用,不可用于目标检测无标注文件数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片
Quincy_Freak3 天前
大数据·数据库·数据挖掘·数据分析·aarch64
银河麒麟aarch64如何高效做数据分析?分享一款内网离线数据分析利器现在大部分政企单位都已经全面普及银河麒麟、统信UOS等国产操作系统,而且很多新采购设备基本都是 aarch64(ARM64)架构。
计算机安禾4 天前
大数据·人工智能·算法·机器学习·数据挖掘·剪枝
【算法分析与设计】第21篇:回溯法的状态空间树与剪枝函数设计当我们面对一个不存在多项式时间精确算法的NP困难问题时,若输入规模尚可接受,一种直接而有效的策略是系统地搜索整个解空间。但“系统”绝非“蛮力”——n个元素的排列有n!种,n个布尔变量的赋值有2^n种,完全枚举在n稍大时便不可行。回溯法的核心智慧在于:一边走,一边看,走不通立刻回头。它将搜索过程组织成一棵树的生长,并在生长过程中及时砍掉注定不含解的枝条,从而将指数级的搜索压缩到可操作的范围。
DisonTangor4 天前
人工智能·语言模型·数据挖掘·开源·aigc
跃阶星辰开源Step 3.7 Flash:原生多模态,最高生成速度400 Tokens/sStep 3.7 Flash 是一个拥有 198B 参数的稀疏专家混合模型,它结合了一个 196B 参数的语言主干网络和一个 1.8B 参数的视觉编码器,以实现原生图像理解。该模型专为高频生产工作负载而设计,每个令牌激活约 110 亿个参数,吞吐量高达每秒 400 个令牌。Step 3.7 Flash 支持 256k 上下文窗口,并提供三种可选的推理级别,让开发者可以轻松在速度、成本和认知深度之间取得平衡。
weixin_468466854 天前
人工智能·深度学习·ai·分类·数据挖掘·图像分类·模型部署
图像分类技术落地应用与实战指南在电商大促期间,面对海量新增 SKU,运营团队往往需要耗费数天时间手动分类商品属性并上架,不仅效率低下,还容易出现归类错误导致流量流失。而在医疗领域,放射科医生每天要审阅成百上千张影像片子,长时间的高强度工作难免产生视觉疲劳,细微的病灶极易被漏诊。这些看似截然不同的行业痛点,背后其实都指向同一个技术突破口:利用计算机视觉与深度学习技术,让机器具备“看”和“判断”的能力。