数据挖掘

liu****1 小时前
人工智能·深度学习·神经网络·算法·数据挖掘·回归
神经网络基础深度学习神经网络就是大脑仿生,数据从输入到输出经过一层一层的神经元产生预测值的过程就是前向传播(也叫正向传播)。
张小凡vip1 小时前
人工智能·jupyter·数据挖掘
数据挖掘(三) ----- JupyterHub与Jupyter Notebook的区别和安装JupyterHub详细介绍 JupyterHub 和 Jupyter Notebook 的核心区别,以及 JupyterHub 安装指南。
muddjsv2 小时前
数据挖掘·数据分析
从数据到决策:数据分析的通用范式及其在工业与学术领域的核心价值在数据洪流席卷各行各业的今天,数据分析早已不是 “技术人员的专属技能”,而是贯穿学术研究突破与工业生产革新的核心方法论。它像一把精准的手术刀,剥离数据表象的杂乱,挖掘隐藏的规律与价值。而支撑这一过程的,正是一套经过实践检验的通用分析范式—— 这套范式不仅是确保分析工作严谨性的 “骨架”,更是连接数据与决策、理论与实践的桥梁。
十三画者2 小时前
人工智能·深度学习·语言模型·数据挖掘·数据分析
【文献分享】LyMOI一种结合深度学习和大规模语言模型的用于解读组学数据的工作流程通过对海量组学数据进行分子全景分析,可以识别细胞中的调控网络,但还需要进行机制解读和实验验证。在此,我们结合深度学习和大型语言模型推理,开发了一种用于组学解读的混合工作流程,称为 LyMOI。LyMOI 采用了 GPT-3.5 来进行生物学知识推理,并使用了一个包含图卷积网络(GCN)的大型图模型。该大型图模型整合了进化上保守的蛋白质相互作用,并通过分层微调从多组学数据中预测特定环境下的分子调节因子。然后,GPT-3.5 生成机器的推理链(CoT),以机制上解读其在生物系统中的作用。以自噬为例,LyMOI
张小凡vip2 小时前
人工智能·jupyter·数据挖掘
数据挖掘(二) ----- Jupyter Notebook使用示例和常见问题Jupyter Notebook 是一个开源的 Web 应用程序,允许创建和共享包含实时代码、方程式、可视化和文本的文档。它广泛应用于数据清理和转换、数值模拟、统计建模、数据可视化、机器学习等领域。
飞Link3 小时前
python·重构·数据挖掘
数据增强中的数据标注、数据重构、协同标注和非LLM驱动的增强在人工智能(AI)和机器学习(ML)领域,数据增强(Data Augmentation)已经成为提高模型性能和泛化能力的关键技术之一。通过对训练数据进行合成或扩展,模型可以从更多样化的输入数据中学习,从而减少过拟合,提高在实际应用中的表现。在数据增强的过程中,数据标注(Data Labeling)、数据重构(Data Reformation)、**协同标注(Co-Annotation)和非LLM驱动的增强(Non LLM-Driven)**等方法是提升训练集质量的重要手段。本文将深入探讨这些方法的概念、原
小飞象—木兮3 小时前
信息可视化·数据挖掘·数据分析
《商业分析标准实践手册》:定义、价值、商业思维模型与商业分析能力及实操手册···(附相关材料下载)木木自由,专注更多数据分析,经营分析、财务分析、商业分析、数据治理、数据要素、数据资产干货以及资料分享
自学不成才12 小时前
c++·python·算法·数据挖掘
深度复盘:一次flutter应用基于内存取证的黑盒加密破解实录并完善算法推理助手本篇文章不是代码的堆砌,而是对我整个逆向工程思维过程的深度剖析。它记录了我如何从数学原理出发,通过现象观察建立假设,在错误的道路(AES)上碰壁,最终通过取证分析锁定真凶(RC4),并利用内存碰撞完成绝杀的完整逻辑链。
lambo mercy15 小时前
人工智能·数据挖掘·回归
自回归生成任务输入输出长度不匹配的模型输出翻译任务(如 “我爱中国” 对应输出 “I love China”,输入(4 个汉字)与输出(3 个英文单词)长度不同)。
飞Link16 小时前
大数据·数据挖掘·spark
【大数据】SparkSQL常用操作SparkSQL 是 Spark 提供的一个 SQL 查询接口,用于处理结构化数据。它支持 SQL 查询和 DataFrame API,可以在分布式环境下对大量数据进行高效处理。SparkSQL 支持丰富的 SQL 语法和功能,包括数据查询、聚合、分组、去重、连接等操作,是 Spark 进行大数据处理时的重要模块。
qwerasda12385217 小时前
人工智能·分类·数据挖掘
基于RetinaNet的校园建筑物识别与分类系统研究_1嘿,小伙伴们!今天我们来聊聊计算机视觉领域最火的检测框架——YOLO系列!从2015年YOLOv1横空出世,到现在的YOLOv13,这个家族可是经历了无数次的进化呢~🎉 让我们一起来看看这些模型到底有什么魔力吧!
高洁0118 小时前
人工智能·深度学习·算法·数据挖掘·知识图谱
AI智能体搭建(3)AI智能体搭建(3)深度搜索智能体 如何搭建与设计 Agent#智能体搭建#多智能体#VLA#大模型#AI#LLM#Transformer 架构#AI
龙腾AI白云21 小时前
数据挖掘
AI智能体搭建(2)Embedding模型什么是AI Agent优秀智能体范例#人工智能#具身智能#VLA#大模型AI智能体搭建(2)Embedding模型 什么是AI Agent 优秀智能体范例#人工智能#具身智能#VLA#大模型
YangYang9YangYan21 小时前
大数据·数据挖掘·数据分析
2026高职大数据与财务管理专业学数据分析的技术价值分析大数据与财务管理专业的交叉性体现在数据科学与财务管理的深度融合。企业财务数字化转型加速,从传统手工记账转向自动化、智能化的数据驱动决策。根据行业调研,超过70%的财务岗位要求候选人具备基础数据分析能力,如SQL查询或可视化工具操作。
桓峰基因21 小时前
人工智能·机器学习·数据挖掘·数据分析
桓峰基因临床数据分析及机器学习预测模型构建教程Topic 1.临床标志物生信分析常规思路Topic 2.生存分析(Kaplan-Meier)Topic 3.SCI文章第一张表格之基线表格
永远都不秃头的程序员(互关)1 天前
数据挖掘
数组与std::vector深度解析:原理+手写实现+实战避坑大家好,作为大三学生,我分享动态数组相关干货:静态数组占连续内存但大小固定有缺陷,动态数组通过翻倍扩容+内存拷贝解决该问题;我们能手动实现含插入、删除、扩容的简易动态数组类;STL的std::vector要掌握初始化、访问、容量操作,同时留意使用中的避坑点。
AAD555888991 天前
人工智能·分类·数据挖掘
【电力设备检测】YOLO11-LQEHead绝缘子缺陷检测与分类系统实现本文其实没啥有价值的干货,也就是对看过的博客和资料的整理,记录下来,相当给自己梳理一遍,供参考~(PS:深感文字能力真的好差,还好该文只是资料整理而已(# ̄~ ̄#) 各位看官见谅… 写作真得需要经常锻炼才行QAQ…)
飞Link1 天前
算法·数据挖掘
数据合成中的通用模型蒸馏、领域模型蒸馏和模型自我提升在人工智能(AI)领域,数据合成(Data Synthesis)是提高机器学习模型性能的重要手段之一。数据合成不仅能够有效地扩展训练数据集,降低数据收集成本,还能提升模型的泛化能力。在数据合成的过程中,模型蒸馏(Model Distillation)作为一种强有力的技术,通过将知识从一个大型复杂模型传递到一个较小的模型中,起到了加速训练和提升模型效果的作用。本文将重点讲解数据合成中的三种重要蒸馏方法:General Model Distillation(通用模型蒸馏)、Domain Model Disti
CoookeCola1 天前
数据仓库·人工智能·目标检测·计算机视觉·数据挖掘
从人脸检测到音频偏移:基于SyncNet的音视频偏移计算与人脸轨迹追踪技术解析项目聚焦于音频 - 视频同步(检测音视频时间偏移、判定多人脸视频中的说话人),代码中音视频特征提取、偏移计算、多人脸追踪 / 裁剪等逻辑均与该仓库一致;
努力犯错1 天前
机器学习·数据挖掘·回归·开源
GLM-Image:首个开源工业级自回归图像生成模型完全指南2026年1月14日,智谱AI发布了GLM-Image,这标志着AI图像生成技术的重要里程碑。这个突破性的模型是首个开源的工业级离散自回归图像生成系统,结合了90亿参数的自回归模块和70亿参数的扩散解码器,在文本渲染和知识密集型场景中表现出色。