数据挖掘

卷无止境10 小时前
数据挖掘
DuckDB 高效数据处理完全指南如果你还没听说过 DuckDB,那你可能错过了近几年数据工程领域最有意思的一场变局。这个以鸭子命名的嵌入式分析数据库,正在悄悄改变数据从业者处理海量数据的方式——不需要搭集群,不需要配服务器,一个进程、几行 SQL,就能在笔记本上跑完 TB 级别的分析任务。
云和数据.ChenGuang11 小时前
人工智能·深度学习·机器学习·数据挖掘·边缘计算
FastText的核心优势FastText的核心优势在于其子词(subword)机制,能够为未登录词生成合理的向量表示[2][4]。若需强制返回全0向量,需结合以下策略实现:
沪漂阿龙15 小时前
人工智能·数据挖掘·回归
面试题:大模型训练中的思维链 CoT 与长思维链冷启动详解——Chain-of-Thought、Long CoT、拒绝采样、STaR、自回归推理全解析1.1 这道题表面问概念,实际在考推理模型训练主线在大模型面试里,“什么是思维链”看似是一个基础概念题,但它背后其实连接着一整条推理模型训练路线:提示词如何诱导推理、模型如何学习分步解题、长思维链数据怎么冷启动、SFT 和 RL 如何配合、推理过程如何评估,以及上线时如何平衡准确率、延迟和 token 成本。
AI科技星15 小时前
人工智能·算法·数学建模·数据挖掘·机器人
全域数学·球面拓扑微扰标准系数η=0.01 应用详解(典籍正式版)作者:乖乖数学(全域数学公理体系创立人)时间:20260523归属体系:全域数学空间拓扑公理体系大佬,典籍已签收!📜
2zcode16 小时前
目标跟踪·数据挖掘·数据分析·客流量
基于YOLO11的轨道交通车站客流密度实时监测与拥挤预警系统(数据集+UI界面+训练代码+数据分析)摘要:随着城市轨道交通客流量的不断增加,车站内的拥挤状况已成为影响乘客安全和出行体验的关键因素。为了实现对车站内客流密度的实时监控与拥挤预警,本研究提出了一种基于YOLO11目标检测模型的智能监测系统。该系统通过对车站监控视频进行实时处理,采用YOLO11模型对车站内的乘客进行精确识别与计数,并计算每个区域的客流密度。
jerryinwuhan17 小时前
分类·数据挖掘·聚类
面向校园场景的网络舆情文本分类、情感分析与聚类预警系统舆情系统总模板:CodeAsPoetry/PublicOpinion 这个项目本身就是舆情分析系统,包含爬虫、数据清洗、文本摘要、主题分类、情感倾向识别、可视化,适合拿来改整体框架。(GitHub)
哩哩橙18 小时前
人工智能·笔记·数据挖掘
分支电路对限时电流速断保护的影响目录仿真模型理论分析仿真分析整定任务整定计算电力系统的仿真模型继电保护的仿真模型仿真结果及分析具体程序和仿真模型见:
babe小鑫19 小时前
数据挖掘·数据分析
2026数学专业人才发展学数据分析的价值数学专业人才具备扎实的逻辑思维和建模能力,这些技能在数据分析领域具有显著优势。数据分析依赖于统计学、线性代数和优化理论,这些都是数学专业的核心课程。数学背景的人才能够更深入地理解算法原理,开发高效的数据处理模型。
2zcode20 小时前
数据挖掘·数据分析
基于YOLO11的人员异常行为检测与识别智能安防监控系统(数据集+UI界面+训练代码+数据分析)摘要:随着人工智能技术的发展,基于计算机视觉的行为检测系统逐渐成为公共安全领域的重要工具。本研究提出了一种基于YOLOv11模型的行为异常检测与智能识别系统。该系统能够实时监控公共场所中的员工行为,通过视频监控和图像识别技术,识别四种主要的异常行为:涉嫌打架、涉嫌斗殴、涉嫌抢劫和涉嫌盗窃。系统采用YOLOv11进行目标检测,结合多种数据处理方法进行异常行为识别,并通过语音告警和邮件告警系统及时通知相关人员,确保安全事件得到快速响应。
SimpleLearingAI1 天前
算法·数据挖掘·聚类
聚类算法详解聚类算法作为无监督学习的核心分支,就像一位“智能分类师”,能在没有标签的数据集里,自动把相似的对象归为一类,把不同的对象分开。它广泛应用于客户分群、图像分割、异常检测等场景,接下来我们用通俗易懂的方式拆解常见聚类算法的原理、例子和代码实现。
源码之家2 天前
大数据·python·数据挖掘·数据分析·django·lstm·课程设计
计算机毕业设计:Pyhon健康数据分析系统 Django框架 数据分析 可视化 身体数据分析 大数据(建议收藏)✅博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
Fleshy数模2 天前
人工智能·数据挖掘·langchain·大模型
基于 LangChain 实现 PDF 文档检索:从加载到向量检索全流程在大模型应用开发中,文档检索是核心能力之一,尤其是针对 PDF 这类非结构化文档的精准检索,能极大提升问答、知识库等场景的体验。本文将基于 LangChain 框架,完整拆解从 PDF 文档加载、文本分割、向量嵌入到相似性检索的全流程,手把手教你实现针对 PDF 文档的智能检索。
YangYang9YangYan2 天前
学习·数据挖掘·数据分析
2026运营岗位学习数据分析对于提升个人能力的价值证书优势(1)提升数据分析能力CDA 认证涵盖了数据分析的各个方面,包括数据采集、处理、分析和可视化等。通过 CDA 认证的学习和考试,可以系统地掌握数据分析的知识和技能,提升自己在数据分析方面的能力。
redgxp2 天前
人工智能·机器学习·数据挖掘
启发式算法WebApp实验室:从搜索策略到群体智能的能力进阶(七)在复杂优化问题中,我们往往面对一个根本性困境:问题可以形式化,但最优解难以在可接受时间内获得例如:这些问题具有共同特征:
babe小鑫2 天前
学习·数据挖掘·数据分析
2026年IT行业学习数据分析的价值证书优势(1)提升数据分析能力CDA 认证涵盖了数据分析的各个方面,包括数据采集、处理、分析和可视化等。通过 CDA 认证的学习和考试,可以系统地掌握数据分析的知识和技能,提升自己在数据分析方面的能力。
AI科技星2 天前
人工智能·算法·数学建模·数据挖掘·机器人
全域数学·体积与表面积通项定理【乖乖数学】定理编号:GM-GenForm-20260520作者:乖乖数学成文时间:2026 年 5 月 20 日
YangYang9YangYan2 天前
学习·数据挖掘·数据分析
2026出纳岗位学习数据分析的价值企业财务流程正加速向数字化、智能化转型,传统手工操作逐渐被自动化工具替代。出纳岗位从基础资金收付转向数据驱动的决策支持角色,需掌握数据清洗、分析及可视化能力。例如,银行流水自动匹配、电子发票管理等技术普及,要求出纳人员能处理结构化与非结构化数据。
前端小超人rui2 天前
人工智能·分类·数据挖掘·ai 大模型
AI分类及AI大模型分类AI的核心目标是让机器能够执行通常需要人类智能的任务,例如语言理解、突袭图像图识别、复杂问题解决等。
沪漂阿龙2 天前
人工智能·数据挖掘·回归·transformer
面试题:大模型基础详解——什么是大模型、核心特点、生成式大模型、自回归训练目标、参数单位、缺点与 Transformer 原理全解析1.1 先用一句通俗的话解释“大模型”大模型,通常指的是参数规模很大、训练数据很多、训练算力消耗也非常大的通用模型。它不只是为了做单一任务而训练出来的,而是希望先通过大规模预训练学到通用能力,再通过提示词、微调或者对齐方法,把能力迁移到很多不同任务上。
泰迪智能科技012 天前
人工智能·数据挖掘
分享|企业数据挖掘平台从“平台工具”到“育人生态”企业数据挖掘平台是面向高校大数据相关专业课程教学与实训的核心工具,其设计理念在于降低技术门槛、强化工程思维、贯通教学实训就业链条。 平台无需编程,通过拖拽的方式进行操作,以流程化的方式将数据源、统计分析、数据清洗、数据处理等环节进行连接,帮助学生快速熟悉分类、回归、聚类、时序、关联规则等算法及其输入、输出、参数等内容,达成数据分析目的。同时,平台支持查看代码与修改源码,由浅入深地实现对代码的熟悉,不仅帮助学生建立工程化思维,了解不同大数据挖掘建模流程,也帮助教师减少算法课程的备课成本。