数据挖掘

龙腾AI白云25 分钟前
深度学习·数据挖掘
具身智能-普通LLM智能体与具身智能:从语言理解到自主行动一、普通LLM智能体的本质 二、普通LLM智能体的应用 示例:中国企业中普通LLM智能体的应用——智能客服系统
Learn Beyond Limits5 小时前
人工智能·python·神经网络·机器学习·ai·数据挖掘
Correlation vs Cosine vs Euclidean Distance|相关性vs余弦相似度vs欧氏距离-----------------------------------------------------------------------------------------------
KKKlucifer13 小时前
人工智能·分类·数据挖掘
2025 国产化数据分类分级工具实测:国产化适配、多模态识别与动态分级能力深度解析随着《网络数据安全管理条例》正式施行与 GB/T 43697-2024《数据安全技术 数据分类分级规则》的落地实施,数据分类分级已成为企业数据安全合规的核心基础。在国产化替代进入深水区的背景下,工具不仅需满足 "芯 - 云 - 边 - 端" 全栈适配要求,更要应对数据多模态爆发、实时流转的业务挑战 —— 传统静态规则驱动的产品已难以解决非结构化数据识别、增量数据分级滞后等痛点。
韩立学长15 小时前
数据挖掘·数据分析
【开题答辩实录分享】以《重庆旅游景点数据分析与可视化》为例进行答辩实录分享大家好,我是韩立。写代码、跑算法、做产品,从 Java、PHP、Python 到 Golang、小程序、安卓,全栈都玩;带项目、讲答辩、做文档,也懂降重技巧。 这些年一直在帮同学定制系统、梳理论文、模拟开题,积累了不少“避坑”经验。
qqxhb15 小时前
重构·数据挖掘·数据分析·多模态·mcp
零基础MCP——第5章编程实战基础(网页、数据分析、调试与重构)本章以实战为导向,围绕五类高频任务(网页原型、数据分析、调试修复、重构优化、文档注释)给出“从需求到验收”的端到端流程:包括提示词模板、落地代码片段、验证清单与常见陷阱。你可以将本章内容直接用于日常开发与教学演练。
京东零售技术19 小时前
数据挖掘
【原理到实战】实验异质性分析当我们看到如下实验平台指标结果时在进行分析前,可能我们的第一直觉是这样的经过异质性分析后,可能会发现实际情况是这样的
龙腾AI白云21 小时前
深度学习·数据挖掘
具身智能-高层任务规划(High-level Task Planning)具身智能-高层任务规划(High-level Task Planning) 一、概述 二、标准化规划 2.1 结构语言规划 2.2 策略代码规划 2.3 自然语言规划 三、辅助规划 3.1 视觉辅助规划 3.2 先验知识规划 3.3 反馈规划
zenRRan1 天前
人工智能·机器学习·语言模型·数据挖掘·回归
英伟达提出“思考用扩散,说话用自回归”:实现语言模型效率与质量的双赢!近年来,大型语言模型(LLMs)在自然语言处理任务中取得了突破性进展,但其生成效率仍面临严峻挑战。主流的自回归(AR)模型在生成文本时只能逐词输出,导致 GPU 计算资源利用率低,生成速度受内存带宽限制。另一方面,扩散语言模型(dLMs)支持并行生成多个词,理论上能大幅提升吞吐量,但往往以牺牲生成质量为代价。这种“效率与质量不可兼得”的困境,成为制约语言模型实际应用的关键瓶颈。
EAIReport1 天前
人工智能·数据挖掘·数据分析
企业人力资源管理数据分析:离职因素与群体特征研究在当今企业管理中,人力资源数据分析已成为优化管理决策的关键环节。一个完整的人力资源数据分析流程通常包括数据收集、数据清洗与预处理、数据分析、可视化呈现和决策应用等步骤。从企业发展战略出发,通过组织结构设置和工作分析,确定关键指标,进而展开各项人力资源模块的分析,其中离职率分析是重要的组成部分。
x***J3481 天前
docker·容器·数据挖掘
Docker数据挖掘开发先说说为啥非要用Docker。传统开发最头疼的就是环境问题,你本地调试好好的代码,放到服务器就各种报错。CUDA版本不对,numpy版本冲突,甚至系统编码都能坑你半天。Docker把整个环境打包成镜像,从操作系统到Python解释器,从依赖库到配置文件,全部封装在一起。这样无论在本地还是云端,跑出来的结果完全一致。
泰迪智能科技011 天前
人工智能·数据挖掘
数据挖掘平台建设案例分享——长春大学在大数据浪潮席卷千行百业的今天,如何培养出既能掌握理论、又精通实践的复合型数据人才,成为高校面临的紧迫课题。长春大学前瞻布局,重磅打造大数据挖掘建模平台,以先进的实训环境破解教学难题,为大数据相关专业学子构筑起从课堂通向产业的坚实桥梁。
~~李木子~~1 天前
人工智能·分类·数据挖掘
中文垃圾短信分类实验报告随着移动通信技术的快速发展,垃圾短信问题日益严重。本项目旨在利用深度学习技术构建一个高效的中文垃圾短信分类系统,能够自动识别和过滤垃圾短信,提升用户体验。
xuehaikj2 天前
yolo·数据挖掘
香烟品牌识别与分类:yolov5-LSKNet模型应用🚬 香烟品牌识别与分类是计算机视觉在零售行业的重要应用,通过YOLOv5-LSKNet模型实现高效准确的品牌识别,可直接运行注释清晰~Python
马拉萨的春天2 天前
ios·分类·数据挖掘
iOS的分类中为什么不能添加变量以及如何设置关联对象的弱引用效果简单来说,分类(Category)在设计的初衷是为了给现有类添加方法,而不是为了扩展实例变量。下面我们从技术层面深入解析为什么不能直接添加变量,以及如何间接实现类似功能。
q***31892 天前
爬虫·数据挖掘·数据分析
爬虫基础之爬取某基金网站+数据分析声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
Q26433650232 天前
大数据·hadoop·python·机器学习·数据挖掘·spark·课程设计
【有源码】基于Python的睡眠压力监测分析系统-基于Spark数据挖掘的睡眠压力动态可视化分析系统注意:该项目只展示部分功能,如需了解,文末咨询即可。发语言:python 采用技术:Spark、Hadoop、Django、Vue、Echarts等技术框架 数据库:MySQL 开发环境:PyCharm
笨鸟笃行2 天前
人工智能·数据挖掘·数据分析
数据分析基础——数据清洗想象你在菜市场买了一筐西红柿,里面夹着:烂叶子(缺失值)烂番茄(异常值)贴了两层标签(重复数据)有的写“番茄”,有的写“西红柿”(单位/格式不统一)
电商API_180079052473 天前
大数据·性能优化·数据挖掘·数据分析·网络爬虫
淘宝商品详情 API 性能优化秘籍:QPS 提升 5 倍的技术方案在电商系统中,淘宝商品详情 API(taobao.item.get)是数据流转的核心枢纽 —— 无论是商品展示、竞品分析还是定价决策,都依赖其稳定高效的数据输出。但实际应用中,多数开发者会面临 QPS 瓶颈(默认单账号 QPS 通常为 100-500)、响应超时(平均 200-500ms)、并发阻塞等问题,直接影响系统可用性。
腾讯WeTest3 天前
人工智能·分类·数据挖掘
Al in CrashSight ——基于AI优化异常堆栈分类模型CrashSight在进行异常问题分组时,经常会由于一些特殊case导致无法聚合在一起,如堆栈里面包含uuid,玩家姓名等,从而产生大量重复issue,给用户带来不必要的干扰,同时海量的issue也影响了页面查询性能。另外,崩溃issue分组场景下,由于一些通用堆栈行的干扰,传统的分组算法有时会将实际不同的issue识别成相同issue,影响问题追踪精准度。因此,CrashSight团队引入用LLM大模型驱动的问题分组方法,带来更智能化的问题分组体验。
龙腾AI白云3 天前
深度学习·数据挖掘
国内外具身智能VLA模型深度解析(3)国内外具身智能VLA模型深度解析(3) 国内典型具身智能VLA模型 1.星动纪元 —— ERA-42 2)模型训练