数据挖掘

zenRRan1 小时前
人工智能·机器学习·语言模型·数据挖掘·回归
英伟达提出“思考用扩散,说话用自回归”:实现语言模型效率与质量的双赢!近年来,大型语言模型(LLMs)在自然语言处理任务中取得了突破性进展,但其生成效率仍面临严峻挑战。主流的自回归(AR)模型在生成文本时只能逐词输出,导致 GPU 计算资源利用率低,生成速度受内存带宽限制。另一方面,扩散语言模型(dLMs)支持并行生成多个词,理论上能大幅提升吞吐量,但往往以牺牲生成质量为代价。这种“效率与质量不可兼得”的困境,成为制约语言模型实际应用的关键瓶颈。
EAIReport2 小时前
人工智能·数据挖掘·数据分析
企业人力资源管理数据分析:离职因素与群体特征研究在当今企业管理中,人力资源数据分析已成为优化管理决策的关键环节。一个完整的人力资源数据分析流程通常包括数据收集、数据清洗与预处理、数据分析、可视化呈现和决策应用等步骤。从企业发展战略出发,通过组织结构设置和工作分析,确定关键指标,进而展开各项人力资源模块的分析,其中离职率分析是重要的组成部分。
x***J3482 小时前
docker·容器·数据挖掘
Docker数据挖掘开发先说说为啥非要用Docker。传统开发最头疼的就是环境问题,你本地调试好好的代码,放到服务器就各种报错。CUDA版本不对,numpy版本冲突,甚至系统编码都能坑你半天。Docker把整个环境打包成镜像,从操作系统到Python解释器,从依赖库到配置文件,全部封装在一起。这样无论在本地还是云端,跑出来的结果完全一致。
泰迪智能科技012 小时前
人工智能·数据挖掘
数据挖掘平台建设案例分享——长春大学在大数据浪潮席卷千行百业的今天,如何培养出既能掌握理论、又精通实践的复合型数据人才,成为高校面临的紧迫课题。长春大学前瞻布局,重磅打造大数据挖掘建模平台,以先进的实训环境破解教学难题,为大数据相关专业学子构筑起从课堂通向产业的坚实桥梁。
~~李木子~~7 小时前
人工智能·分类·数据挖掘
中文垃圾短信分类实验报告随着移动通信技术的快速发展,垃圾短信问题日益严重。本项目旨在利用深度学习技术构建一个高效的中文垃圾短信分类系统,能够自动识别和过滤垃圾短信,提升用户体验。
xuehaikj15 小时前
yolo·数据挖掘
香烟品牌识别与分类:yolov5-LSKNet模型应用🚬 香烟品牌识别与分类是计算机视觉在零售行业的重要应用,通过YOLOv5-LSKNet模型实现高效准确的品牌识别,可直接运行注释清晰~Python
马拉萨的春天1 天前
ios·分类·数据挖掘
iOS的分类中为什么不能添加变量以及如何设置关联对象的弱引用效果简单来说,分类(Category)在设计的初衷是为了给现有类添加方法,而不是为了扩展实例变量。下面我们从技术层面深入解析为什么不能直接添加变量,以及如何间接实现类似功能。
q***31891 天前
爬虫·数据挖掘·数据分析
爬虫基础之爬取某基金网站+数据分析声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
Q26433650231 天前
大数据·hadoop·python·机器学习·数据挖掘·spark·课程设计
【有源码】基于Python的睡眠压力监测分析系统-基于Spark数据挖掘的睡眠压力动态可视化分析系统注意:该项目只展示部分功能,如需了解,文末咨询即可。发语言:python 采用技术:Spark、Hadoop、Django、Vue、Echarts等技术框架 数据库:MySQL 开发环境:PyCharm
笨鸟笃行1 天前
人工智能·数据挖掘·数据分析
数据分析基础——数据清洗想象你在菜市场买了一筐西红柿,里面夹着:烂叶子(缺失值)烂番茄(异常值)贴了两层标签(重复数据)有的写“番茄”,有的写“西红柿”(单位/格式不统一)
电商API_180079052472 天前
大数据·性能优化·数据挖掘·数据分析·网络爬虫
淘宝商品详情 API 性能优化秘籍:QPS 提升 5 倍的技术方案在电商系统中,淘宝商品详情 API(taobao.item.get)是数据流转的核心枢纽 —— 无论是商品展示、竞品分析还是定价决策,都依赖其稳定高效的数据输出。但实际应用中,多数开发者会面临 QPS 瓶颈(默认单账号 QPS 通常为 100-500)、响应超时(平均 200-500ms)、并发阻塞等问题,直接影响系统可用性。
腾讯WeTest2 天前
人工智能·分类·数据挖掘
Al in CrashSight ——基于AI优化异常堆栈分类模型CrashSight在进行异常问题分组时,经常会由于一些特殊case导致无法聚合在一起,如堆栈里面包含uuid,玩家姓名等,从而产生大量重复issue,给用户带来不必要的干扰,同时海量的issue也影响了页面查询性能。另外,崩溃issue分组场景下,由于一些通用堆栈行的干扰,传统的分组算法有时会将实际不同的issue识别成相同issue,影响问题追踪精准度。因此,CrashSight团队引入用LLM大模型驱动的问题分组方法,带来更智能化的问题分组体验。
龙腾AI白云2 天前
深度学习·数据挖掘
国内外具身智能VLA模型深度解析(3)国内外具身智能VLA模型深度解析(3) 国内典型具身智能VLA模型 1.星动纪元 —— ERA-42 2)模型训练
xuehaikj2 天前
人工智能·数据挖掘
文档类型识别与分类_yolo13-C3k2-SFSConv实现详解在计算机视觉领域,文档识别与分类是一项重要且具有挑战性的任务。随着深度学习技术的发展,基于目标检测的方法在文档处理中取得了显著成果。本文将详细介绍yolo13模型中C3k2-SFSConv模块的实现原理及其在文档识别任务中的应用。
蒋星熠2 天前
大数据·python·数据挖掘·数据分析·需求分析
实证分析:数据驱动决策的技术实践指南🌟 Hello,我是蒋星熠Jaxonic! 🌈 在浩瀚无垠的技术宇宙中,我是一名执着的星际旅人,用代码绘制探索的轨迹。 🚀 每一个算法都是我点燃的推进器,每一行代码都是我航行的星图。 🔭 每一次性能优化都是我的天文望远镜,每一次架构设计都是我的引力弹弓。 🎻 在数字世界的协奏曲中,我既是作曲家也是首席乐手。让我们携手,在二进制星河中谱写属于极客的壮丽诗篇!
谅望者3 天前
大数据·数据库·笔记·python·数据挖掘·数据分析
数据分析笔记14:Python文件操作计算机只能识别0和1,而人类使用文字、字母、符号。编码是将两者之间进行转换的机制。编码流程: 人类语言(汉字/字母) → [编码] → 机器语言(0101) 机器语言(0101) → [解码] → 人类语言(汉字/字母)
思通数科人工智能大模型3 天前
人工智能·目标检测·计算机视觉·数据挖掘·知识图谱·零售
零售场景下的数智店商:解决盗损问题,化解隐性成本痛点在零售行业,盗损问题始终是商家挥之不去的痛点。无论是顾客在生鲜区将进口水果藏入背包的偷盗行为,还是在化妆品区随意撕开试用装的违规拆包,亦或是电子产品区因意外碰撞导致商品损坏,这些隐性损失不仅侵蚀利润,还增加了运营的不确定性。AI视频监控卫士,依托先进的AI视觉技术和行为意图分析引擎,为数智店商打造了一个高效、智能的防损闭环,彻底破解盗损痛点。
谅望者3 天前
笔记·数据挖掘·数据分析
数据分析笔记10:数据容器数据容器是用于存储数据的结构,不同容器具有不同的特点和用途。五种主要容器:实际应用:爬虫数据存储。 场景:爬取多个网页的数据。
谅望者3 天前
笔记·数据挖掘·数据分析
数据分析笔记05:区间估计点估计的定义:用样本统计量估计总体参数的方法。点估计的三大性质:核心局限:无法保证单一样本的估计值等于总体参数的真实值。
权泽谦3 天前
java·机器学习·数据挖掘
Java 在机器学习中的应用:基于 DL4J 与 Weka 的完整实战案例说到机器学习(Machine Learning),大部分人的第一反应是:Python 才是最常用的语言。