数据挖掘

Xxtaoaooo10 小时前
数据挖掘·数据分析·dolphindb
DolphinDB开发者评测:用多范式编程重新定义时序数据分析DolphinDB官网:DolphinDB 智能数据平台DolphinDB官方文档:DolphinDB 技术文档
YangYang9YangYan16 小时前
学习·数据挖掘·数据分析
2026会计人员想提升个人能力学习数据分析的价值数字化转型背景下,会计职能从传统核算向决策支持转变。数据分析能力帮助会计人员挖掘财务数据价值,优化成本控制、风险评估和战略规划。
geneculture18 小时前
人工智能·数据挖掘·融智学的重要应用·哲学与科学统一性·融智时代(杂志)·信智序位范式
信智序位时代的认知范式信智序位时代的认知范式摘要:人类认知的革命性飞跃可划分为两大历史阶段:第一次认知大飞跃发轫于古希腊哲学,成型于近现代实证科学,确立了阐释物理载体系统的质能时空范式;当代由融智学开启,从简单系统研究迈向复杂系统、复杂性科学与智慧系统研究,从而构成人类第二次认知大飞跃。本文严格区分质能时空硬件载体范式与信智序位软件本体范式,厘清传统研究中将物理载体等同于系统本体的长期认知误区。质能时空是一切智能系统赖以存续的外在物理硬件条件,信智序位则是主导系统结构、层级架构、功能属性与演化路径的内在软件本体。通过系统地对比
STLearner19 小时前
论文阅读·人工智能·深度学习·神经网络·机器学习·计算机视觉·数据挖掘
CVPR 2026 | 时空时序论文总结(天气预报,交通模拟,域自适应等)CVPR 2026将在2026年6月5日至7日于美国科罗拉多会议中心(Colorado Convention Center)举行。
雁迟21 小时前
数据挖掘·数据分析·r语言
第十章:数据框 DataFrame(数据分析主力)数据框(Data Frame)是 R 语言中 最重要的数据结构,也是数据分析的绝对主力。Excel 表格中的每一行每一列,在 R 里就是数据框。90% 的数据分析工作都围绕数据框展开。
Honker_yhw1 天前
人工智能·数据挖掘
大数据管理与应用系列丛书《数据挖掘》(吕欣等著)读书笔记-非线性相关分析在研一上学期学习了《大数据分析D》课程,3.3节让我彻底改变了以往对“相关性”的认知,是最让我感到“原来如此”的一章内容。之前本科学统计时,Pearson相关系数几乎成了“万能钥匙”——只要两个变量,就先算个r看看强不强。因此,以往不论是参加比赛还是写本科毕业论文时,习惯性只看Pearson相关系数,一旦接近0就认为“没关系”。经过这一节的学习才对“线性相关为0,不代表无相关”的理解更加深刻——变量间可能存在复杂的非线性依赖。线性相关只是冰山一角,现实世界里变量之间的关系往往弯弯曲曲、非单调,甚至隐藏在噪
Ricky05531 天前
人工智能·分类·数据挖掘
AgriDet:基于农业检测框架的植物叶片病害严重程度分类(印度2023年研究)摘要:在现代农业领域,植物病害检测对提升作物产量具有至关重要的作用。要实现大规模增产,必须能够预测病害的发生并为农民提供科学指导。以往的植物病害检测方法依赖人工特征提取,这种方式成本较高。因此,基于图像的技术在植物病害检测研究领域备受关注。然而,现有方法因采集图像的固有缺陷而存在诸多问题,包括背景条件不理想导致的遮挡、光照不均、图像朝向偏差及尺寸失真等问题。此外,在实时应用中还普遍存在计算复杂度高、误分类率高及过拟合等问题。为解决这些问题,我们提出了农业检测(AgriDet)框架,该框架融合了传统的Inc
weelinking1 天前
数据库·人工智能·git·python·数据挖掘·交互·cloudera
【2026】08_Claude与版本控制:Git协作技巧上一篇文章我们学习了如何利用Claude辅助算法设计与优化,解决复杂的算法问题。今天,我要教你如何让Claude成为你的Git协作助手,提升团队开发效率!本系列文章将全程使用weelinking中转平台实现Claude的使用。
没有梦想的咸鱼185-1037-16631 天前
人工智能·python·深度学习·机器学习·chatgpt·数据挖掘·数据分析
AI-Python机器学习、深度学习核心技术与前沿应用及OpenClaw、Hermes自动化编程随着观测技术、数值模拟与计算基础设施的迅猛发展,科学研究的范式正经历从"人工编程"到"智能体自动化"的深刻变革。无论您从事生命科学、环境科学、材料研究还是社会科学,都面临着共同的挑战:海量异构数据的处理耗时、复杂模型的编程门槛、以及从Idea到论文的漫长转化链条。不仅提供从Python基础到PyTorch深度学习的完整技术栈,更前瞻性地引入大模型工程化与自动化智能体(Agents)技术,打造"AI赋能的科研全链条":
小王毕业啦1 天前
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
2009-2025年 华证ESG年度季度评级评分数据 xlsx01、数据介绍华证ESG秉持企业环境、社会和治理绩效的投资理念,制定了一套严谨的评价标准。该标准聚焦于全面评估企业在环境(E)、社会(S)和治理(G)三个关键维度的实际表现,并依据评估结果为企业提供相应的评级与得分。2009-2025年华证ESG年度季度评级评分数据xlsx资源-CSDN下载https://download.csdn.net/download/2401_84585615/92863252
程序员猫哥_2 天前
数据挖掘
AI建站工具选型指南:主流模式对比与避坑清单市面上的建站工具五花八门,有的号称“AI智能”,有的强调“免费开源”,还有的说“模板丰富”。你可能会看得眼花缭乱,不知道哪个才是真正适合自己业务的那一个。选错了,要么功能不够用,要么操作太复杂,要么后期成本飙升。
2601_954971132 天前
数据挖掘·数据分析
2026产品岗,怎么转型产品数据分析/商业分析岗?在数字化浪潮下,产品经理的职能边界不断扩展,数据分析能力逐渐成为核心竞争力。对于计划在2026年转型为产品数据分析或商业分析岗的从业者,需系统性掌握数据工具、业务洞察及行业认证(如CDA数据分析师证书)。以下是转型路径的详细拆解。
程序员猫哥_2 天前
数据挖掘
分人群AI建站工具解决方案:找到最适合你的建站方式同一个AI建站工具,在不同人手里,用法和诉求可能完全不同。中小企业主关心的是品牌形象和获客;运营人员想快速上线活动页面测试效果;自由职业者需要一张体面的“网络名片”;外贸从业者则看重多语言和全球访问速度。
数据皮皮侠AI2 天前
大数据·人工智能·笔记·数据挖掘·回归
基于经济学季刊方法测算的中国城市蔓延指数数据简介今天我们基于另一篇经济学季刊的测算方法测算了城市蔓延程度。我们根据秦蒙的方法依据夜间灯光(见前文)与人口密度(见前文)栅格数据对我国地级市2000-2023年的城市蔓延程度进行了测算。其中将校正后的夜间灯光NPP-OLS亮度大于等于10及人口密度大于等于1000人/平方公里的区域作为城市区域。城市蔓延程度Si = 0.5×(LAi- LHi)+0.5,其中其中LAi表示城市内部人口密度低于全国平均人口密度的面积占整个城市面积的比重,LHi表示城市内部人口密度大于等于全国平均人口密度的面积占整个城市
幻奏岚音2 天前
人工智能·算法·计算机视觉·数据挖掘
AI模型用户画像分析_new截至2024年中,中国生成式AI用户规模突破2.3亿,占网民总数约六分之一。这片市场从2022年底几乎空白起步,到今天已经成为全球最活跃的AI应用战场之一。本文围绕豆包、通义千问、DeepSeek等主流产品,从用户规模与市场格局、人口统计特征、使用行为与场景、付费意愿与商业模式、核心痛点五个方向做了系统梳理。与其说这是一份"框架完整"的研究,不如说是一次对当下市场真实状态的记录——数据会过时,但背后反映出的用户心理与商业悖论值得关注。
babe小鑫2 天前
数据挖掘·数据分析
2026大专学历进入经管行业学数据分析的价值数字化转型在经管行业已成为核心战略,企业通过数据驱动决策优化运营效率。2023年统计显示,超过78%的金融机构和零售企业已部署数据分析平台,供应链智能化改造投入年增长率达23%。趋势上,实时数据分析和AI预测模型渗透率持续提升,尤其风控和客户画像领域需求激增。
babe小鑫2 天前
学习·数据挖掘·数据分析
2026数字营销专业人士学习数据分析的必要性数据驱动的营销决策成为行业标准,精准投放、用户行为分析、ROI优化依赖数据分析能力。 AI与自动化工具的普及要求营销人员具备数据解读能力,避免过度依赖技术团队。
卷无止境3 天前
数据挖掘
DuckDB 高效数据处理完全指南如果你还没听说过 DuckDB,那你可能错过了近几年数据工程领域最有意思的一场变局。这个以鸭子命名的嵌入式分析数据库,正在悄悄改变数据从业者处理海量数据的方式——不需要搭集群,不需要配服务器,一个进程、几行 SQL,就能在笔记本上跑完 TB 级别的分析任务。
云和数据.ChenGuang3 天前
人工智能·深度学习·机器学习·数据挖掘·边缘计算
FastText的核心优势FastText的核心优势在于其子词(subword)机制,能够为未登录词生成合理的向量表示[2][4]。若需强制返回全0向量,需结合以下策略实现:
沪漂阿龙3 天前
人工智能·数据挖掘·回归
面试题:大模型训练中的思维链 CoT 与长思维链冷启动详解——Chain-of-Thought、Long CoT、拒绝采样、STaR、自回归推理全解析1.1 这道题表面问概念,实际在考推理模型训练主线在大模型面试里,“什么是思维链”看似是一个基础概念题,但它背后其实连接着一整条推理模型训练路线:提示词如何诱导推理、模型如何学习分步解题、长思维链数据怎么冷启动、SFT 和 RL 如何配合、推理过程如何评估,以及上线时如何平衡准确率、延迟和 token 成本。