大数据

艾莉丝努力练剑18 分钟前
大数据·linux·c++·人工智能·git·gitee·指令
【Git:基本操作】深度解析Git:从初始Git到熟悉基本操作🔥艾莉丝努力练剑:个人主页❄专栏传送门:《C语言》、《数据结构与算法》、C/C++干货分享&学习过程记录、Linux操作系统编程详解、笔试/面试常见算法:从基础到进阶、测试开发要点全知道
猫猫姐姐30 分钟前
大数据·人工智能·sql·flink
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理本篇将探讨三个部分:Data + AI:在 Flink SQL 中连接实时数据处理与AI能力首先,将介绍 Flink SQL 2.1 如何连接实时数据处理与AI能力。您将看到我们如何增强对 AI 函数的支持,从模型注册到通过ML_PREDICT与 SQL 的无缝集成,支持大模型文本生成和RAG工作流等任务。
武子康41 分钟前
大数据·后端·nosql
大数据-142 ClickHouse分片×副本×Distributed 实战 ReplicatedMergeTree、Keeper、insert_quorum副本是指在分布式系统中,将相同的数据存储在不同物理节点上的技术实现。其核心思想是通过数据冗余来提升系统的可靠性。在 ClickHouse 中,每个数据分片(Shard)都会维护一个或多个完全相同的副本,这些副本节点组成一个副本组。副本之间通过特定的同步协议保持一致,当主副本节点接收到数据写入时,会通过后台进程将变更传播到其他副本节点。
月屯2 小时前
大数据·elasticsearch·搜索引擎
es大页读取在 Elasticsearch 中处理大数据集的分页查询(通常称为"大页查询"或"深度分页")时,需要特别谨慎,因为不当的操作可能会对集群性能产生显著影响,Elasticsearch 提供了几种不同的方案,每种都有其适用的场景和注意事项。 为了让你能快速了解这几种核心方案的特点,我准备了一个对比表格:
hexionly3 小时前
大数据·数据仓库
数据仓库·简介(一)链接: 学习笔记来自哔哩哔哩视频1、诞生背景: 各系统自的业务数据库,个数据库没有统一规范2、数据仓库面向分析,业务数据库面向业务系统(作用的类型各不相同,各司其职)
TDengine (老段)3 小时前
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
TDengine 数学函数 TRUNCATE 用户手册获得指定字段按照指定位数截断的值。v3.3.3.0与 expr 字段的原始数据类型一致。适用于内层查询和外层查询。
TDengine (老段)3 小时前
大数据·数据库·物联网·时序数据库·tdengine·1024程序员节
TDengine 数据函数 CORR 用户手册计算两列数据之间的皮尔逊相关系数(Pearson correlation coefficient),该数值反映了两个序列之间的线性关系强度和方向。
隐语SecretFlow10 小时前
大数据·网络·安全
【隐语SecretFlow】由蚂蚁集团牵头制定的“隐私保护计算安全分级”IEEE国际标准已正式发布!2025年10月17日,IEEE SA(‌Institute of Electrical and Electronics Engineers‌- Standards Association电气电子工程师协会-标准协会)正式发布了 IEEE 3169-2025 “IEEE Standard for Security Requirement of Privacy-Preserving Computation”国际标准.
微三云、小叶13 小时前
大数据·软件开发·商业模式·小程序商城·本地生活·商业思维
裂变速度提升300%!279模式如何盘活一个私域商城在流量成本持续攀升的今天,279模式凭借其独特的三重机制,正在成为解决私域增长困境的有效方案。这个模式通过二级分润、七人成团和永久分红的组合设计,实现了用户从引流到留存的全周期管理。
还是大剑师兰特15 小时前
大数据·hadoop·分布式
Hadoop面试题及详细答案 110题 (106-110)-- Hadoop高级与实战《前后端面试题》专栏集合了前后端各个知识模块的面试题,包括html,javascript,css,vue,react,java,Openlayers,leaflet,cesium,mapboxGL,threejs,nodejs,mangoDB,SQL,Linux… 。
努力成为一个程序猿.16 小时前
大数据·hadoop·spark
【问题排查】hadoop-shaded-guava依赖问题报错信息如下:从日志可以看出是因为缺失某个依赖导致。我先说说我的排查方向,比较笨重因为代码逻辑是利用spark读取S3文件用到了hadoop-aliyun的依赖,而adoop-aliyun依赖在AliyunOssUtils类中import了org/apache/hadoop/thirdpart/com/goole/common/base/Preconditions类,hadoop原生的依赖包并不会提供该依赖的支持所以在spark-submit时报错。知道问题就比较好解决了。
达芬奇科普16 小时前
大数据·人工智能
俄罗斯全面禁止汽油出口对俄、欧、中能源市场的多维影响分析据俄罗斯塔斯社报道,俄罗斯副总统诺瓦克称:“将在不久的将来,对所有市场参与者的汽油出口全面禁令延长至 2025 年底”。近几个月来,俄罗斯汽油价格飙升,已经持续限制汽油出口,并同时从中国、白俄罗斯进口汽油以缓解短缺。甚至在莫斯科、克里米亚等地加油站排起长队。这种限制出口措施会产生哪些影响?俄罗斯是不是要崩溃了?欧洲是不是也会很难受?中国会不会也受到牵连?我们是不是杞人忧天了?下面跟着达芬奇一起分析下。
RE-190118 小时前
大数据·数学·概率论·统计学·数理统计·知识笔记·深入浅出
《深入浅出统计学》学习笔记(二)这篇博客是我在学习《深入浅出统计学》这本书时整理的个人笔记。《深入浅出统计学》作为一本经典的统计学入门书籍,内容由浅入深、案例丰富,全书共 15 章。考虑到知识点的连贯性和阅读体验,我计划将整本书的学习笔记分为 3 篇在 CSDN 上分享,每篇聚焦 5 个章节的内容,本篇便是系列笔记的第二篇,涵盖书中的第 6章到第 10 章。
yumgpkpm21 小时前
大数据·人工智能·hive·hadoop·机器学习·zookeeper·cloudera
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明
临风赏月1 天前
大数据
Hudi、Iceberg、Delta Lake、Paimon四种数据湖的建表核心语法Hudi建表需明确表类型(COW/MOR)、主键、分区字段,依赖Spark配置或WITH参数指定核心属性。
极客数模1 天前
大数据·算法·数学建模·金融·数据挖掘·图论·1024程序员节
【浅析赛题,一等奖水平】思路模型数据相关资料!2025 年“大湾区杯”粤港澳金融数学建模竞赛B 题 稳定币的综合评价与发展分析~目录问题1:USDT与USDC的应用场景、市场竞争力定量对比及风险与潜力分析核心结论基础模型(适合小白)
临风赏月1 天前
大数据
Hudi、Iceberg、Delta Lake、Paimon 建表语法与场景示例以下针对四种数据湖的核心表类型,提供基于主流计算引擎(Spark/Flink)的建表SQL示例,包含关键参数说明、插入/查询操作,并关联实际业务场景,确保语法可直接复用。
luoganttcc1 天前
大数据·人工智能·科技
加快高水平科技自立自强,引领发展新质生产力 <十五五 规划节选>四、加快高水平科技自立自强,引领发展新质生产力中国式现代化要靠科技现代化作支撑。抓住新一轮科技革命和产业变革历史机遇,统筹教育强国、科技强国、人才强国建设,提升国家创新体系整体效能,全面增强自主创新能力,抢占科技发展制高点,不断催生新质生产力。
TDengine (老段)1 天前
大数据·数据库·物联网·性能优化·时序数据库·tdengine·1024程序员节
益和热力性能优化实践:从 SQL Server 到 TDengine 时序数据库,写入快 20 秒、查询提速 5 倍小T导读:在数字化转型浪潮下,各行业都在积极探索如何利用先进技术提升运营效率与服务质量。供热行业也不例外,大量的热力数据亟待高效处理与分析。安阳益和热力集团有限公司(以下简称 “益和热力”)作为安阳市城市集中供热的关键力量,选择了 TDengine TSDB 作为其热力数据处理的基础时序数据库,成功应对了大规模数据挑战,实现了供热业务的数字化升级。本文将深入剖析益和热力采用 TDengine TSDB 的背景、痛点,以及 TDengine TSDB 在其业务中的落地实践成果。
秋已杰爱1 天前
大数据·elasticsearch·搜索引擎
技术准备十五:Elasticsearch面向文档的,可存储整个对象或文档,用索引进行搜索索引:一组相似数据特征的集合。类似数据库类型:索引一个逻辑上的分区。类似数据库表