大数据

阿里云大数据AI技术14 分钟前
大数据·人工智能
云栖实录|人工智能+大数据平台加速企业模型后训练本文根据 2025云栖大会演讲整理而成,演讲信息如下:演讲人:魏博文(阿里云智能集团计算平台事业部解决方案负责人)
B站_计算机毕业设计之家43 分钟前
大数据·爬虫·python·数据分析·汽车·可视化·懂车帝
数据分析:Python懂车帝汽车数据分析可视化系统 爬虫(Django+Vue+销量分析 源码+文档)✅博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
京东零售技术2 小时前
大数据
Hudi系列:表类型(Table & Query Types)•Hudi架构▪1.1 时间轴(TimeLine)概念▪1.2 Hudi的时间线由组成▪1.3 时间线上的Instant action操作类型
京东零售技术2 小时前
大数据·数据可视化
Hudi系列:Hudi核心概念之时间轴(TimeLine)•Hudi架构◦一. 时间轴(TimeLine)▪1.1 时间轴(TimeLine)概念▪1.2 Hudi的时间线由组成
weixin_549808362 小时前
大数据·人工智能·重构
从效能革命到体验重构,易路 AI Agent 破局 HR 三重困境一、2025 工作趋势指数:重构中的未来工作图景(一)组织效能革命:从流程自动化到智能决策2025年工作趋势指数显示,83% 的前沿企业已突破传统人力资源管理的流程化瓶颈,转向 “数据驱动 + 智能决策” 的新范式。调研中,72% 的中大型企业反馈,传统 HR SaaS 仅能解决 30% 的事务性效率问题,而组织架构柔性化、人才需求动态化带来的决策难题,成为制约效能提升的核心卡点。
数据智能老司机3 小时前
大数据·架构·数据分析
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——机器学习函数概览在深入探讨 Cortex 的生成式 AI(Generative AI)能力之前,先了解其原生机器学习(ML)函数是有价值的,这将为理解平台的高级分析能力打下坚实基础。Snowflake 将人工智能(AI)与机器学习(ML)能力原生引入 Data Cloud,使企业能够将预测性分析无缝集成到业务流程中。借助内置 ML 函数,用户无需深厚的数据科学背景,便可完成分类(classification) 、预测(forecasting) 、异常检测(anomaly detection)与自动洞察(automated
京东零售技术3 小时前
大数据
Hudi系列:Hudi核心概念之索引(Indexs)•Hudi架构▪1.1 时间轴(TimeLine)概念▪1.2 Hudi的时间线由组成▪1.3 时间线上的Instant action操作类型
X-Dragon烟雨任平生3 小时前
大数据·elasticsearch·搜索引擎
Elasticsearch使用Mysql用来存储数据(可靠性最高的主数据源),用Es来做全文检索和特殊查询,用redis来做缓存。 数据同步方案常见的2种: 1.同步双写 最简单,在将数据写到mysql时,同时将数据写到ES或者redis。 缺点: 1、 硬编码,有需要写入mysql的地方都需要添加写入ES的代码; 2、 业务强耦合; 3、 存在双写失败丢数据风险; 4、 性能较差:本来mysql的性能不是很高,再加一个ES,系统的性能必然会下降。 异步双写(MQ方式) 针对多数据源写入的场景,可以借助MQ实现异步的多源写入。通过
INFINI Labs3 小时前
大数据·elasticsearch·搜索引擎·snapshot·backup
Elasticsearch 备份:snapshot 镜像使用篇上一篇文章中,我们简要的列举了 Elasticsearch 备份 主要的几个方案,比对了一下各个方案的实现原理、优缺点和适用的场景。现在我们来看看 ES 自带的镜像备份方案。
代码匠心4 小时前
java·大数据·后端·flink·大数据处理
从零开始学Flink:流批一体的执行模式在大数据处理领域,批处理和流处理曾经被视为两种截然不同的范式。然而,随着Apache Flink的出现,这种界限正在逐渐模糊。Flink的一个核心特性是其批流一体的架构设计,允许用户使用统一的API和执行引擎处理有界数据(批处理)和无界数据(流处理)。本文将深入探讨Flink的执行模式(Execution Mode),特别是在Flink 1.20.1版本中对批处理和流处理模式的支持和优化。
数据智能老司机5 小时前
大数据·架构·数据分析
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——理解 Snowflake Cortex人工智能(AI)与机器学习(ML)的迅猛发展为企业利用数据驱动洞察创造了新机遇。但把 AI 融入既有企业工作流常常面临重大挑战:基础设施复杂度高、数据安全顾虑多、且需要大量专业人才。Snowflake Cortex AI 通过将 AI/ML 能力直接嵌入 Snowflake Data Cloud,为企业提供一条无缝且高效的 AI 采用路径,从而正面应对这些挑战。
数据智能老司机5 小时前
大数据·架构·数据分析
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——Snowflake 生态中的 AI/ML 入门本章将介绍 Snowflake 生态中的人工智能(AI)与机器学习(ML)。内容涵盖核心 AI 概念、AI 与生成式 AI(Generative AI)的影响与工作原理;同时说明 Snowflake 作为云数据平台的角色,以及在数据科学与机器学习中的优势。 读完本章,你将理解 AI、ML 与生成式 AI 的基本原理及其对各行业的变革;也会了解 Snowflake 的架构及其在数据科学与机器学习工作流中的优势。此外,你将认识 Snowpark ML——一款用于在 Snowflake Data Cloud 内
鸿儒之观7 小时前
大数据·flink
dinky提交flink任务报 java.lang.OutOfMemoryError: Direct buffer memoryorg.apache.hadoop.ipc.Client(1093): Unexpected error reading responses on connection Thread[IPC Client (815834176) connection to prod52.bigdata/xx.xx.x.xx:8020 from appuser,5,main] java.lang.OutOfMemoryError: Direct buffer memory
YangYang9YangYan7 小时前
大数据·金融·数据分析
理财经理的职业进阶:核心技能与成长路径解析在财富管理行业,理财经理的成长路径从来不是简单的资历积累,而是专业能力的系统性升级。从初级顾问到团队主管,再到财富总监,每个阶段都需要匹配相应的能力结构。要实现职业突破,既要夯实客户服务基础,更要提升价值创造能力。本文将从核心技能方向、证书选择与分阶段路径三个维度,为理财经理提供清晰的成长规划。
shinelord明7 小时前
大数据·分布式·架构·kafka
【大数据开发实践】Kafka REST Proxy~无缝集成 Kafka大数据处理与实时流计算领域,数据的高效传输、实时处理已成为企业数字化转型的核心需求。Apache Kafka 凭借其高吞吐量、低延迟、高可靠性的特性,成为分布式消息队列与流处理平台的首选方案,广泛应用于日志收集、数据同步、实时分析等场景。
笨蛋少年派8 小时前
大数据·hadoop·分布式
操作Hadoop时,慎用sudo当使用 sudo 执行命令时,会切换到超级用户(root)环境,而 root 用户的环境变量与普通用户的环境变量默认是相互隔离的,这就会导致 Hadoop 相关的关键环境变量(如 HADOOP_HOME、HADOOP_CONF_DIR 等)在 root 环境中 “丢失” 或 “错误”,最终让 hdfs 命令无法找到 NameNode。
青云交9 小时前
java·大数据·智能家居·数据采集·设备联动·场景自动化·逻辑实现
Java 大视界 -- Java 大数据在智能家居设备联动与场景自动化中的应用嘿,亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!当你下班回家时,是否曾期待‘门锁打开的瞬间,灯光自动亮起、空调调到 26℃、热水器提前备好热水’?如今智能家居虽已走进千万家,但‘设备各自为战(灯光按了开关,窗帘却要手动调)’‘场景自动化不智能(明明没人却自动启动扫地机器人)’的问题仍普遍存在 —— 而 Java 大数据技术,正是破解这些‘伪智能’痛点、实现设备联动与场景精准自动化的核心钥匙。
武子康9 小时前
大数据·后端·flink
大数据-123 - Flink 并行度设置优先级讲解 原理、配置与最佳实践 从Kafka到HDFS的案例分析AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布!“快的模型 + 深度思考模型 + 实时路由”,持续打造实用AI工具指南!📐🤖
不剪发的Tony老师9 小时前
大数据·sql·apache drill
Apache Drill:一款开源的分布式SQL查询引擎Apache Drill 是一款开源分布式 SQL 查询和分析引擎,专为半结构化的大数据和云存储进行了优化,能够提供低延迟的交互式数据分析。
APItesterCris10 小时前
大数据·开发语言·数据库·node.js
Node.js/Python 实战:编写一个淘宝商品数据采集器在电商数据分析、市场调研等场景中,淘宝商品数据采集是一项常见需求。本文将分别使用 Node.js 和 Python 两种主流编程语言,从零构建一个简易的淘宝商品数据采集器,帮助大家理解网络请求、数据解析等核心技术环节。采集器将实现关键词搜索商品、提取商品核心信息(名称、价格、销量、店铺名等)以及数据存储功能,同时会强调合规采集的注意事项。