大数据

星环科技TDH社区版2 小时前
大数据·数据库
星环科技产品可存储的表格式功能介绍以及创建示例在表的分类中,星环关系型分析引擎Inceptor以及分布式分析型数据库ArgoDB在针对不同的业务场景中提供了不同的表类型。
百度Geek说2 小时前
大数据·搜索引擎
百度垂搜数据管理系统弹性调度优化实践百度垂直搜索系统将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。随着接入业务数量和数据量不断增长,系统在海量数据管理与调度上遭遇新的挑战,通过垂搜数据管理系统弹性调度优化实践来满足业务增长需求。
白鲸开源4 小时前
大数据
DSIP-91提案解读:简化工作流调试和发布的方案,等你来探讨!在 Apache DolphinScheduler 社区中,最近有人提出了一个优化提案非常值得大家关注。在 DSIP-91 提案中,这位开发者聚焦于优化当前工作流调试和上线发布流程,解决调试不便、发布步骤繁琐、实例混乱等痛点,提出的优化方案引入“草稿”模式,使工作流可在不上线的状态下进行调试;同时支持调试与生产实例区分、调度任务一键配置等能力。
C++ 老炮儿的技术栈7 小时前
大数据·c语言·c++·ide·vscode·算法·编辑器
VSCode -配置为中文界面从微软官方网站下载visual code,并安装 :https://vscode.download.prss.microsoft.com/dbazure/download/stable/dfaf44141ea9deb3b4096f7cd6d24e00c147a4b1/VSCodeUserSetup-x64-1.101.0.exe
白鲸开源7 小时前
大数据
SQL Server CDC 机制全解:如何用 SeaTunnel 构建高效实时数据同步方案在构建 AI-Ready 企业级数据集成方案中,SQL Server 的 CDC(Change Data Capture)机制为 Apache SeaTunnel 提供了稳定的变更数据捕获能力,适用于构建实时数据管道与增量同步任务。以下是对其工作机制、实现原理、应用模式的系统介绍。
企销客CRM3 天前
大数据·数据库·人工智能·企业微信
实施企业预算管理的企微CRM系统技巧:从成本控制到价值创造一、企微CRM管理系统为何成为预算管理新引擎?官方数据显示,接入企微CRM系统的企业平均降低客户管理成本28%,预算执行效率提升40%。这源于企微CRM管理软件的三大独特优势:
小巫程序Demo日记8 小时前
大数据·笔记·spark
Spark简介脑图本文档包含Apache Spark的总结图和知识概念图,使用Mermaid图表展示,方便快速复习和理解。
武子康8 小时前
大数据·后端·apache hive
大数据-14-Hive HQL 表连接查询 HDFS导入导出 逻辑运算 函数查询 全表查询目前2025年06月16日更新到: AI炼丹日志-29 - 字节跳动 DeerFlow 深度研究框架 私有部署 测试上手 架构研究,持续打造实用AI工具指南!📐🤖
春马与夏8 小时前
大数据·分布式·spark
Spark on yarn的作业提交流程一、YarnClient二、YarnCluster三、详细描述
XiaoQiong.Zhang8 小时前
大数据·分布式·spark
Spark 性能调优七步法本文档综合了 Spark 工程中常见的性能瓶颈和优化技巧,分为七大调优方向,适用于 PySpark 和 Scala Spark 场景,包括资源配置、并行度、缓存、垃圾回收、UDF 性能、Shuffle 优化和作业结构管控等。
ApacheSeaTunnel8 小时前
大数据·开源·数据集成·seatunnel·技术分享·maven daemon
实测提速 60%!Maven Daemon 全面加速 SeaTunnel 编译打包效率作者 | 张东浩在大规模数据集成项目中,构建效率尤为关键。本文实测了 Apache SeaTunnel 项目在使用传统 Maven 与新一代构建工具 Maven Daemon(mvnd)下的打包效率差异,结果显示 mvnd 方案通过守护进程与多线程构建机制,实现了约 60% 的性能提升。无需修改 pom.xml 即可兼容现有项目,是开发者提效的利器。附详细安装、使用教程与对比数据,建议你立即尝试!
哲讯智能科技1 天前
大数据·运维·人工智能
苏州SAP代理商:哲讯科技助力企业数字化转型企业数字化转型的必然趋势在当今数字化时代,企业若想保持竞争力,必须借助先进的管理系统优化业务流程、提升运营效率。SAP作为全球领先的企业管理软件,为企业提供ERP(企业资源计划)、CRM(客户关系管理)、SCM(供应链管理)等解决方案,帮助企业在激烈的市场竞争中占据优势。
Edingbrugh.南空1 天前
大数据·hive·hadoop
Apache Iceberg与Hive集成:分区表篇在大规模数据分析中,分区表通过将数据按特定维度(如时间、地域、业务类型)划分存储,可显著提升查询效率。Apache Iceberg的分区表设计融合了Hive的分区理念,但采用更灵活的分区转换机制,支持将原始字段通过函数转换(如按月、按桶)生成逻辑分区,避免Hive传统分区的物理目录强绑定限制。
武子康1 天前
大数据·后端
大数据-13-Hive 启动Hive DDL DML 增删改查 操作Hive的HQL目前2025年06月16日更新到: AI炼丹日志-29 - 字节跳动 DeerFlow 深度研究框架 私有部署 测试上手 架构研究,持续打造实用AI工具指南!📐🤖
Cachel wood1 天前
android·大数据·数据库·数据仓库·sql·计算机网络·mysql
后端开发:计算机网络、数据库常识TCP(传输控制协议)和UDP(用户数据报协议)是互联网协议栈中两种重要的传输层协议,在多个方面存在显著区别,以下是具体介绍:
得物技术1 天前
java·大数据·前端
得物社区活动:组件化的演进与实践“得物平台上的大量商品都具有文化与精神属性,用户往往通过社区来进行了解和分享。”得物平台作为潮流文化与电商融合的前沿阵地,其社区活动业务的演进备受瞩目。得物平台的很多商品蕴含深厚的文化与精神内涵,这吸引用户在社区进行深度的了解与分享。潮流以品牌和带有潮流元素的产品为载体,以社区和内容作为传播媒介。
Elastic 中国社区官方博客1 天前
大数据·人工智能·elasticsearch·microsoft·搜索引擎·全文检索·azure
使用 Azure LLM Functions 与 Elasticsearch 构建更智能的查询体验作者:来自 Elastic Jonathan Simon 及 James Williams试用这个示例房地产搜索应用,它结合了 Azure Gen AI LLM Functions 与 Elasticsearch,提供灵活的混合搜索结果。在 GitHub Codespaces 中查看逐步配置和运行该示例应用的方法。
刘天远1 天前
大数据·数据库·数据分析
深度解析企业风控API技术实践:构建全方位企业风险画像系统在当前的商业环境中,企业风险评估已成为各类商业决策的重要依据。本文将从技术实践的角度,详细介绍企业风控API的集成应用,重点关注API的调用方式、数据结构以及风险维度的划分,帮助开发者快速构建企业风险画像系统。
后院那片海1 天前
大数据·服务器·数据库
GFS分布式文件系统目录GlusterFS概述GlusterFS简介GlusterFS特点GlusterFS术语模块化堆栈式架构
IT_10241 天前
大数据·spring boot·后端
Spring Boot的Security安全控制——应用SpringSecurity!前面介绍了在项目开发时为什么选择Spring Security,还介绍了它的原理。本节开始动手实践Spring Security的相关技术。