apache

SelectDB2 小时前
数据库·后端·apache
Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析在初步探索了 AI 函数的可能性之后,本次我们将目光投向两个更为核心的函数:AI_AGG 和 EMBED。我们将深入解析这两个函数的设计理念、实现原理及其在业务场景中的应用,展示 Apache Doris 如何通过原生的函数设计,将文本聚合与语义向量分析无缝集成到 SQL 中,为用户提供更强大、更易用的智能数据分析体验。
q***01651 天前
java·tomcat·apache
【保姆级教程】apache-tomcat的安装配置教程目录一、前提二、文件目录含义三、运行tomcat四、运行成功效果五、使用tomcat打开本地端口为8080的网页
lijun_xiao20092 天前
hadoop·学习·apache
Apache Hadoop-学习笔记1学习视频:https://www.bilibili.com/video/BV1CU4y1N7Sh?spm_id_from=333.788.player.switch&vd_source=f8edb730040256369513da6f2506c493&p=23
SelectDB技术团队3 天前
分布式·apache
Apache Doris 自动分区:如何应对分布式环境下的复杂并发挑战|Deep Dive在分布式环境下,分区对性能的影响不可小觑。本文深度、详尽的讲解 Apache Doris 自动分区设计思考,并就多线程复杂并发场景下所面临的挑战,一一剖析 Doris 自动分区设计时的应对策略。
StarRocks_labs3 天前
apache·数据湖·shuffle·starrocks 4.0·query-ready
StarRocks 4.0:让 Apache Iceberg 数据真正 Query-Ready导读:StarRocks 4.0 已正式发布!这一版本将优化能力从查询层延伸至数据层,通过全新的 Global Shuffle Ingestion、Spill-Aware Writes、Compaction API 与 Local Sort 等特性,让数据在写入的同时即完成优化。面对 Apache Iceberg 等开放格式中“小文件过多、查询延迟高”的挑战,StarRocks 4.0 将数据仓库级的治理理念引入 Lakehouse 架构,实现了从写入、组织到维护的全链路提速。
武子康3 天前
大数据·后端·apache
大数据-154 Apache Druid 架构与组件职责全解析 版本架构:Coordinator/Overlord/Historical 实战Druid的Coordinator组件主要负责集群中历史节点(Historical Node)的数据负载均衡和生命周期管理。具体来说,它的核心职责包括以下几个方面:
老罗-Mason4 天前
python·flink·apache
Apache Flink运行环境搭建172.18.12.85 flink01 ##master节点,jobManager 172.18.12.86 flink02 ##worker节点,taskmanager 172.18.12.87 flink03 ##worker节点,taskmanager 一、每台机器上配置好 Java 以及 JAVA_HOME 环境变量
HashData酷克数据4 天前
apache
Apache Cloudberry 孵化报告(202508-202510)本文基于 Apache Cloudberry 主分支 3.0(该版本尚未正式发布,仅为开发分支),对三种 PostgreSQL 生态下的全文检索实现方案 —— ParadeDB BM25(通过 pg_search 测试)、Postgres GIN(trigram) 与 ZomboDB —— 进行了系统的性能对比测试。
迦蓝叶5 天前
java·数据挖掘·apache·知识图谱·查询·知识挖掘·推理机
Apache Jena:利用 SPARQL 查询与推理机深度挖掘知识图谱在知识图谱的应用中,数据的深度挖掘是实现智能化和自动化决策的关键。Apache Jena 作为强大的语义网框架,提供了丰富的工具来支持这一目标。本文将通过实际代码示例,展示如何利用 Jena 的 SPARQL 查询和推理机进行知识图谱的深度挖掘,帮助开发者更好地理解和应用这些功能。
JosieBook5 天前
数据库·apache·iotdb
【数据库】Apache IoTDB数据库在大数据场景下的时序数据模型与建模方案随着物联网(IoT)、工业互联网、智能交通、智慧能源等领域的迅猛发展,全球每天产生数以亿计的传感器数据。这些数据具有典型的时间序列特征:高频率采集、强时间相关性、设备维度丰富、写多读少或读写并重。传统关系型数据库在处理此类数据时面临写入性能瓶颈、存储成本高、查询效率低下等问题。
SeaTunnel6 天前
apache
结项报告完整版 | Apache SeaTunnel支持metalake开发过去两周,我们对开源之夏活动中表现优异的开发者们进行了简单的采访,初步粗略地了解了一下他们的开发过程和心得体会。今天,我们将通过同学们的完整结项报告,深入了解项目的开发技术细节,希望能够帮助大家更好地了解 Apache SeaTunnel 项目的最新进展。
迦蓝叶6 天前
人工智能·开源·apache·知识图谱·持久化·存储·jena
Apache Jena 知识图谱持久化:选择适合你的存储方案在构建知识图谱应用时,数据的持久化存储是一个关键环节。Apache Jena 提供了多种灵活的持久化方案,从简单的文件存储到高性能的 TDB 存储,再到基于 HTTP 的 Fuseki 服务,每种方案都有其独特的适用场景和优缺点。本文将详细介绍这些持久化方案,并提供选型建议,帮助你选择最适合的存储方式。
q***98526 天前
java·tomcat·apache
【保姆级教程】apache-tomcat的安装配置教程目录一、前提二、文件目录含义三、运行tomcat四、运行成功效果五、使用tomcat打开本地端口为8080的网页
DolphinScheduler社区6 天前
大数据·开源·apache·海豚调度
Apache DolphinScheduler 新增 gRPC 任务插件 | 开源之夏成果总结今年的开源之夏活动已接近尾声,Apache DolphinScheduler 社区的开发者在经过漫长的开发过程收获了自己的成果,同时为 Apache DolphinScheduler 带来了全新的任务插件 gRPC。
Monody_R6 天前
linux·服务器·apache
rhce作业最后配置这边忘记截vim /etc/httpd/conf/httpd.confecho 'this is openlab data' > /www/openlab/data/index.html
CodeBlossom6 天前
apache
Apache POIApache POI 是一个处理Miscrosoft Office各种文件格式的开源项目。简单来说就是,我们可以使用 POI 在 Java 程序中对Miscrosoft Office各种文件进行读写操作。 一般情况下,POI 都是用于操作 Excel 文件。
数新网络7 天前
人工智能·apache·知识图谱
The Life of a Read/Write Query for Apache Iceberg TablesApache Iceberg 作为开源分层表格式,通过解耦数据与元数据管理,为大数据处理提供事务性与可扩展性。本文以读写查询生命周期为核心,解析 Iceberg 表的处理逻辑。
AI分享猿7 天前
web安全·github·apache
雷池 WAF 免费版实测:企业用 Apache 搭环境,护住跨境电商平台我们公司是 25 人团队,做跨境电商平台主打母婴用品品类,之前一直面临安全防护的两难选择 —— 付费企业级 WAF 每年费用超 5 万,超出预算;普通免费 WAF 防护能力不足,无法应对跨境业务的复杂安全需求。直到部署了雷池 WAF 免费版,才找到性价比最高的解决方案,防护效果完全不输付费产品。
Chief_fly7 天前
网络协议·http·apache
RestTemplate 和 Apache HttpClient 实现 HTTP 请求从行业实际应用来看,Spring 框架(含 Spring Boot)占据 Java 后端的半壁江山,因此与其深度集成的 RestTemplate(同步)和 WebClient(异步,Spring 5+)是最主流的选择;而非 Spring 项目(如传统 Java 项目、中间件)中,Apache HttpClient 凭借成熟稳定的特性成为首选。
浔川python社7 天前
python·小程序·apache
《Python 小程序编写系列》(第三部):简易文件批量重命名工具《Python 小程序编写系列》(第三部):简易文件批量重命名工具在日常处理文件时,批量重命名是高频需求。本文将用 Python 实现一个简易工具,支持按规则批量修改文件名。