starrocks

ZNineSun7 小时前
starrocks·olap·数据湖·mpp·oltp
新一代MPP数据库:StarRocksOLAP数据库(Online Analytical Processing Database,在线分析处理数据库)是大数据场景下用于进行数据分析不可或缺的系统,早期主要有Oracle、Vertica、HANA等商业数据库占据市场份额,后来出现了GreenPlum、Impala、Presto、Kylin等开源的OLAP系统,字节跳动带火了ClickHouse,Snowflake的出现和上市使OLAP进入了云原生时代,之后从百度Palo发展而来的StarRocks和Doris相继进入Linux和Aapche基金
StarRocks_labs8 天前
starrocks·人工智能·搜索引擎·开源
腾讯大数据基于 StarRocks 的向量检索探索作者:赵裕隆,腾讯大数据研发工程师本文整理自腾讯大数据工程师在 StarRocks 年度峰会上的分享,深入探讨了向量检索技术的原理与应用。此功能已应用到腾讯内部多个场景,引入 StarRocks 后,业务不仅不需要维护多套数据库还在性能上有了显著的提升:
漫步者TZ17 天前
数据库·starrocks·clickhouse
Starrocks 对比 ClickhouseStarRocks 在极速查询方面上做了很多,下面着重介绍四点: 1)向量化执行:StarRocks 实现了从存储层到查询层的全面向量化执行,这是 StarRocks 速度优势的基础。向量化执行充分发挥了 CPU 的处理能力。 全面向量化引擎按照列式的方式组织和处理数据。StarRocks 的数据存储、内存中数据的组织方式,以及 SQL 算子的计算方式,都是列式实现的。按列的数据组织也会更加充分利用 CPU 的 Cache,按列计算会有更少的虚函数调用以及更少的分支判断,从而获得更加充分的 CPU 指令流
小Tomkk18 天前
运维·starrocks·docker·容器
Docker 部署 Starrocks 教程StarRocks 是一款高性能的分布式分析型数据库,主要用于 OLAP(在线分析处理)场景。它最初是由百度的开源团队开发的,旨在为大数据分析提供一个高效、低延迟的解决方案。StarRocks 支持实时数据分析,能够处理大规模的数据集,并提供快速的查询响应。
书忆江南1 个月前
starrocks·源码·编译·be
StarRocks BE源码编译、CLion高亮跳转方法阅读SR BE源码时,很多类的引用位置爆红找不到,或无法跳转过去,而自己的Linux机器往往缺乏各种C++依赖库,配置安装比较麻烦,因此总体的思路是通过CLion远程连接SR社区已经安装完各种依赖库的Docker容器,进行编译和源码查看。
鸿乃江边鸟1 个月前
大数据·starrocks·sql
StarRocks 怎么让特定的SQL路由到FE master节点的本文基于 StarRocks 3.1.7 大家都知道对于Starrocks来说 FE 是分 master和follower的,而只有master节点才能对元数据进行写操作。但是为什么呢?哪里有体现呢? 这其中的原因在网上是搜不到的,所以大家只知道只有master节点才能对元数据进行写操作,而哪里有体现呢
大鳥1 个月前
数据库·starrocks·sql
深入了解 StarRocks 表类型:解锁高效数据分析的密码在当今数字化浪潮下,大数据分析成为企业决策、优化业务流程的关键利器。StarRocks 作为一款备受瞩目的高性能分析型数据库,其多样化的表类型为复杂的数据处理需求提供了精准解决方案。今天,就让我们一同深入探索 StarRocks 中的主键表、明细表、聚合表和更新表,从工作原理、读写流程、适用场景、标准建表语句等多个维度全面剖析,助您开启高效的大数据分析之旅。
京河小蚁2 个月前
starrocks
StarRocks 生产部署一套集群,存储空间如何规划?由于 FE 节点仅在其存储中维护 StarRocks 的元数据,因此在大多数场景下,每个 FE 节点只需要 100 GB 的 HDD 存储,生产建议200G SSD以上,FE-FOLLOWER节点也一样的配置。
一条路上的咸鱼2 个月前
starrocks
StarRocks元数据无法合并如果您的StarRocks版本在3.1.4及以下,并且使用了metadata_journal_skip_bad_journal_ids来跳过某个异常的journal,结果之后就出现了FE的元数据无法进行Checkpoint的现象,那么选择升级版本到3.1.4以上,就可以解决。
Shyllin2 个月前
starrocks
StarRocks 排查单副本表遍历所有库表执行SHOW PARTITIONS命令
小强签名设计2 个月前
数据库·starrocks·sql
SQL语句整理五-StarRocksinsert:update:参考:基于StarRocks的MySQL语句排雷秘籍报错信息为:1064 - StarRocks planner use long time 3000 ms in memo phase, This probably because 1. FE Full GC, 2. Hive external table fetch metadata took a long time, 3. The SQL is very complex. You could 1. adjust FE JVM
京河小蚁2 个月前
starrocks·broker
[bug] StarRocks borker load意向之外的bug意向之外,又清理之中StarRocks各方面碾压相同类型的数据库,最近我们要从生成HIVE导历史数据(ORC格式)到StarRocks,前期小测一下,在测试是没问题,上生产先导2个月的数据,大概10T,但是在测试过程中,发现了一个问题。
m0_375599732 个月前
starrocks
StarRocks:存算一体模式部署目录一、StarRocks 简介二、StarRocks 架构2.1 存算一体2.2 存算分离三、前期准备
一条路上的咸鱼3 个月前
starrocks·数据同步
离线数据同步变迁随着业务的发展,系统进行了微服务的差分,导致数据越来越分散,很难进行一个完整的生命周期的数据查询,对于某些业务的需求支持变得越来越难,越来越复杂,也越来越难以进行职责划分。对着业务的发展,数据量越来越大之后,为了良好的业务支持,进行了分库分表,分库分表规则五花八门,一旦脱离了业务逻辑,很难确定某一条数据在哪个库哪个表。
hankl19903 个月前
starrocks·数据仓库
StarRocks-同步hive数据官方文档对csv,orc ,json ,parquet都支持的比较好。写文章的时候SR我们生产用的是3.1.x版本
一条路上的咸鱼3 个月前
starrocks·数据同步
一种小资源情况下RDS数据实时同步StarRocks方案目前需要将阿里云RDS数据库的数据同步到自建的StarRocks集群。之前使用DolphinScheduler通过定时调度Datax任务,将数据同步到StarRocks集群中,但是随着业务的发展,这种方式出现了三个问题:
roman_日积跬步-终至千里3 个月前
starrocks
【StarRocks】starrocks 3.2.12 【share-nothing】 多Be集群容器化部署部署文档 https://docs.starrocks.io/zh/docs/2.5/deployment/plan_cluster/
crossoverJie3 个月前
starrocks·开源·pulsar
推荐一些值得学习的开源项目和框架今天收到球友的问题,让推荐一些值得看的开源项目,觉得 netty 这些太复杂了不太好上手。确实如此,我们日常常用的 Spring、Netty 确实由于发展了多年,看起来比较头大。
houzhizhen3 个月前
starrocks
StarRocks 架构StarRocks 是 MPP 的查询引擎,用来做实时查询,提供亚秒级的查询性能。 兼容 MYSQL 协议,可以和大部分 BI 工具进行无缝衔接。 Apache 2.0 开源产品。