StarRocks 3.4 发布:AI 场景新支点,Lakehouse 能力再升级

在 3.4 版本中,我们聚焦 AI 场景的扩展,推出了 Vector Index、Python UDF 支持,并实现了 Arrow Flight 协议, 为数据分析和 AI 检索场景提供更强大的功能和性能支持!

深入理解 StarRocks Bitmap 索引和 Bitmap 去重

在 StarRocks 中,Bitmap 索引和 Bitmap 去重是两种基于位图技术的核心功能,但它们的应用场景、实现机制以及优化目标存在显著差异。以下从定义、作用、实现原理、适用场景及限制等方面进行详细对比分析。

迈向云原生:理想汽车 OLAP 引擎变革之路

本文整理自理想汽车大数据工程师在StarRocks Summit Asia 2024的分享

什么是 OLAP 数据库?企业如何选择适合自己的分析工具

选择合适的 OLAP 数据库是企业数据分析能力建设的关键一步。

Apache Iceberg 解析,一文了解Iceberg定义、应用及未来发展

Iceberg:新一代数据湖仓实践之基础组件之一,助力企业数据架构升级。

如何理解 Apache Iceberg 与湖仓一体(Lakehouse)?

Apache Iceberg与湖仓一体架构:技术洞察与实践指南

深入理解 Bitmap 索引:原理、场景与应用案例

本文将从原理、适用场景到实践案例,深入用户理解 Bitmap 索引的核心价值。

物化视图详解:数据库性能优化的利器

本文将深入剖析物化视图的工作原理、应用场景及最佳实践,帮助企业在合适的场景中充分发挥其性能优势。

StarRocks 与主流 BI 工具兼容性盘点(Superset/帆软/QuickBI/Tableau)

企业可以根据自身需求特点,选择最适合的 BI 工具与 StarRocks 组合,构建高效、灵活、可扩展的现代数据分析平台

StarRocks 主键(Primary Key)深度解析

StarRocks 是一款高性能分析型数据库,专为海量数据的实时分析而设计。作为新一代湖仓(Lakehouse)加速引擎,StarRocks 融合了 MPP 架构和列式存储引擎的优势,能够支持亿级数据秒级查询响应。

Hadoop与现代数据分析:从批处理到实时查询的演进

本文将带你深入了解Hadoop的核心原理、关键组件以及未来演进路线,帮助你快速了解这一大数据基础技术。

Apache Paimon:新一代流式数据湖平台的核心解析与实践指南

Paimon 提供流批一体的数据湖能力,而 StarRocks 则提供卓越的 OLAP 引擎性能,二者结合可大幅降低数据延迟,简化技术架构,同时保障查询性能。对于追求数据实时性与分析性能兼得的企业而言,Paimon+StarRocks 的组合将是一个理想的技术选择。

Apache Hudi:构建实时数据湖的核心技术与实践指南

Apache Hudi 正在重新定义大数据存储范式,为实时数据湖提供了轻量级而功能强大的解决方案。通过融合数据库和数据湖的优势,Hudi 使企业能够构建真正实时、高效且易于管理的大数据平台。

BI 工具响应慢?可能是 OLAP 层拖了后腿

当 BI 工具遇“卡顿”,OLAP 层优化是关键。

OLAP 技术全解析:从定义到核心场景,企业如何选择联机分析处理方案?

OLAP 技术的核心价值到底是什么?企业又该如何从众多方案中选择最适合自己的?本文将从实践角度出发,带你详解 OLAP 技术。

什么是 OLAP?解析新一代引擎 StarRocks 的三大破局点

传统 OLAP 引擎(如 ClickHouse、Kylin)常面临多表关联性能差、运维复杂、资源隔离不足等挑战,而 StarRocks 作为新一代极速全场景 MPP 数据库,正以三大破局点重新定义 OLAP 标准。

2025 Lakehouse 趋势全景展望:从技术演进到商业重构

据 IDC 预测,2025 年全球数据量将突破 175 ZB,非结构化数据占比超过 80%,到 2027 年全球数据生成量更将突破 300 ZB。

如何通过物化视图加速数据湖查询?

在企业数据分析实践中,数据湖查询性能不足是一个普遍性问题。为提升查询效率,大多数企业选择将数据迁移至数据仓库。这种方案虽然解决了性能问题,却增加了数据治理的复杂性和维护成本。本文将带大家探讨如何通过物化视图,让数据湖性能也能追平数仓,实现实时数据分析。

如何通过高效的缓存策略无缝加速湖仓查询

本文将探讨如何利用开源项目 StarRocks 的缓存策略来加速湖仓查询,为企业提供更快速、更灵活的数据分析能力。作为 StarRocks 社区的主要贡献者和商业化公司,镜舟科技深度参与 StarRocks 项目开发,也为企业着手构建湖仓架构提供更多参考。

如何使用 StarRocks 管理和优化数据湖中的数据?

本篇文章旨在介绍开源项目 StarRocks 作为高性能分布式分析型数据库,如何以其卓越的查询性能、低延迟和可扩展性,为数据湖中的数据管理和查询优化提供支持,进一步提供数据处理的效率及时效性。

如何利用 StarRocks 实时分析数据湖中的数据?

众所周知,湖仓一体架构(Lakehouse)能提供更为统一和高效的数据处理与分析能力。StarRocks 当前已打通多种数据湖组件,如 Apache Iceberg、Apache Hudi、Delta Lake、Apache Paimon等,实现了对数据湖的实时查询与分析。不仅能够作为查询引擎直接读取数据湖中的数据,还支持物化视图等高级功能,进一步提升查询性能,帮助企业“一键实现”湖仓架构。

CloudCanal 落地 StarRocks 数据迁移同步的实践与思考

本文内容主要分为以下两个部分: 1. 什么是 CloudCanal :包括 CloudCanal 的核心能力、应用场景、产品特点和用户群体。 2. CloudCanal 落地 StarRocks 的数据迁移同步过程:包括 StarRocks 对端的使用、基础能力、写入优化,以及 StarRocks 和 CloudCanal 一起构建的数据体系在用户层面的应用。

SeaTunnel StarRocks 连接器的使用及原理介绍

Apache SeaTunnel(以下简称 SeaTunnel)是一个分布式、高性能、易扩展、用于海量数据(离线&实时)同步和转化的数据集成平台。StarRocks 通过与 SeaTunnel 的结合可以轻松实现 StarRocks 和不同数据源之间的数据交换。

Paimon+StarRocks 湖仓一体数据分析方案

本文整理自阿里云高级开发工程师曾庆栋(曦乐)在 Streaming Lakehouse Meetup 分享的内容,深入探讨了传统数据仓库分析、Paimon+StarRocks 湖仓一体数据分析、StarRocks 与 Paimon 的协同使用方法与实现原理,以及StarRocks 社区湖仓分析的未来规划。

StarRocks × Apache Flink:如何构建简单强大的实时数仓架构

当前在构建实时数仓时,由于数据源的多样性,需要使用不同的采集工具,如 Flume、Canal、Logstash。对于不同的业务,我们通常会采用不同的分析引擎。

深度好文|实时数仓不用愁,StarRocks+Flink 来解忧!

2022年1月9日, StarRocks 亮相 Flink Forward Asia 2021 大会开源解决方案专场, StarRocks 解决方案架构师谢寅做了题为【双剑合璧:Flink + StarRocks 构建实时数仓解决方案】的主题演讲。本文以主讲嘉宾从技术方案的角度,为社区的小伙伴带来最全、最详细的文字版回顾。

如何利用 StarRocks 加速 Iceberg 数据湖的查询效率

直播 | StarRocks 实战系列第一期——部署&导入

From Zero to StarRocks Hero

实战系列第三期:StarRocks 运维相关

实战系列第一期:部署&导入

实战系列第二期:导入优化&问题排查

01|手动搭建 StarRocks 集群环境

02|手动构建高可用 StarRocks 集群环境

03|如何在 StarRocks 中创建表?

04|StarRocks 表模型基本介绍

05|StarRocks 极速特性介绍

06|StarRocks 统一特性介绍