Apache_标签_开发者_华为云

博客(775)
视频(1)
论坛(0)
云声(0)
代码示例(0)

压缩率提升 48%，详解 Apache Doris 存储压缩优化之道｜Deep Dive
本文基于 ClickBench 数据集，展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终，相同数据集的压缩空间从 16.08 GB 降至 8.2 GB，压缩率提升 48.6%。通过合理的调整与优化，Doris 成功在保持查询性能的同时显著降低了存储成本。

SelectDB技术团队
发表于2025-11-25 16:28:57
687 0 0

687 0 0

本文基于 ClickBench 数据集，展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终，相同数据集的压缩空间从 16.08 GB 降至 8.2 GB，压缩率提升 48.6%。通过合理的调整与优化，Doris 成功在保持查询性能的同时显著降低了存储成本。
Apache 数据库
深入理解 Doris Variant：如何让 JSON 查询性能追平列存，还能承载万列索引字段？｜Deep Dive
在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中，对于 JSON 的处理往往面临灵活性及性能无法兼得的困境，而 Apache Doris 的 VARIANT 类型，通过动态子列、稀疏列存储、延迟物化和路径索引等能力，实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解，全面展示其优势。

SelectDB技术团队
发表于2025-11-24 19:23:20
674 0 0

674 0 0

在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中，对于 JSON 的处理往往面临灵活性及性能无法兼得的困境，而 Apache Doris 的 VARIANT 类型，通过动态子列、稀疏列存储、延迟物化和路径索引等能力，实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解，全面展示其优势。
Apache JSON 数据库
Apache Doris 4.0.1 版本正式发布
亲爱的社区小伙伴们，Apache Doris 4.0.1 版本已于 2025 年 11 月 08 日正式发布。此版本聚焦核心模块的打磨与优化，在 AI & Search 方面实现了重要能力扩展，同时全面提升了 Lakehouse 与查询引擎的稳定性和性能。行为变更SHOW PARTITIONS 命令不再支持 Iceberg 表，请直接使用 Iceberg 的 $partitions 系统表查...

SelectDB技术团队
发表于2025-11-19 15:16:47
709 0 0

709 0 0

亲爱的社区小伙伴们，Apache Doris 4.0.1 版本已于 2025 年 11 月 08 日正式发布。此版本聚焦核心模块的打磨与优化，在 AI & Search 方面实现了重要能力扩展，同时全面提升了 Lakehouse 与查询引擎的稳定性和性能。行为变更SHOW PARTITIONS 命令不再支持 Iceberg 表，请直接使用 Iceberg 的 $partitions 系统表查...
Apache
从 OpenSearch 到 Apache Doris：领创集团日志系统升级实践，降本 45%
随着业务全球化扩展与数字化运营的深入推进，日志系统的规模和复杂度不断攀升，原有基于 OpenSearch 的日志平台逐渐难以满足成本控制、性能保障和可维护性等多维需求。为应对持续增长的数据压力和更灵活的分析场景，领创集团技术团队启动了日志系统的架构升级实践，并最终选择 Apache Doris 作为新一代日志系统的核心。实现了综合成本下降超 45%、查询性能提升 5 倍、日志写入达到准实时以...

SelectDB技术团队
发表于2025-11-18 22:08:13
861 0 0

861 0 0

随着业务全球化扩展与数字化运营的深入推进，日志系统的规模和复杂度不断攀升，原有基于 OpenSearch 的日志平台逐渐难以满足成本控制、性能保障和可维护性等多维需求。为应对持续增长的数据压力和更灵活的分析场景，领创集团技术团队启动了日志系统的架构升级实践，并最终选择 Apache Doris 作为新一代日志系统的核心。实现了综合成本下降超 45%、查询性能提升 5 倍、日志写入达到准实时以...
Apache 金融专区
货拉拉用户画像基于 Apache Doris 的数据模型设计与实践
货拉拉是国内领先的同城货运数字化平台，成立于 2013 年。截⾄ 2025 年 4 ⽉，货拉拉业务覆盖全球 14 个市场，400+ 城市，其中中国内地总共覆盖 363 座城市，⽉活司机达 120 万，⽉活⽤户达 1400 万，并在全球设有 6 个数据中⼼。作为共享经济模式的代表企业，货拉拉通过移动互联⽹技术整合社会运⼒资源，为⽤户提供即时货运、企业物流、搬家服务等多元化解决⽅...

SelectDB技术团队
发表于2025-11-18 22:06:38
730 0 0

730 0 0

货拉拉是国内领先的同城货运数字化平台，成立于 2013 年。截⾄ 2025 年 4 ⽉，货拉拉业务覆盖全球 14 个市场，400+ 城市，其中中国内地总共覆盖 363 座城市，⽉活司机达 120 万，⽉活⽤户达 1400 万，并在全球设有 6 个数据中⼼。作为共享经济模式的代表企业，货拉拉通过移动互联⽹技术整合社会运⼒资源，为⽤户提供即时货运、企业物流、搬家服务等多元化解决⽅...
Apache SQL
Apache Doris 4.0 版本正式发布：全面升级 AI 与搜索能力，强化离线计算
Apache Doris 4.0 正式发布！深度融合AI与搜索能力，支持向量索引、AI函数、全文检索打分，强化离线计算稳定性，提升查询性能与数据质量，助力企业构建高效实时数仓。

SelectDB技术团队
发表于2025-11-18 21:38:23
1249 0 0

1.2k 0 0

Apache Doris 4.0 正式发布！深度融合AI与搜索能力，支持向量索引、AI函数、全文检索打分，强化离线计算稳定性，提升查询性能与数据质量，助力企业构建高效实时数仓。
Apache SQL 云原生数据库
从 Snowflake 到 Apache Doris：Planet 实时分析成本直降 80%、查询加速 90 倍
Planet 是一家全球领先的金融科技企业，在零售、酒店和旅游行业的支付与税务数字化服务领域深耕近四十年。公司业务广泛，覆盖支付处理、免税退税及行业软件等，致力于通过一体化的解决方案提升全球商户的运营效率与顾客体验。为了应对日益增长的数据分析需求并优化成本效益，Planet 数据团队近期主导完成了一项重要的数据仓库升级，将系统从 Snowflake 迁移至开源的 Apache Doris。这...

SelectDB技术团队
发表于2025-11-18 21:19:54
879 0 0

879 0 0

Planet 是一家全球领先的金融科技企业，在零售、酒店和旅游行业的支付与税务数字化服务领域深耕近四十年。公司业务广泛，覆盖支付处理、免税退税及行业软件等，致力于通过一体化的解决方案提升全球商户的运营效率与顾客体验。为了应对日益增长的数据分析需求并优化成本效益，Planet 数据团队近期主导完成了一项重要的数据仓库升级，将系统从 Snowflake 迁移至开源的 Apache Doris。这...
Apache MySQL 云原生数据库
Apache Doris 数据导入原理与性能优化 | Deep Dive
概述对于 Apache Doris 这样的高性能分析型数据库而言，高效、稳定的数据导入是保障实时分析能力的生命线。然而，在海量数据持续写入的场景下，如何平衡导入延迟与吞吐、如何避免性能瓶颈，是开发者面临的核心挑战。Apache Doris 本文将深入剖析 Doris 数据导入的核心原理，涵盖关键流程、组件、事务管理等，探讨影响导入性能的因素，并提供实用的优化方法和最佳实践，有助于用户选择合适...

SelectDB技术团队
发表于2025-11-18 20:46:36
621 0 0

621 0 0

概述对于 Apache Doris 这样的高性能分析型数据库而言，高效、稳定的数据导入是保障实时分析能力的生命线。然而，在海量数据持续写入的场景下，如何平衡导入延迟与吞吐、如何避免性能瓶颈，是开发者面临的核心挑战。Apache Doris 本文将深入剖析 Doris 数据导入的核心原理，涵盖关键流程、组件、事务管理等，探讨影响导入性能的因素，并提供实用的优化方法和最佳实践，有助于用户选择合适...
Apache MySQL
Apache Doris 中的 Data Trait：性能提速 2 倍的秘密武器
在数据库系统的核心层，查询优化器如同一位精明的策略家，不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库，其优化器内置的 Data Trait 分析机制，通过挖掘数据内在的统计特征和语义约束，为查询优化提供了基础设施。让我们一起来探索这个强大的功能！什么是 Data Trait？设想一下，如果你能提前知道数据的 “性格特征”，是不是就能更聪明...

SelectDB技术团队
发表于2025-11-18 20:42:11
691 0 0

691 0 0

在数据库系统的核心层，查询优化器如同一位精明的策略家，不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库，其优化器内置的 Data Trait 分析机制，通过挖掘数据内在的统计特征和语义约束，为查询优化提供了基础设施。让我们一起来探索这个强大的功能！什么是 Data Trait？设想一下，如果你能提前知道数据的 “性格特征”，是不是就能更聪明...
Apache SQL 云原生数据分析
云上数据安全新范式：Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据
一、传统 AK/SK 方式访问 AWS 资源存在的问题密钥管理困境：长期暴露风险：静态 AK/SK 需硬编码于配置文件中，一旦因代码泄露、误提交或恶意窃取导致密钥扩散，攻击者可永久获得等同于密钥所有者的完整权限，引发持续性的数据泄露、资源篡改及资金损失风险；审计盲区：多用户/多服务共享同一组密钥时，云操作日志仅记录密钥身份而无法关联具体使用者，无法追溯真实责任人或业务模块；运维成本高：密...

SelectDB技术团队
发表于2025-11-18 20:17:09
826 0 0

826 0 0

一、传统 AK/SK 方式访问 AWS 资源存在的问题密钥管理困境：长期暴露风险：静态 AK/SK 需硬编码于配置文件中，一旦因代码泄露、误提交或恶意窃取导致密钥扩散，攻击者可永久获得等同于密钥所有者的完整权限，引发持续性的数据泄露、资源篡改及资金损失风险；审计盲区：多用户/多服务共享同一组密钥时，云操作日志仅记录密钥身份而无法关联具体使用者，无法追溯真实责任人或业务模块；运维成本高：密...
Apache 数据库安全服务 DBSS 统一身份认证服务 IAM
宇信科技基于 SelectDB & Apache Doris 构建实时智能的银行经营分析平台
客户背景深耕银行 IT 建设领域 26 的年，宇信科技服务超数百家金融机构，覆盖核心系统、渠道平台、风控中台等关键业务场景。其数据条线团队专注经营分析场景 20 余年，为城商行、农商行提供从报表系统到智能决策的全栈解决方案。随着银行业数字化进程步入深水区，宇信科技面临双重挑战：一方面，市场节奏的加快，让客户对 "分钟级数据响应" 需求迫切，传统数据平台的处理效率与扩展能力已显滞后；另一方面...

SelectDB技术团队
发表于2025-11-18 20:14:03
2268 0 0

2.2k 0 0

客户背景深耕银行 IT 建设领域 26 的年，宇信科技服务超数百家金融机构，覆盖核心系统、渠道平台、风控中台等关键业务场景。其数据条线团队专注经营分析场景 20 余年，为城商行、农商行提供从报表系统到智能决策的全栈解决方案。随着银行业数字化进程步入深水区，宇信科技面临双重挑战：一方面，市场节奏的加快，让客户对 "分钟级数据响应" 需求迫切，传统数据平台的处理效率与扩展能力已显滞后；另一方面...
Apache 数据分析数据挖掘
5000+ 中大型企业首选的 Doris，在稳定性的提升上究竟花了多大的功夫？
稳定性是数据价值实现的根本保障。数据从采集、传输、存储到计算处理的每个环节都需要系统的稳定运行支撑。数据库作为数据生命周期的核心载体，其稳定性的构建一直是业界公认的最大挑战。一款数据库从技术架构落地到获得用户信任，通常需要经历数年的验证周期：既要在千万级并发请求中保持一致性响应，又要在长期运行中抵御内存泄漏等隐性风险，同时还要确保版本迭代时的数据兼容性和完整性。每次故障修复和测试完善都是为稳...

SelectDB技术团队
发表于2025-11-18 19:24:19
603 0 0

603 0 0

稳定性是数据价值实现的根本保障。数据从采集、传输、存储到计算处理的每个环节都需要系统的稳定运行支撑。数据库作为数据生命周期的核心载体，其稳定性的构建一直是业界公认的最大挑战。一款数据库从技术架构落地到获得用户信任，通常需要经历数年的验证周期：既要在千万级并发请求中保持一致性响应，又要在长期运行中抵御内存泄漏等隐性风险，同时还要确保版本迭代时的数据兼容性和完整性。每次故障修复和测试完善都是为稳...
Apache SQL 数据分析数据库
Apache Doris Data Agent 解决方案：开启智能运维与数据治理新纪元
引言：Data Agent 引发的数据变革2025 年，被誉为 Agent 智能体的元年，基于 Agent 引发了企业数据领域前所未有的智能化变革。利用 Dify、Langchain、SpringAI 等框架和平台，基于 Apache Doris MCP Server 为代表的数据仓库 AI 组件打造的新一代 Data Agent，正在重塑数据的价值发现、管理和应用方式。Data Agent...

SelectDB技术团队
发表于2025-11-18 19:19:56
873 0 0

873 0 0

引言：Data Agent 引发的数据变革2025 年，被誉为 Agent 智能体的元年，基于 Agent 引发了企业数据领域前所未有的智能化变革。利用 Dify、Langchain、SpringAI 等框架和平台，基于 Apache Doris MCP Server 为代表的数据仓库 AI 组件打造的新一代 Data Agent，正在重塑数据的价值发现、管理和应用方式。Data Agent...
Apache 分布式数据分析数据库运维
浩瀚深度：从 ClickHouse 到 Doris，支撑单表 13PB、534 万亿行的超大规模数据分析场景
浩瀚深度作为国内互联网流量解析与数据智能化领域的领军企业，深耕行业三十余载，持续为国内互联网提供高性能、高精度、高可靠的整体解决方案。公司业务覆盖网络可视化、AI 智能、数据治理、数据价值挖掘及安全防护，是一家集软硬件产品研发、生产、销售和服务于一体的大型高科技企业。顺水云大数据平台（StreamCloud）作为浩瀚深度自主研发的企业级的大数据平台产品，涵盖了从数据采集、数据存储、数据处理、...

SelectDB技术团队
发表于2025-11-18 19:15:48
2722 0 0

2.7k 0 0

浩瀚深度作为国内互联网流量解析与数据智能化领域的领军企业，深耕行业三十余载，持续为国内互联网提供高性能、高精度、高可靠的整体解决方案。公司业务覆盖网络可视化、AI 智能、数据治理、数据价值挖掘及安全防护，是一家集软硬件产品研发、生产、销售和服务于一体的大型高科技企业。顺水云大数据平台（StreamCloud）作为浩瀚深度自主研发的企业级的大数据平台产品，涵盖了从数据采集、数据存储、数据处理、...
Apache 分布式数据分析数据库数据挖掘
公开免费！Apache Doris & SelectDB 培训与认证课程正式上线
随着 Apache Doris 用户群体日益壮大，许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手，还是希望在特定场景下深度应用的用户，都渴望一套从 0 到 1、全面覆盖的学习路径。正是基于这一需求，飞轮科技正式推出 Apache Doris & SelectDB 培训与认证。这套体系旨在为所有 Doris 用户提供完整的学习课程与实践路径，...

SelectDB技术团队
发表于2025-11-18 19:10:51
645 0 0

645 0 0

随着 Apache Doris 用户群体日益壮大，许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手，还是希望在特定场景下深度应用的用户，都渴望一套从 0 到 1、全面覆盖的学习路径。正是基于这一需求，飞轮科技正式推出 Apache Doris & SelectDB 培训与认证。这套体系旨在为所有 Doris 用户提供完整的学习课程与实践路径，...
Apache

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript