Doris架构包含哪些技术?为什么进行技术整合?

Doris主要整合了Google Mesa(数据模型),Apache Impala(MPP Query Engine)和Apache ORCFile (存储格式,编码和压缩)的技术。

为什么要将这三种技术整合?

Mesa可以满足我们许多存储需求的需求,但是Mesa本身不提供SQL查询引擎。

Impala是一个非常好的MPP SQL查询引擎,但是缺少完美的分布式存储引擎。

自研列式存储:存储层对存储数据的管理通过storage_root_path路径进行配置,路径可以是多个。存储目录下一层按照分桶进行组织,分桶目录下存放具体的tablet,按照tablet_id命名子目录。因此选择了这三种技术的组合。

Doris架构包含哪些技术?为什么进行技术整合?

Doris的系统架构如下,Doris主要分为FE和BE两个组件。

整体架构

Doris的架构很简洁,使用MySQL协议,用户可以使用任何MySQL ODBC/JDBC和MySQL客户端直接访问Doris,只设FE(Frontend)、BE(Backend)两种角色、两个进程,不依赖于外部组件,方便部署和运维。

FE:Frontend,即Doris的前端节点。主要负责接收和返回客户端请求、元数据以及集群管理、查询计划生成等工作。

BE:Backend,即Doris的后端节点。主要负责数据存储与管理、查询计划执行等工作。

FE,BE都可线性扩展FE主要有两个角色,一个是follower,另一个是observer。多个follower组成选举组,会选出一个master,master是follower的一个特例,Master跟follower,主要是用来达到元数据的高可用,保证单节点宕机的情况下,元数据能够实时地在线恢复,而不影响整个服务。

Observer节点仅从leader节点进行元数据同步,不参与选举。可以横向扩展以提供元数据的读服务的扩展性。

数据的可靠性由BE保证,BE会对整个数据存储多副本或者是三副本。副本数可根据需求动态调整。

Doris架构包含哪些技术?为什么进行技术整合?

元数据结构

Doris采用==Paxos协议以及Memory+ Checkpoint + Journal的机制==来确保元数据的高性能及高可靠。元数据的每次更新,都会遵照以下几步:

(1)写入到磁盘的日志文件中

(2)再写到内存中

(3)定期checkpoint到本地磁盘上

相当于是一个纯内存的一个结构,也就是说所有的元数据都会缓存在内存之中,从而保证FE在宕机后能够快速恢复元数据,而且不丢失元数据。

Leader、follower和observer它们三个构成一个可靠的服务,如果发生节点宕机的情况,一般是部署一个leader两个follower,目前来说基本上也是这么部署的。就是说三个节点去达到一个高可用服务。单机的节点故障的时候其实基本上三个就够了,因为FE节点毕竟它只存了一份元数据,它的压力不大,所以如果FE太多的时候它会去消耗机器资源,所以多数情况下三个就足够了,可以达到一个很高可用的元数据服务。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/290541.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
黑马程序员黑马程序员订阅用户
上一篇 2023年6月28日 15:26
下一篇 2023年6月28日 15:26

相关推荐

  • 我来教你显卡的流处理单元有什么用。

    显卡的流处理单元(Streaming Processor,简称SP)是图形处理器(GPU)中的一个重要组件,它负责执行各种并行计算任务,包括图形渲染、视频编码和解码、以及各种通用计算任务,流处理单元的设计和数量直接影响了显…

    2024年6月14日
    00
  • 经验分享国外云主机租用。

    美国云主机租用如何提高生产力 随着互联网技术的不断发展,越来越多的企业和个人开始使用云主机作为其网站、应用和数据存储的解决方案,美国云主机因其稳定性、速度和高性价比而受到广泛关注,如何通过租用美国云主…

    2024年7月5日
    00
  • Doris架构中包含哪些技术?

    Doris主要整合了Google Mesa(数据模型),Apache Impala(MPP Query Engine)和Apache ORCFile (存储格式,编码和压缩)的技术。为什么要将这三种技术整合?Mesa可以满足我们许多存储需求的需求,但是Mesa本身不提供SQL…

    2023年8月30日
    02
  • 今日分享i5处理器 六代性能最好的是哪款。

    Intel Core i5 处理器是许多家用和商用电脑的核心,其中第六代(代号为Skylake)标志着一个重要的性能和技术飞跃,这一代的i5处理器在性能上实现了显著提升,同时也带来了更好的能效比和集成图形性能。 核心架构改…

    2024年6月11日
    00
  • 我来教你国内vps选择哪个比较不错的。

    国内的VPS有很多选择,其中一些比较受欢迎的包括阿里云、腾讯云和华为云。这些公司都是国内领先的云计算服务提供商,提供了稳定、可靠的VPS服务。如果您的网站主要面向国内用户,那么优先考虑国内VPS,因为它们价格…

    2024年7月13日
    00
  • TiDB中有哪些组件?【TiDB架构图解】

    TiDB 集群主要包括三个核心组件:TiDB Server,PD Server 和 TiKV Server。此外,还有用于解决用户复杂 OLAP 需求的 TiSpark 组件和简化云上部署管理的 TiDB Operator 组件。TiDB架构图解  1. TiDB Server  TiD…

    2023年5月6日
    07
  • PHP中的微服务架构。

    随着互联网的发展和技术的进步,传统的架构模式面临着更多的挑战和需求。其中,微服务架构作为一种新的设计思路,在现代化互联网架构中占据了越来越重要的地位。微服务架构是一种以轻量级、模块化单元为基础的服务…

    2023年5月30日
    04
  • 小编分享seo合理的网站架构应该是怎样。

    大家都网站seo优化,无非就是想把排名优化到更前面的位置去,所以这也让很多企业想尽了办法,所以,我们需要做的就是不光是优化排名,更多的是把网站内部结构调整好,那么该如何调整呢?一、合理的网站架构网站架构是S…

    2023年6月29日
    00

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息