Doris 是由百度自研并开源的 OLAP 数据库,以易用的特点被业内熟知。Doris 支持标准的 SQL 并且完全兼容 MySQL 协议,仅需亚秒级响应时间即可返回海量数据下的查询结果。
Doris 是一款基于 MPP 技术的分析型数据库,能够在海量数据场景下提供毫秒级查询服务。Doris 脱胎于 Apache Impala 和 Google Mesa 系统,并进行了大量改造和优化,最终形成了今天大家看到的架构简洁、性能卓越、功能丰富、简单易用的 OLAP 数据库。
核心优势
相较于大家熟悉的ClickHouse,Doris有以下几方面优势:
Doris依赖FE节点管理元数据,可用性高,不依赖外部组件;ClickHouse依赖ZooKeeper管理元数据,容易出现数据不同步的情况。
Doris按照“Bucket+副本”来分布数据,灵活度更高;ClickHouse只支持全节点分布数据或者每个节点分布一份数据,灵活度不高。
在多表关联上,ClickHouse仅完整支持Broadcast Join、Colocate Join,并未实现完整意义上的Shuffle Join;Doris支持Shuffle Join和Bucket Shuffle Join,可以满足更多的Join场景需求。
ClickHouse的函数、字段类型、字段名严格区分大小写,为开发增加了难度;Doris语法完全兼容MySQL,对大小写不敏感,开发简单。
ClickHouse集群分布式表的创建和删除都需要分别操作本地表和分布式表引擎,比较麻烦;Doris默认创建分布式表,建表过程和MySQL的建表过程一致,只是建表语句多一些分布式参数。
ClickHouse物理表中数据的删除和更新是异步执行的,命令执行完以后数据的清理时间不确定,对开发人员非常不友好;Doris支持按照Key字段删除和更新数据,执行完SQL命令后数据即时更新。
目前,Apache Doris已经进入开源的第六年,并于2022年6月成功从Apache孵化器“毕业”,成为Apache顶级项目。据公开资料显示,Apache Doris在美团、小米、京东、百度、网易、字节跳动、快手、腾讯、华为、新浪、知乎、360等大型互联网企业有深入的应用和稳定的生产运行,全球范围内的企业用户规模已超过1000家。
同时,飞轮数据科技(SelectDB)提供了基于开源Doris的云原生实时数据仓库SelectDB Cloud,百度智能云、腾讯云、阿里云、火山引擎等知名云厂商也提供了基于开源Doris的云上托管服务。无论私有化部署,还是云化服务,Apache Doris吸引了越来越多的用户和开发者的关注。
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net
本文首发于公众号:Hunter后端 原文链接:es笔记六之聚合操作之指标聚合 聚合操作,在 es 中的聚合可以分为大概四种聚合: bucketing(桶聚合) mertic(指标聚合) matrix(矩阵聚合) pipeline(管道聚合) bucket 类似…