介绍:Kudu是由Cloudera开源的列式存储引擎,专为处理大数据而设计。它是为了解决Hadoop生态系统中的一些挑战而被引入的,如流式实时计算结果的更新和时间序列相关应用等需求。
Kudu具有几个显著的特点:首先,它是用C++语言开发的,其API支持Java和C++,能高效地处理类似于OLAP的负载。其次,Kudu可以与MapReduce、Spark以及Hadoop生态系统中的其他组件进行友好集成。此外,它可以与Cloudera Impala集成,替代目前Impala常用的HDFS+Parquet组合,提供更为高效的查询性能。
Kudu还具有灵活的一致性模型,能在顺序写和随机写并存的场景下保持良好的性能。通过使用Raft协议,Kudu确保了数据的高可靠性存储。此外,Kudu作为底层存储,不仅支持高并发低延迟的kv查询,还保持良好的Scan性能,这使得它理论上能够同时兼顾OLTP类和OLAP类查询。
总的来说,Kudu是一个高效、可靠的列式存储引擎,适用于处理大数据的应用,如实时数据分析和历史数据查询等。
网址:https://kudu.apache.org/docs/quickstart.html
网址:https://www.bookstack.cn/read/kudu-1.4/docs-2.md
网址:https://geekdaxue.co/read/kudu-doc-zh/docs-11.md
1、大数据NoSQL数据库Kudu丨构建高性能随机读写访问的数据存储系统
网址:https://www.bilibili.com/video/BV1kv411y7yL/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
以上就是个人觉得不错的学习网站,希望能帮到学习大数据的人!