从零开始学大数据框架Hudi,这些学习网站,助你一臂之力!

发布时间:2023年12月26日

介绍:Apache Hudi是一个开源的流数据湖平台,由Uber开发并现在已经成为Apache的顶级项目。Hudi的设计使得您可以在Hadoop兼容的存储之上存储大量数据,并且它提供了两种原语,除了经典的批处理之外,还可以在数据湖上进行流处理。
Hudi将核心仓库和数据库功能直接带到数据湖中,包括表、事务、高效的upserts/删除、高级索引、流式摄取服务、数据群集/压缩优化以及并发,同时保持数据以开源文件格式保留。具体来说,Hudi的一个重要特性是Timeline,可以理解为Hudi表的一个时间线,记录了Hudi表在不同时刻的信息和行为。这个Timeline由TimelineServer来管理,通常存在于Hdfs、RDBMS等持久化存储介质中。通过Timeline可以方便地做版本管理以及实现增量处理等和版本/时间相关的功能。

1、hudi官网

网址:https://hudi.apache.org/

1.1 介绍

在这里插入图片描述
在这里插入图片描述

1.2 学习文档

在这里插入图片描述

1.3 用户群体

在这里插入图片描述

2、https://dongkelun.com/tags/Hudi/

网址:https://dongkelun.com/tags/Hudi/

2.1 知识点介绍

在这里插入图片描述
在这里插入图片描述

3、视频学习推荐

1、大数据新风口:Hudi数据湖(尚硅谷&Apache Hudi联合出品)
网址:https://www.bilibili.com/video/BV1ue4y1i7na/?vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
在这里插入图片描述
2、黑马程序员大数据数据湖架构Hudi视频教程,从Apache Hudi基础到项目实战(涵盖HDFS+Spark+Flink+Hive等知识点
网址:https://www.bilibili.com/video/BV1sb4y1n7hK/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b

在这里插入图片描述

4、hudiz中文网站

网址:https://hudi.apache.org/cn/docs/next/overview/
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
以上就是个人觉得不错的学习网站,希望能帮到学习大数据的人!

文章来源:https://blog.csdn.net/qq_45746668/article/details/135228958
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。