介绍:Iceberg是一个面向海量数据分析场景的开放表格式,也就是一种数据存储格式。它由Netflix开发并于2018年11月进入Apache孵化器,2020年5月从孵化器毕业,成为Apache的顶级项目。Iceberg的设计目标是提供一个可扩展的、高性能的、易于使用的表格管理解决方案,以满足现代分析场景的需求。
在具体操作上,Iceberg位于计算引擎之下,存储之上,通过特定的方式将数据和元数据组织起来。其核心特性包括数据存储和计算引擎插件化,意味着Iceberg不与特定的数据存储或计算引擎绑定,而是可以灵活地适配各种系统环境。此外,Iceberg还支持快速在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。
网址:https://iceberg.apache.org/docs/latest/
网址:https://gujincheng.github.io/2021/08/27/Iceberg%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/
网址:https://inlong.apache.org/zh-CN/docs/data_node/load_node/iceberg/
1、尚硅谷数据湖Iceberg实战教程(尚硅谷&Apache Iceberg官方联合推出)
网址:https://www.bilibili.com/video/BV1uN411K77V/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
以上就是个人觉得不错的学习网站,希望能帮到学习编程的人!